2025-11-21T02:31:16.003696

Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms

Loi, Di Bello, Cangiotti
The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.
academic

Beweis ohne Ungerechtigkeit: Ein neuer kontrafaktischer Test für faire Algorithmen

Grundinformationen

  • Paper-ID: 2510.12822
  • Titel: Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
  • Autoren: Michele Loi, Marcello Di Bello, Nicolò Cangiotti
  • Klassifizierung: cs.CY (Informatik und Gesellschaft), cs.AI (Künstliche Intelligenz), cs.LG (Maschinelles Lernen)
  • Veröffentlichungsdatum: 10. Oktober 2025
  • Paper-Link: https://arxiv.org/abs/2510.12822

Zusammenfassung

Das Papier untersucht eine vernachlässigte wichtige Dimension der Algorithmusgerechtigkeit: ob der Beweiswert der Algorithmusausgabe selbst von struktureller Ungerechtigkeit abhängt. Die Autoren schlagen durch den Vergleich zweier Polizeialgorithmen – eines auf historischen Kriminaldaten basierenden Predictive-Policing-Algorithmus und eines Systems, das Kameraaufnahmen von laufenden Verbrechen analysiert – einen neuen moralischen Bewertungsmaßstab vor. Dieser Maßstab verlangt, dass wir nicht nur berücksichtigen, ob Beweise in der realen Welt beweiskräftig sind, sondern auch, ob sie in nahegelegenen möglichen Welten ohne relevante Ungerechtigkeit noch beweiskräftig bleiben. Der Predictive-Policing-Algorithmus besteht diesen Test nicht, während das kameragestützte System ihn besteht.

Forschungshintergrund und Motivation

Kernproblem

Die bestehende Forschung zur Algorithmusgerechtigkeit konzentriert sich hauptsächlich auf statistische Standards (wie Chancengleichheit, Kalibrierung), kausale und kontrafaktische Methoden sowie die Rolle struktureller und zusammengesetzter Ungerechtigkeit, übersieht aber eine kritische Dimension: ob der Beweiswert der Algorithmusausgabe selbst von struktureller Ungerechtigkeit abhängt.

Bedeutung des Problems

  1. Divergierende moralische Intuitionen: Obwohl beide Polizeialgorithmen zu unverhältnismäßigen Auswirkungen auf Minderheitengemeinschaften führen, haben Menschen unterschiedliche moralische Urteile über ihre Akzeptabilität
  2. Theoretische Lücke: Bestehende Gerechtigkeitstheorien können nicht erklären, warum kameragestützte Algorithmen moralisch akzeptabler sind als Predictive-Policing-Algorithmen
  3. Praktische Anforderungen: Es ist ein differenzierteres Rahmenwerk erforderlich, um die Anwendung von Algorithmen in sensiblen Bereichen wie Strafjustiz und Gesundheitswesen zu leiten

Einschränkungen bestehender Methoden

  1. Statistische Standards: Können die moralischen Unterschiede zwischen den beiden Algorithmen nicht erfassen, da beide unterschiedliche Fehlerquoten über Rassengruppen hinweg erzeugen
  2. Kausale Methoden: Behandeln Rasse als manipulierbare diskrete Variable und ignorieren die Einbettung von Rasse in komplexe strukturelle Phänomene
  3. Theorie zusammengesetzter Ungerechtigkeit: Gilt gleichermaßen für beide Algorithmen und kann ihre moralischen Unterschiede nicht unterscheiden

Kernbeiträge

  1. Einführung des Kontrafaktischen Unabhängigkeitsprinzips (CIP): Ein neuer moralischer Bewertungsrahmen zur Beurteilung der Akzeptabilität von beweisgestützten Algorithmen
  2. Etablierung der CIP-Testmethode: Systematische Schritte zur Bewertung, ob Beweise in einer Welt ohne strukturelle Ungerechtigkeit noch beweiskräftig sind
  3. Bereitstellung bereichsübergreifender Anwendungsleitlinien: Anwendung des Prinzips auf Strafjustiz und Gesundheitswesen, um dessen Praktikabilität zu demonstrieren
  4. Unterscheidung zwischen punitiven und unterstützenden Anwendungen: Differenzierte moralische Leitlinien für verschiedene Arten von Algorithmusanwendungen

Methodische Details

Definition des Kontrafaktischen Unabhängigkeitsprinzips (CIP)

Das CIP umfasst zwei Kernkomponenten:

CIP-Test

Für Beweise E über ein Ergebnis O (wie einen Verbrechensort) wird überprüft, ob E seinen Beweiswert für O in nahegelegenen möglichen Welten behält, in denen die relevante strukturelle Ungerechtigkeit nicht existiert. Wenn ja, besteht E den Test; andernfalls nicht.

Leitlinien für nachgelagerte Verwendung

Ob E den CIP-Test besteht, ist eine moralisch relevante Überlegung zur Bestimmung seiner akzeptablen nachgelagerten Verwendung. Für die punitive Verwendung von Beweisen (wie das Entsenden von Polizei oder die Einschränkung persönlicher Freiheit) sollte bei Beweisen, die den CIP-Test nicht bestehen, größere Vorsicht walten als bei bestandenen Tests.

Konkrete Schritte des CIP-Tests

  1. Mechanismuserkennung: Bestimmung des Mechanismus, der E mit O verbindet
  2. Ungerechtigkeit bewerten: Bestimmung, ob dieser Mechanismus Teil einer strukturellen Ungerechtigkeit ist
  3. Kontrafaktische Welt bewerten: Falls ja, Bewertung der nahegelegenen kontrafaktischen Welt ohne den Ungerechtigkeitsmechanismus und Frage, ob die Beweisverbindung bestehen bleibt
  4. Schlussfolgerung ziehen: Falls ja, besteht E den CIP-Test; andernfalls nicht

Beispiel einer Kausalkettenanalyse

Kausalkette des Predictive Policing:

Minderheitengemeinschaften → Redlining-Politik → Rassentrennung → 
Unterinvestition in Gemeinschaften → Unterfinanzierung von Schulen → 
Begrenzte Beschäftigungsmöglichkeiten → Konzentrierte Armut → Mehr Verbrechen

Kausalkette von Kamerabeweis:

Verbrechen in Minderheitengemeinschaften → Kamera erfasst Verbrecher → 
Verbrechensortinformation

Unterschiede zu bestehenden Methoden

Das CIP vermeidet Probleme traditioneller kausaler Methoden:

  • Keine Manipulation von Rassenvariablen erforderlich: Stattdessen wird gefragt, ob die Beweisbeziehung ohne Ungerechtigkeitsmechanismen bestehen bleibt
  • Fokus auf erkenntnistheoretische Relevanz von Beweisen: Nicht auf Empfindlichkeit der Algorithmusausgabe gegenüber Rassenveränderungen
  • Anerkennung der strukturellen Einbettung von Rasse: Rasse wird nicht als unabhängig manipulierbare Variable behandelt

Experimentelle Einrichtung und Anwendungsfälle

Anwendung im Bereich Strafjustiz

Traditionelle Beweisbewertung

  • DNA-Proben, Fingerabdrücke, Videoaufnahmen: Bestehen den CIP-Test, da ihr Beweiswert auf kausalen Verbindungen zu Verbrechen basiert und nicht von ungerechten sozialen Bedingungen abhängt
  • Charakterbeweise und Strafregister: Könnten den Test nicht bestehen, wenn ihr Vorhersagewert von der durch strukturelle Ungerechtigkeit verursachten Verbrechensumgebung abhängt

Bewertung von Algorithmus-Tools

  • DNA-Matching, Videoauthentifizierungsalgorithmen: Bestehen den CIP-Test
  • PredPol, HunchLab und andere Predictive-Policing-Systeme: Bestehen den Test nicht, da sie von Verbrechensraumkonzentrationen abhängen, die durch strukturelle Ungerechtigkeit verursacht werden
  • Vorhersage-Tools basierend auf unmittelbarer wiederholter Viktimisierung: Könnten den Test bestehen

Anwendung im Gesundheitswesen

Analyse von drei Szenarien

  1. Genetisches-Faktoren-Szenario:
    • Patient hat aufgrund genetischer Variation reduzierte Arzneimittelstoffwechselfähigkeit
    • CIP-Ergebnis: Besteht den Test, genetische Variation bleibt in einer gerechten Welt relevant
  2. Komorbiditäts-Szenario:
    • Typ-2-Diabetes und andere Komorbiditäten reduzieren Arzneimittelwirksamkeit, aber ihre Prävalenz wird durch strukturelle Ungerechtigkeit beeinflusst
    • CIP-Ergebnis: Besteht den Test, biologische Beziehung bleibt in einer gerechten Welt bestehen
  3. Soziale-Variablen-Szenario:
    • Algorithmus basiert auf sozialen Variablen wie niedrigem Einkommen und Wohnungsinstabilität zur Vorhersage von Behandlungsergebnissen
    • CIP-Ergebnis: Besteht den Test nicht, in einer gerechteren Welt würden diese Variablen Behandlungsergebnisse nicht mehr vorhersagen

Experimentelle Ergebnisse und Erkenntnisse

Haupterkenntnisse

  1. Erklärung moralischer Unterschiede: Das CIP erklärt erfolgreich, warum kameragestützte Algorithmen moralisch akzeptabler sind als Predictive-Policing-Algorithmen
  2. Bereichsübergreifende Anwendbarkeit: Das Prinzip zeigt praktischen Wert in Strafjustiz und Gesundheitswesen
  3. Unterscheidung von Anwendungstypen: Punitive vs. unterstützende Anwendungen erfordern unterschiedliche moralische Überlegungen

Umkehreffekt bei punitiven vs. unterstützenden Anwendungen

  • Punitive Anwendungen: Beweise, die den CIP-Test nicht bestehen, sollten vorsichtig verwendet werden
  • Unterstützende Anwendungen: Beweise, die den CIP-Test nicht bestehen, bieten zusätzliche Gründe für ihre Verwendung bei Abhilfemaßnahmen

Konkrete Fallanalysen

Diabetes-Präventionsprojekt

  • Historische Daten zeigen höheres Diabetesrisiko in bestimmten Minderheitengemeinschaften
  • Obwohl Beweise den CIP-Test nicht bestehen, verstärkt dies die Begründung für ihre Verwendung zur Anleitung präventiver Pflege

Gemeinschaftspolizei

  • Historische Kriminaldaten können für unterstützende Interventionen verwendet werden: verbesserte Straßenbeleuchtung, Gemeinschaftsvermittlungsprogramme
  • Nicht nur für punitive Maßnahmen: erhöhte Patrouillen, erweiterte Stop-and-Frisk-Praktiken

Verwandte Arbeiten

Forschungskontext zur Algorithmusgerechtigkeit

  1. Statistische Gerechtigkeitsstandards: Chancengleichheit, Kalibrierung usw.
  2. Kausale Gerechtigkeit: Pfadspezifische kontrafaktische Gerechtigkeit von Chiappa & Gillam
  3. Kontrafaktische Gerechtigkeit: Individuelle kontrafaktische Methoden von Kusner et al.
  4. Strukturelle Ungerechtigkeit: Theorie zusammengesetzter Ungerechtigkeit von Hellman
  5. Prädiktive Gerechtigkeit: Vorhersage-Parität-Prinzip von Lazar & Stone

Einzigartige Beiträge dieses Papiers

  • Epistemische Wende: Von Fokus auf Algorithmusausgabe zu moralischem Status von Beweisen selbst
  • Analyse auf Mechanismusebene: Tiefgehende Analyse kausaler Mechanismen, die Beweise beweiskräftig machen
  • Anwendungsorientierte Unterscheidung: Differenzierte Leitlinien für verschiedene Anwendungstypen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. CIP bietet neue moralische Bewertungsdimension: Ergänzt bestehende Theorien der Algorithmusgerechtigkeit
  2. Moralischer Status von Beweisen ist wichtig: Nicht nur statistische Leistung von Algorithmen, sondern auch moralische Akzeptabilität ihrer Beweisgrundlage berücksichtigen
  3. Anwendungstyp bestimmt moralische Anforderungen: Punitive und unterstützende Anwendungen erfordern unterschiedliche moralische Standards

Einschränkungen

  1. Erkenntnistheoretische Herausforderungen kontrafaktischen Denkens: Bewertung von Welten ohne strukturelle Ungerechtigkeit erfordert robuste Kausaltheorie
  2. Schwierigkeit der Identifikation komplexer Kausalmechanismen: In der Praxis kann es schwierig sein, alle relevanten Kausalmechanismen genau zu identifizieren
  3. Unklarheit von Anwendungsgrenzen: Die Grenze zwischen punitiven und unterstützenden Anwendungen kann in einigen Fällen verschwommen sein

Zukünftige Forschungsrichtungen

  1. Operationalisierung des CIP: Entwicklung konkreter Werkzeuge und Richtlinien zur Anwendung des CIP-Tests
  2. Bereichsübergreifende Erweiterung: Anwendung des Prinzips auf andere sensible Bereiche wie Bildung und Beschäftigung
  3. Integration mit bestehenden Gerechtigkeitsstandards: Erforschung von Koordinationsmechanismen zwischen CIP und statistischen Gerechtigkeitsstandards

Tiefgreifende Bewertung

Stärken

  1. Starke konzeptionelle Innovation: Eröffnet neue Dimension der Algorithmusgerechtigkeit und füllt wichtige theoretische Lücke
  2. Solide philosophische Grundlagen: Bringt Erkenntnisse aus Beweistheorie und Moralphilosophie in Algorithmusgerechtigkeit ein
  3. Hoher praktischer Wert: Bietet konkreten moralischen Orientierungsrahmen für tatsächliche Algorithmusbereitstellung
  4. Rigorose Argumentation: Detaillierte Fallanalysen und Vergleichsargumente unterstützen Kernthesen
  5. Interdisziplinäre Integration: Erfolgreich integriert Perspektiven aus Informatik, Philosophie, Rechtswissenschaft und öffentlicher Politik

Mängel

  1. Operationalisierungsherausforderungen: CIP-Test kann in komplexen realen Szenarien praktische Schwierigkeiten haben
  2. Abhängigkeit von Werturteilen: Was "strukturelle Ungerechtigkeit" konstituiert, beinhaltet selbst Werturteile und könnte umstritten sein
  3. Rechnerische Komplexität: Bewertung kontrafaktischer Szenarien in komplexen Kausalnetzen könnte rechnerisch herausfordernd sein
  4. Kulturelle Relativität: Verständnis von Gerechtigkeit kann in verschiedenen gesellschaftlichen und kulturellen Kontexten unterschiedlich sein

Bewertung der Auswirkungen

  1. Akademischer Beitrag: Eröffnet neue theoretische Richtung für Algorithmusgerechtigkeit
  2. Politischer Wert: Bietet wichtige Referenz für Regierungen und Organisationen bei Formulierung von Algorithmusrichtlinien
  3. Praktische Orientierung: Bietet Algorithmusentwicklern und Implementierern ethischen Entscheidungsrahmen
  4. Bereichsübergreifende Auswirkungen: Könnte Forschung in Rechtswissenschaft, öffentlicher Politik, Ethik und anderen Bereichen beeinflussen

Anwendungsszenarien

  1. Hochrisiko-Algorithmusanwendungen: Besonders geeignet für sensible Bereiche wie Strafjustiz, Medizin, Bildung
  2. Politikgestaltung: Bietet theoretische Unterstützung für Regierungspolitik zur Algorithmuskontrolle
  3. Algorithmus-Audit: Bietet Bewertungsrahmen für Drittanbieter-Algorithmus-Audits
  4. Entscheidungen von Ethikkommissionen: Bietet Werkzeuge für institutionelle Ethikkommissionen zur Bewertung von Algorithmus-Projekten

Literaturverzeichnis

Das Papier zitiert wichtige Literatur aus mehreren Bereichen der Algorithmusgerechtigkeit, strukturellen Ungerechtigkeit und Beweistheorie, einschließlich:

  • Algorithmusgerechtigkeit: Kontrafaktische Gerechtigkeit von Kusner et al. (2017), pfadspezifische Gerechtigkeit von Chiappa & Gillam (2018)
  • Strukturelle Ungerechtigkeit: Theorie struktureller Ungerechtigkeit von Young (2011), zusammengesetzte Ungerechtigkeit von Hellman (2023)
  • Empirische Forschung: Umfangreiche empirische Forschung zu Auswirkungen von Redlining-Politik, Rassentrennung auf Kriminalität und Gesundheit
  • Rechtstheorie: Relevante Literatur zur Verwendung statistischer Beweise in Rechtsverfahren

Dieses Papier leistet einen wichtigen theoretischen Beitrag zur Algorithmusgerechtigkeit. Das vorgeschlagene Kontrafaktische Unabhängigkeitsprinzip bietet nicht nur tiefe philosophische Einsichten, sondern auch erheblichen praktischen Wert. Obwohl es bei der Operationalisierung noch Herausforderungen gibt, weist es wichtige Richtungen für die zukünftige Entwicklung dieses Forschungsbereichs auf.