2025-11-21T02:31:16.003696

Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms

Loi, Di Bello, Cangiotti

The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.

academic

Beweis ohne Ungerechtigkeit: Ein neuer kontrafaktischer Test für faire Algorithmen

Grundinformationen

Paper-ID: 2510.12822
Titel: Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
Autoren: Michele Loi, Marcello Di Bello, Nicolò Cangiotti
Klassifizierung: cs.CY (Informatik und Gesellschaft), cs.AI (Künstliche Intelligenz), cs.LG (Maschinelles Lernen)
Veröffentlichungsdatum: 10. Oktober 2025
Paper-Link: https://arxiv.org/abs/2510.12822

Zusammenfassung

Das Papier untersucht eine vernachlässigte wichtige Dimension der Algorithmusgerechtigkeit: ob der Beweiswert der Algorithmusausgabe selbst von struktureller Ungerechtigkeit abhängt. Die Autoren schlagen durch den Vergleich zweier Polizeialgorithmen – eines auf historischen Kriminaldaten basierenden Predictive-Policing-Algorithmus und eines Systems, das Kameraaufnahmen von laufenden Verbrechen analysiert – einen neuen moralischen Bewertungsmaßstab vor. Dieser Maßstab verlangt, dass wir nicht nur berücksichtigen, ob Beweise in der realen Welt beweiskräftig sind, sondern auch, ob sie in nahegelegenen möglichen Welten ohne relevante Ungerechtigkeit noch beweiskräftig bleiben. Der Predictive-Policing-Algorithmus besteht diesen Test nicht, während das kameragestützte System ihn besteht.

Forschungshintergrund und Motivation

Kernproblem

Die bestehende Forschung zur Algorithmusgerechtigkeit konzentriert sich hauptsächlich auf statistische Standards (wie Chancengleichheit, Kalibrierung), kausale und kontrafaktische Methoden sowie die Rolle struktureller und zusammengesetzter Ungerechtigkeit, übersieht aber eine kritische Dimension: ob der Beweiswert der Algorithmusausgabe selbst von struktureller Ungerechtigkeit abhängt.

Bedeutung des Problems

Divergierende moralische Intuitionen: Obwohl beide Polizeialgorithmen zu unverhältnismäßigen Auswirkungen auf Minderheitengemeinschaften führen, haben Menschen unterschiedliche moralische Urteile über ihre Akzeptabilität
Theoretische Lücke: Bestehende Gerechtigkeitstheorien können nicht erklären, warum kameragestützte Algorithmen moralisch akzeptabler sind als Predictive-Policing-Algorithmen
Praktische Anforderungen: Es ist ein differenzierteres Rahmenwerk erforderlich, um die Anwendung von Algorithmen in sensiblen Bereichen wie Strafjustiz und Gesundheitswesen zu leiten

Einschränkungen bestehender Methoden

Statistische Standards: Können die moralischen Unterschiede zwischen den beiden Algorithmen nicht erfassen, da beide unterschiedliche Fehlerquoten über Rassengruppen hinweg erzeugen
Kausale Methoden: Behandeln Rasse als manipulierbare diskrete Variable und ignorieren die Einbettung von Rasse in komplexe strukturelle Phänomene
Theorie zusammengesetzter Ungerechtigkeit: Gilt gleichermaßen für beide Algorithmen und kann ihre moralischen Unterschiede nicht unterscheiden

Kernbeiträge

Einführung des Kontrafaktischen Unabhängigkeitsprinzips (CIP): Ein neuer moralischer Bewertungsrahmen zur Beurteilung der Akzeptabilität von beweisgestützten Algorithmen
Etablierung der CIP-Testmethode: Systematische Schritte zur Bewertung, ob Beweise in einer Welt ohne strukturelle Ungerechtigkeit noch beweiskräftig sind
Bereitstellung bereichsübergreifender Anwendungsleitlinien: Anwendung des Prinzips auf Strafjustiz und Gesundheitswesen, um dessen Praktikabilität zu demonstrieren
Unterscheidung zwischen punitiven und unterstützenden Anwendungen: Differenzierte moralische Leitlinien für verschiedene Arten von Algorithmusanwendungen

Methodische Details

Definition des Kontrafaktischen Unabhängigkeitsprinzips (CIP)

Das CIP umfasst zwei Kernkomponenten:

CIP-Test

Für Beweise E über ein Ergebnis O (wie einen Verbrechensort) wird überprüft, ob E seinen Beweiswert für O in nahegelegenen möglichen Welten behält, in denen die relevante strukturelle Ungerechtigkeit nicht existiert. Wenn ja, besteht E den Test; andernfalls nicht.

Leitlinien für nachgelagerte Verwendung

Ob E den CIP-Test besteht, ist eine moralisch relevante Überlegung zur Bestimmung seiner akzeptablen nachgelagerten Verwendung. Für die punitive Verwendung von Beweisen (wie das Entsenden von Polizei oder die Einschränkung persönlicher Freiheit) sollte bei Beweisen, die den CIP-Test nicht bestehen, größere Vorsicht walten als bei bestandenen Tests.

Konkrete Schritte des CIP-Tests

Mechanismuserkennung: Bestimmung des Mechanismus, der E mit O verbindet
Ungerechtigkeit bewerten: Bestimmung, ob dieser Mechanismus Teil einer strukturellen Ungerechtigkeit ist
Kontrafaktische Welt bewerten: Falls ja, Bewertung der nahegelegenen kontrafaktischen Welt ohne den Ungerechtigkeitsmechanismus und Frage, ob die Beweisverbindung bestehen bleibt
Schlussfolgerung ziehen: Falls ja, besteht E den CIP-Test; andernfalls nicht

Beispiel einer Kausalkettenanalyse

Kausalkette des Predictive Policing:

Minderheitengemeinschaften → Redlining-Politik → Rassentrennung → 
Unterinvestition in Gemeinschaften → Unterfinanzierung von Schulen → 
Begrenzte Beschäftigungsmöglichkeiten → Konzentrierte Armut → Mehr Verbrechen

Kausalkette von Kamerabeweis:

Verbrechen in Minderheitengemeinschaften → Kamera erfasst Verbrecher → 
Verbrechensortinformation

Unterschiede zu bestehenden Methoden

Das CIP vermeidet Probleme traditioneller kausaler Methoden:

Keine Manipulation von Rassenvariablen erforderlich: Stattdessen wird gefragt, ob die Beweisbeziehung ohne Ungerechtigkeitsmechanismen bestehen bleibt
Fokus auf erkenntnistheoretische Relevanz von Beweisen: Nicht auf Empfindlichkeit der Algorithmusausgabe gegenüber Rassenveränderungen
Anerkennung der strukturellen Einbettung von Rasse: Rasse wird nicht als unabhängig manipulierbare Variable behandelt

Experimentelle Einrichtung und Anwendungsfälle

Anwendung im Bereich Strafjustiz

Traditionelle Beweisbewertung

DNA-Proben, Fingerabdrücke, Videoaufnahmen: Bestehen den CIP-Test, da ihr Beweiswert auf kausalen Verbindungen zu Verbrechen basiert und nicht von ungerechten sozialen Bedingungen abhängt
Charakterbeweise und Strafregister: Könnten den Test nicht bestehen, wenn ihr Vorhersagewert von der durch strukturelle Ungerechtigkeit verursachten Verbrechensumgebung abhängt

Bewertung von Algorithmus-Tools

DNA-Matching, Videoauthentifizierungsalgorithmen: Bestehen den CIP-Test
PredPol, HunchLab und andere Predictive-Policing-Systeme: Bestehen den Test nicht, da sie von Verbrechensraumkonzentrationen abhängen, die durch strukturelle Ungerechtigkeit verursacht werden
Vorhersage-Tools basierend auf unmittelbarer wiederholter Viktimisierung: Könnten den Test bestehen

Anwendung im Gesundheitswesen

Analyse von drei Szenarien

Genetisches-Faktoren-Szenario:
- Patient hat aufgrund genetischer Variation reduzierte Arzneimittelstoffwechselfähigkeit
- CIP-Ergebnis: Besteht den Test, genetische Variation bleibt in einer gerechten Welt relevant
Komorbiditäts-Szenario:
- Typ-2-Diabetes und andere Komorbiditäten reduzieren Arzneimittelwirksamkeit, aber ihre Prävalenz wird durch strukturelle Ungerechtigkeit beeinflusst
- CIP-Ergebnis: Besteht den Test, biologische Beziehung bleibt in einer gerechten Welt bestehen
Soziale-Variablen-Szenario:
- Algorithmus basiert auf sozialen Variablen wie niedrigem Einkommen und Wohnungsinstabilität zur Vorhersage von Behandlungsergebnissen
- CIP-Ergebnis: Besteht den Test nicht, in einer gerechteren Welt würden diese Variablen Behandlungsergebnisse nicht mehr vorhersagen

Experimentelle Ergebnisse und Erkenntnisse

Haupterkenntnisse

Erklärung moralischer Unterschiede: Das CIP erklärt erfolgreich, warum kameragestützte Algorithmen moralisch akzeptabler sind als Predictive-Policing-Algorithmen
Bereichsübergreifende Anwendbarkeit: Das Prinzip zeigt praktischen Wert in Strafjustiz und Gesundheitswesen
Unterscheidung von Anwendungstypen: Punitive vs. unterstützende Anwendungen erfordern unterschiedliche moralische Überlegungen

Umkehreffekt bei punitiven vs. unterstützenden Anwendungen

Punitive Anwendungen: Beweise, die den CIP-Test nicht bestehen, sollten vorsichtig verwendet werden
Unterstützende Anwendungen: Beweise, die den CIP-Test nicht bestehen, bieten zusätzliche Gründe für ihre Verwendung bei Abhilfemaßnahmen

Konkrete Fallanalysen

Diabetes-Präventionsprojekt

Historische Daten zeigen höheres Diabetesrisiko in bestimmten Minderheitengemeinschaften
Obwohl Beweise den CIP-Test nicht bestehen, verstärkt dies die Begründung für ihre Verwendung zur Anleitung präventiver Pflege

Gemeinschaftspolizei

Historische Kriminaldaten können für unterstützende Interventionen verwendet werden: verbesserte Straßenbeleuchtung, Gemeinschaftsvermittlungsprogramme
Nicht nur für punitive Maßnahmen: erhöhte Patrouillen, erweiterte Stop-and-Frisk-Praktiken

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

CIP bietet neue moralische Bewertungsdimension: Ergänzt bestehende Theorien der Algorithmusgerechtigkeit
Moralischer Status von Beweisen ist wichtig: Nicht nur statistische Leistung von Algorithmen, sondern auch moralische Akzeptabilität ihrer Beweisgrundlage berücksichtigen
Anwendungstyp bestimmt moralische Anforderungen: Punitive und unterstützende Anwendungen erfordern unterschiedliche moralische Standards

Einschränkungen

Erkenntnistheoretische Herausforderungen kontrafaktischen Denkens: Bewertung von Welten ohne strukturelle Ungerechtigkeit erfordert robuste Kausaltheorie
Schwierigkeit der Identifikation komplexer Kausalmechanismen: In der Praxis kann es schwierig sein, alle relevanten Kausalmechanismen genau zu identifizieren
Unklarheit von Anwendungsgrenzen: Die Grenze zwischen punitiven und unterstützenden Anwendungen kann in einigen Fällen verschwommen sein

Zukünftige Forschungsrichtungen

Operationalisierung des CIP: Entwicklung konkreter Werkzeuge und Richtlinien zur Anwendung des CIP-Tests
Bereichsübergreifende Erweiterung: Anwendung des Prinzips auf andere sensible Bereiche wie Bildung und Beschäftigung
Integration mit bestehenden Gerechtigkeitsstandards: Erforschung von Koordinationsmechanismen zwischen CIP und statistischen Gerechtigkeitsstandards

Tiefgreifende Bewertung

Stärken

Starke konzeptionelle Innovation: Eröffnet neue Dimension der Algorithmusgerechtigkeit und füllt wichtige theoretische Lücke
Solide philosophische Grundlagen: Bringt Erkenntnisse aus Beweistheorie und Moralphilosophie in Algorithmusgerechtigkeit ein
Hoher praktischer Wert: Bietet konkreten moralischen Orientierungsrahmen für tatsächliche Algorithmusbereitstellung
Rigorose Argumentation: Detaillierte Fallanalysen und Vergleichsargumente unterstützen Kernthesen
Interdisziplinäre Integration: Erfolgreich integriert Perspektiven aus Informatik, Philosophie, Rechtswissenschaft und öffentlicher Politik

Mängel

Operationalisierungsherausforderungen: CIP-Test kann in komplexen realen Szenarien praktische Schwierigkeiten haben
Abhängigkeit von Werturteilen: Was "strukturelle Ungerechtigkeit" konstituiert, beinhaltet selbst Werturteile und könnte umstritten sein
Rechnerische Komplexität: Bewertung kontrafaktischer Szenarien in komplexen Kausalnetzen könnte rechnerisch herausfordernd sein
Kulturelle Relativität: Verständnis von Gerechtigkeit kann in verschiedenen gesellschaftlichen und kulturellen Kontexten unterschiedlich sein

Bewertung der Auswirkungen

Akademischer Beitrag: Eröffnet neue theoretische Richtung für Algorithmusgerechtigkeit
Politischer Wert: Bietet wichtige Referenz für Regierungen und Organisationen bei Formulierung von Algorithmusrichtlinien
Praktische Orientierung: Bietet Algorithmusentwicklern und Implementierern ethischen Entscheidungsrahmen
Bereichsübergreifende Auswirkungen: Könnte Forschung in Rechtswissenschaft, öffentlicher Politik, Ethik und anderen Bereichen beeinflussen

Anwendungsszenarien

Hochrisiko-Algorithmusanwendungen: Besonders geeignet für sensible Bereiche wie Strafjustiz, Medizin, Bildung
Politikgestaltung: Bietet theoretische Unterstützung für Regierungspolitik zur Algorithmuskontrolle
Algorithmus-Audit: Bietet Bewertungsrahmen für Drittanbieter-Algorithmus-Audits
Entscheidungen von Ethikkommissionen: Bietet Werkzeuge für institutionelle Ethikkommissionen zur Bewertung von Algorithmus-Projekten

Literaturverzeichnis

Das Papier zitiert wichtige Literatur aus mehreren Bereichen der Algorithmusgerechtigkeit, strukturellen Ungerechtigkeit und Beweistheorie, einschließlich:

Algorithmusgerechtigkeit: Kontrafaktische Gerechtigkeit von Kusner et al. (2017), pfadspezifische Gerechtigkeit von Chiappa & Gillam (2018)
Strukturelle Ungerechtigkeit: Theorie struktureller Ungerechtigkeit von Young (2011), zusammengesetzte Ungerechtigkeit von Hellman (2023)
Empirische Forschung: Umfangreiche empirische Forschung zu Auswirkungen von Redlining-Politik, Rassentrennung auf Kriminalität und Gesundheit
Rechtstheorie: Relevante Literatur zur Verwendung statistischer Beweise in Rechtsverfahren

Dieses Papier leistet einen wichtigen theoretischen Beitrag zur Algorithmusgerechtigkeit. Das vorgeschlagene Kontrafaktische Unabhängigkeitsprinzip bietet nicht nur tiefe philosophische Einsichten, sondern auch erheblichen praktischen Wert. Obwohl es bei der Operationalisierung noch Herausforderungen gibt, weist es wichtige Richtungen für die zukünftige Entwicklung dieses Forschungsbereichs auf.