Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
Loi, Di Bello, Cangiotti
The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.
academic
Beweis ohne Ungerechtigkeit: Ein neuer kontrafaktischer Test für faire Algorithmen
Das Papier untersucht eine vernachlässigte wichtige Dimension der Algorithmusgerechtigkeit: ob der Beweiswert der Algorithmusausgabe selbst von struktureller Ungerechtigkeit abhängt. Die Autoren schlagen durch den Vergleich zweier Polizeialgorithmen – eines auf historischen Kriminaldaten basierenden Predictive-Policing-Algorithmus und eines Systems, das Kameraaufnahmen von laufenden Verbrechen analysiert – einen neuen moralischen Bewertungsmaßstab vor. Dieser Maßstab verlangt, dass wir nicht nur berücksichtigen, ob Beweise in der realen Welt beweiskräftig sind, sondern auch, ob sie in nahegelegenen möglichen Welten ohne relevante Ungerechtigkeit noch beweiskräftig bleiben. Der Predictive-Policing-Algorithmus besteht diesen Test nicht, während das kameragestützte System ihn besteht.
Die bestehende Forschung zur Algorithmusgerechtigkeit konzentriert sich hauptsächlich auf statistische Standards (wie Chancengleichheit, Kalibrierung), kausale und kontrafaktische Methoden sowie die Rolle struktureller und zusammengesetzter Ungerechtigkeit, übersieht aber eine kritische Dimension: ob der Beweiswert der Algorithmusausgabe selbst von struktureller Ungerechtigkeit abhängt.
Divergierende moralische Intuitionen: Obwohl beide Polizeialgorithmen zu unverhältnismäßigen Auswirkungen auf Minderheitengemeinschaften führen, haben Menschen unterschiedliche moralische Urteile über ihre Akzeptabilität
Theoretische Lücke: Bestehende Gerechtigkeitstheorien können nicht erklären, warum kameragestützte Algorithmen moralisch akzeptabler sind als Predictive-Policing-Algorithmen
Praktische Anforderungen: Es ist ein differenzierteres Rahmenwerk erforderlich, um die Anwendung von Algorithmen in sensiblen Bereichen wie Strafjustiz und Gesundheitswesen zu leiten
Statistische Standards: Können die moralischen Unterschiede zwischen den beiden Algorithmen nicht erfassen, da beide unterschiedliche Fehlerquoten über Rassengruppen hinweg erzeugen
Kausale Methoden: Behandeln Rasse als manipulierbare diskrete Variable und ignorieren die Einbettung von Rasse in komplexe strukturelle Phänomene
Theorie zusammengesetzter Ungerechtigkeit: Gilt gleichermaßen für beide Algorithmen und kann ihre moralischen Unterschiede nicht unterscheiden
Einführung des Kontrafaktischen Unabhängigkeitsprinzips (CIP): Ein neuer moralischer Bewertungsrahmen zur Beurteilung der Akzeptabilität von beweisgestützten Algorithmen
Etablierung der CIP-Testmethode: Systematische Schritte zur Bewertung, ob Beweise in einer Welt ohne strukturelle Ungerechtigkeit noch beweiskräftig sind
Bereitstellung bereichsübergreifender Anwendungsleitlinien: Anwendung des Prinzips auf Strafjustiz und Gesundheitswesen, um dessen Praktikabilität zu demonstrieren
Unterscheidung zwischen punitiven und unterstützenden Anwendungen: Differenzierte moralische Leitlinien für verschiedene Arten von Algorithmusanwendungen
Für Beweise E über ein Ergebnis O (wie einen Verbrechensort) wird überprüft, ob E seinen Beweiswert für O in nahegelegenen möglichen Welten behält, in denen die relevante strukturelle Ungerechtigkeit nicht existiert. Wenn ja, besteht E den Test; andernfalls nicht.
Ob E den CIP-Test besteht, ist eine moralisch relevante Überlegung zur Bestimmung seiner akzeptablen nachgelagerten Verwendung. Für die punitive Verwendung von Beweisen (wie das Entsenden von Polizei oder die Einschränkung persönlicher Freiheit) sollte bei Beweisen, die den CIP-Test nicht bestehen, größere Vorsicht walten als bei bestandenen Tests.
Mechanismuserkennung: Bestimmung des Mechanismus, der E mit O verbindet
Ungerechtigkeit bewerten: Bestimmung, ob dieser Mechanismus Teil einer strukturellen Ungerechtigkeit ist
Kontrafaktische Welt bewerten: Falls ja, Bewertung der nahegelegenen kontrafaktischen Welt ohne den Ungerechtigkeitsmechanismus und Frage, ob die Beweisverbindung bestehen bleibt
Schlussfolgerung ziehen: Falls ja, besteht E den CIP-Test; andernfalls nicht
DNA-Proben, Fingerabdrücke, Videoaufnahmen: Bestehen den CIP-Test, da ihr Beweiswert auf kausalen Verbindungen zu Verbrechen basiert und nicht von ungerechten sozialen Bedingungen abhängt
Charakterbeweise und Strafregister: Könnten den Test nicht bestehen, wenn ihr Vorhersagewert von der durch strukturelle Ungerechtigkeit verursachten Verbrechensumgebung abhängt
DNA-Matching, Videoauthentifizierungsalgorithmen: Bestehen den CIP-Test
PredPol, HunchLab und andere Predictive-Policing-Systeme: Bestehen den Test nicht, da sie von Verbrechensraumkonzentrationen abhängen, die durch strukturelle Ungerechtigkeit verursacht werden
Vorhersage-Tools basierend auf unmittelbarer wiederholter Viktimisierung: Könnten den Test bestehen
Erklärung moralischer Unterschiede: Das CIP erklärt erfolgreich, warum kameragestützte Algorithmen moralisch akzeptabler sind als Predictive-Policing-Algorithmen
Bereichsübergreifende Anwendbarkeit: Das Prinzip zeigt praktischen Wert in Strafjustiz und Gesundheitswesen
Unterscheidung von Anwendungstypen: Punitive vs. unterstützende Anwendungen erfordern unterschiedliche moralische Überlegungen
Historische Kriminaldaten können für unterstützende Interventionen verwendet werden: verbesserte Straßenbeleuchtung, Gemeinschaftsvermittlungsprogramme
Nicht nur für punitive Maßnahmen: erhöhte Patrouillen, erweiterte Stop-and-Frisk-Praktiken
CIP bietet neue moralische Bewertungsdimension: Ergänzt bestehende Theorien der Algorithmusgerechtigkeit
Moralischer Status von Beweisen ist wichtig: Nicht nur statistische Leistung von Algorithmen, sondern auch moralische Akzeptabilität ihrer Beweisgrundlage berücksichtigen
Erkenntnistheoretische Herausforderungen kontrafaktischen Denkens: Bewertung von Welten ohne strukturelle Ungerechtigkeit erfordert robuste Kausaltheorie
Schwierigkeit der Identifikation komplexer Kausalmechanismen: In der Praxis kann es schwierig sein, alle relevanten Kausalmechanismen genau zu identifizieren
Unklarheit von Anwendungsgrenzen: Die Grenze zwischen punitiven und unterstützenden Anwendungen kann in einigen Fällen verschwommen sein
Das Papier zitiert wichtige Literatur aus mehreren Bereichen der Algorithmusgerechtigkeit, strukturellen Ungerechtigkeit und Beweistheorie, einschließlich:
Algorithmusgerechtigkeit: Kontrafaktische Gerechtigkeit von Kusner et al. (2017), pfadspezifische Gerechtigkeit von Chiappa & Gillam (2018)
Strukturelle Ungerechtigkeit: Theorie struktureller Ungerechtigkeit von Young (2011), zusammengesetzte Ungerechtigkeit von Hellman (2023)
Empirische Forschung: Umfangreiche empirische Forschung zu Auswirkungen von Redlining-Politik, Rassentrennung auf Kriminalität und Gesundheit
Rechtstheorie: Relevante Literatur zur Verwendung statistischer Beweise in Rechtsverfahren
Dieses Papier leistet einen wichtigen theoretischen Beitrag zur Algorithmusgerechtigkeit. Das vorgeschlagene Kontrafaktische Unabhängigkeitsprinzip bietet nicht nur tiefe philosophische Einsichten, sondern auch erheblichen praktischen Wert. Obwohl es bei der Operationalisierung noch Herausforderungen gibt, weist es wichtige Richtungen für die zukünftige Entwicklung dieses Forschungsbereichs auf.