Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
Loi, Di Bello, Cangiotti
The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.
academic
الأدلة بدون ظلم: اختبار معياري جديد للخوارزميات العادلة
تستكشف هذه الورقة بُعداً مهملاً مهماً في عدالة الخوارزميات: ما إذا كانت القيمة الإثباتية لمخرجات الخوارزمية نفسها تعتمد على الظلم الهيكلي. يقترح المؤلفون معياراً أخلاقياً جديداً من خلال مقارنة حالتي خوارزميات شرطية - خوارزمية الشرطة التنبؤية القائمة على بيانات الجرائم التاريخية والأنظمة القائمة على تسجيلات الكاميرا للجرائم الجارية. يتطلب هذا المعيار عدم النظر فقط إلى ما إذا كانت الأدلة ذات قوة إثباتية في العالم الفعلي، بل أيضاً ما إذا ظلت الأدلة ذات قوة إثباتية في العوالم المجاورة الخالية من الظلم ذي الصلة. تفشل خوارزميات الشرطة التنبؤية في هذا الاختبار، بينما تنجح الأنظمة القائمة على الكاميرا.
يركز البحث الحالي في عدالة الخوارزميات بشكل أساسي على المعايير الإحصائية (مثل تساوي الفرص والمعايرة)، والطرق السببية والمعيارية، ودور الظلم الهيكلي والمركب، لكنه يتجاهل بُعداً حاسماً: ما إذا كانت القيمة الإثباتية لمخرجات الخوارزمية نفسها تعتمد على الظلم الهيكلي.
التضارب في الحدس الأخلاقي: على الرغم من أن كلا نوعي خوارزميات الشرطة يؤديان إلى تأثيرات غير متناسبة على المجتمعات الأقلية، إلا أن الناس لديهم أحكام حدسية مختلفة حول قبولهما الأخلاقي
الفجوة النظرية: لا تستطيع نظريات العدالة الحالية شرح سبب كون خوارزميات الكاميرا أكثر قبولاً أخلاقياً من خوارزميات الشرطة التنبؤية
احتياجات التطبيق العملي: الحاجة إلى إطار عمل أكثر دقة لتوجيه استخدام الخوارزميات في المجالات الحساسة مثل العدالة الجنائية والرعاية الصحية
بالنسبة للأدلة E المتعلقة بالنتيجة O (مثل موقع الجريمة)، تحقق مما إذا كانت E تحتفظ بقوتها الإثباتية للنتيجة O في العوالم الممكنة المجاورة الخالية من الظلم الهيكلي ذي الصلة. إذا كانت الإجابة بنعم، فإن E تنجح في الاختبار؛ وإلا فإنها تفشل.
ما إذا كانت E تنجح في اختبار CIP هو اعتبار ذو صلة أخلاقية لتحديد استخدامها اللاحق المقبول. بالنسبة للاستخدام العقابي للأدلة (مثل إرسال الشرطة أو تقييد حرية الفرد)، يجب أن تكون أكثر حذراً عندما تفشل الأدلة في اختبار CIP مقارنة بعندما تنجح.
تحديد الآلية: تحديد الآلية التي تجعل الأدلة E ذات صلة بالنتيجة O
الحكم على عدم العدالة: تحديد ما إذا كانت هذه الآلية جزءاً من الظلم الهيكلي
تقييم العالم المعياري: إذا كانت الإجابة بنعم، قيّم العالم المعياري المجاور الذي تتم فيه إزالة آلية الظلم، واسأل ما إذا كانت الصلة بين الأدلة والنتيجة لا تزال قائمة
الخروج بنتيجة: إذا ظلت قائمة، فإن E تنجح في اختبار CIP؛ وإلا فإنها تفشل
المجتمعات الأقلية → سياسات الخطوط الحمراء → الفصل العنصري → نقص الاستثمار المجتمعي
→ تمويل المدارس غير الكافي → فرص عمل محدودة → الفقر المركز → جرائم أكثر
السلسلة السببية لأدلة الكاميرا:
جريمة في مجتمع الأقلية → التقاط الكاميرا للمجرم → معلومات موقع الجريمة
العينات الحمضية النووية والبصمات والتسجيلات الفيديو: تنجح في اختبار CIP، لأن قيمتها الإثباتية تستند إلى الصلة السببية بالجريمة، وليست معتمدة على ظروف اجتماعية ظالمة
أدلة الشخصية وسجل الجرائم: قد تفشل في الاختبار، إذا كانت قيمتها التنبؤية تعتمد على بيئة الجريمة الناجمة عن الظلم الهيكلي
تستشهد هذه الورقة بأدبيات مهمة من عدة مجالات تشمل عدالة الخوارزميات والظلم الهيكلي ونظرية الأدلة:
عدالة الخوارزميات: العدالة المعيارية من Kusner وآخرين (2017)، العدالة الخاصة بالمسار من Chiappa و Gillam (2018)
الظلم الهيكلي: نظرية الظلم الهيكلي من Young (2011)، الظلم المركب من Hellman (2023)
الأبحاث التجريبية: أبحاث واسعة حول تأثير سياسات الخطوط الحمراء والفصل العنصري على الجريمة والصحة
نظرية القانون: أدبيات ذات صلة حول استخدام الأدلة الإحصائية في الإجراءات القانونية
توفر هذه الورقة مساهمة نظرية مهمة في بحث عدالة الخوارزميات، حيث أن مبدأ الاستقلال المعياري المقترح لا يتمتع فقط برؤى فلسفية عميقة، بل يتمتع أيضاً بقيمة عملية كبيرة. على الرغم من أنه لا يزال يواجه تحديات في التشغيل، فإنه يشير إلى اتجاه مهم للتطور المستقبلي في هذا المجال.