2025-11-21T02:31:16.003696

Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms

Loi, Di Bello, Cangiotti

The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.

academic

Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms

基本信息

论文ID: 2510.12822
标题: Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
作者: Michele Loi, Marcello Di Bello, Nicolò Cangiotti
分类: cs.CY (计算机与社会), cs.AI (人工智能), cs.LG (机器学习)
发表时间: 2025年10月10日
论文链接: https://arxiv.org/abs/2510.12822

道德直觉的分歧：尽管两种警务算法都会导致对少数族裔社区的不成比例影响，但人们对它们的道德可接受性有不同的直觉判断
理论空白：现有的公平性理论无法解释为什么基于摄像头的算法比预测性警务算法在道德上更可接受
实际应用需求：需要更细致的框架来指导算法在刑事司法、医疗保健等敏感领域的应用

现有方法局限性

统计标准：无法捕捉两种算法之间的道德差异，因为两者都产生跨种族群体的不同错误率
因果方法：将种族视为可操纵的离散变量，忽略了种族在复杂结构现象中的嵌入性
复合不公正理论：同样适用于两种算法，无法区分它们的道德差异

核心贡献

提出了反事实独立原则（CIP）：一个新的道德评估框架，用于判断基于证据的算法的可接受性
建立了CIP测试方法：系统性的步骤来评估证据在没有结构性不公正的世界中是否仍具证明力
提供了跨领域应用指导：将原则应用于刑事司法和医疗保健领域，展示其实用性
区分了惩罚性和支持性应用：为不同类型的算法应用提供了差异化的道德指导

识别机制：确定使证据E与结果O相关的机制
判断不公正性：确定该机制是否属于结构性不公正的一部分
评估反事实世界：如果是，评估移除不公正机制的邻近反事实世界，询问证据联系是否仍然成立
得出结论：如果成立，E通过CIP测试；否则失败

因果链分析示例

预测性警务的因果链：

少数族裔社区 → 红线政策 → 种族隔离 → 社区投资不足 → 学校资金不足 → 就业机会有限 → 集中贫困 → 更多犯罪

摄像头证据的因果链：

少数族裔社区犯罪 → 摄像头捕获犯罪者 → 犯罪位置信息

与现有方法的区别

CIP避免了传统因果方法的问题：

不需要操纵种族变量：而是询问证据关系在没有不公正机制时是否仍然成立
关注证据的认识论相关性：而非算法输出对种族变化的敏感性
承认种族的结构性嵌入：不将种族视为可独立操纵的变量

DNA样本、指纹、视频录像：通过CIP测试，因为其证据价值基于与犯罪的因果联系，不依赖于不公正的社会条件
品格证据和犯罪史：可能未通过测试，如果其预测价值依赖于结构性不公正造成的犯罪环境

算法工具评估

DNA匹配、监控录像认证算法：通过CIP测试
PredPol、HunchLab等预测性警务系统：未通过测试，因为依赖于由结构性不公正造成的犯罪空间聚集
基于即时重复受害的预测工具：可能通过测试

医疗保健领域应用

三种场景分析

基因因素场景：
- 患者因基因变异导致药物代谢能力降低
- CIP结果：通过测试，基因变异在公正世界中仍然相关
合并症场景：
- 2型糖尿病等合并症降低药物效果，但其患病率受结构性不公正影响
- CIP结果：通过测试，生物学关系在公正世界中仍然成立
社会变量场景：
- 算法基于低收入、住房不稳定等社会变量预测治疗结果
- CIP结果：未通过测试，在更公平的世界中这些变量将不再预测治疗效果

实验结果与发现

主要发现

道德差异的解释：CIP成功解释了为什么摄像头算法比预测性警务算法在道德上更可接受
跨领域适用性：原则在刑事司法和医疗保健领域都显示出实用价值
应用类型的区分：惩罚性vs支持性应用需要不同的道德考量

惩罚性vs支持性应用的逆转效应

惩罚性应用：未通过CIP测试的证据应谨慎使用
支持性应用：未通过CIP测试反而提供了使用证据进行补救干预的额外理由

具体案例分析

糖尿病预防项目

历史数据显示某些少数族裔社区糖尿病风险较高
虽然证据未通过CIP测试，但这强化了将其用于指导预防性护理的理由

社区警务

历史犯罪数据可用于支持性干预：改善街道照明、社区调解项目
而非仅用于惩罚性措施：增加巡逻、扩大拦截搜查

结论与讨论

主要结论

CIP提供了新的道德评估维度：补充了现有的算法公平性理论
证据的道德地位matters：不仅要考虑算法的统计性能，还要考虑其证据基础的道德可接受性
应用类型决定道德要求：惩罚性和支持性应用需要不同的道德标准

局限性

反事实推理的认识论挑战：评估没有结构性不公正的世界需要合理的因果理论支撑
复杂因果机制的识别困难：实践中可能难以准确识别所有相关的因果机制
应用边界的模糊性：惩罚性和支持性应用之间的界限在某些情况下可能不清晰

未来研究方向

CIP的操作化：开发更具体的工具和指南来应用CIP测试
跨领域扩展：将原则应用于教育、就业等其他敏感领域
与现有公平性标准的整合：探索CIP与统计公平性标准的协调机制

深度评价

优点

概念创新性强：提出了算法公平性研究的新维度，填补了重要理论空白
哲学基础扎实：将证据论和道德哲学的洞察引入算法公平性讨论
实用价值高：为实际算法部署提供了具体的道德指导框架
论证严谨：通过详细的案例分析和对比论证支撑核心观点
跨学科整合：成功整合了计算机科学、哲学、法学和公共政策的视角

不足

操作化挑战：CIP测试在复杂现实场景中的应用可能面临实际困难
价值判断依赖：什么构成"结构性不公正"本身涉及价值判断，可能存在争议
计算复杂性：评估复杂因果网络中的反事实场景可能在计算上具有挑战性
文化相对性：不同社会和文化背景下对公正的理解可能不同

影响力评估

学术贡献：为算法公平性研究开辟了新的理论方向
政策价值：为政府和组织制定算法使用政策提供了重要参考
实践指导：为算法开发者和部署者提供了道德决策框架
跨领域影响：可能影响法学、公共政策、伦理学等多个领域的相关研究

适用场景

高风险算法应用：特别适用于刑事司法、医疗、教育等敏感领域
政策制定：为政府制定算法治理政策提供理论支撑
算法审计：为第三方算法审计提供评估框架
伦理委员会决策：为机构伦理委员会评估算法项目提供工具

参考文献

本文引用了算法公平性、结构性不公正、证据论等多个领域的重要文献，包括：

算法公平性：Kusner et al. (2017)的反事实公平性，Chiappa & Gillam (2018)的路径特定公平性
结构性不公正：Young (2011)的结构性不公正理论，Hellman (2023)的复合不公正
实证研究：关于红线政策、种族隔离对犯罪和健康影响的大量实证研究
法学理论：关于统计证据在法律程序中使用的相关文献

这篇论文为算法公平性研究提供了重要的理论贡献，其提出的反事实独立原则不仅具有深刻的哲学洞察，也具有重要的实践价值。尽管在操作化方面仍面临挑战，但为该领域的未来发展指明了重要方向。