The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.
논문 ID : 2510.12822제목 : Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms저자 : Michele Loi, Marcello Di Bello, Nicolò Cangiotti분류 : cs.CY (컴퓨터와 사회), cs.AI (인공지능), cs.LG (기계학습)발표 시간 : 2025년 10월 10일논문 링크 : https://arxiv.org/abs/2510.12822 본 논문은 알고리즘 공정성의 간과된 중요한 측면을 탐구한다: 알고리즘 출력의 증거 가치 자체가 구조적 부정의에 의존하는지 여부. 저자들은 두 가지 경찰 알고리즘 사례를 비교하여 새로운 도덕적 평가 기준을 제시한다. 역사적 범죄 데이터에 기반한 예측 경찰 알고리즘과 카메라 기록으로 진행 중인 범죄를 포착하는 시스템이 그것이다. 이 기준은 증거가 현실 세계에서 증명력을 가지는지뿐만 아니라, 관련 부정의가 없는 인접 가능 세계에서도 증명력을 유지하는지 고려할 것을 요구한다. 예측 경찰 알고리즘은 이 검증을 통과하지 못하는 반면, 카메라 기반 시스템은 통과한다.
기존 알고리즘 공정성 연구는 주로 통계적 기준(예: 기회의 균등화, 보정), 인과 및 반사실적 방법, 구조적 및 복합 부정의의 역할에 초점을 맞추고 있으나, 한 가지 핵심 측면을 간과하고 있다: 알고리즘 출력의 증거 가치 자체가 구조적 부정의에 의존하는지 여부 .
도덕적 직관의 불일치 : 두 경찰 알고리즘 모두 소수 민족 공동체에 대한 불균형적 영향을 초래하지만, 도덕적 수용 가능성에 대한 직관은 다르다이론적 공백 : 기존 공정성 이론은 카메라 기반 알고리즘이 예측 경찰 알고리즘보다 도덕적으로 더 수용 가능한 이유를 설명할 수 없다실제 적용 필요 : 형사 사법, 의료 등 민감한 분야에서 알고리즘 적용을 지도할 더 정교한 프레임워크 필요통계적 기준 : 두 알고리즘 모두 인종 집단 간 다른 오류율을 생성하므로 도덕적 차이를 포착할 수 없다인과 방법 : 인종을 조작 가능한 이산 변수로 취급하여 복잡한 구조적 현상에서 인종의 내재성을 간과한다복합 부정의 이론 : 두 알고리즘 모두에 동등하게 적용되어 도덕적 차이를 구분할 수 없다반사실적 독립 원칙(CIP) 제시 : 증거 기반 알고리즘의 수용 가능성을 판단하기 위한 새로운 도덕적 평가 프레임워크CIP 검증 방법 수립 : 증거가 구조적 부정의가 없는 세계에서도 증명력을 유지하는지 평가하는 체계적 절차분야 간 적용 지침 제공 : 형사 사법 및 의료 분야에 원칙을 적용하여 실용성 입증처벌적 및 지원적 적용 구분 : 다양한 유형의 알고리즘 적용에 차등화된 도덕적 지침 제공CIP는 두 가지 핵심 구성 요소를 포함한다:
결과 O(예: 범죄 위치)에 관한 증거 E에 대해, 관련 구조적 부정의가 존재하지 않는 인접 가능 세계에서 E가 O에 대한 증명 가치를 유지하는지 확인한다. 그렇다면 E는 검증을 통과하고, 그렇지 않으면 실패한다.
E가 CIP 검증을 통과하는지 여부는 그 수용 가능한 하위 사용을 결정하는 도덕적으로 관련된 고려 사항이다. 증거의 처벌적 사용(예: 경찰 파견 또는 개인의 자유 제한)의 경우, 증거가 검증을 통과하지 못할 때 통과할 때보다 더 신중해야 한다.
메커니즘 식별 : 증거 E를 결과 O와 연결하는 메커니즘 결정부정의 판단 : 해당 메커니즘이 구조적 부정의의 일부인지 결정반사실적 세계 평가 : 그렇다면, 부정의 메커니즘을 제거한 인접 반사실적 세계를 평가하고 증거 연결이 여전히 성립하는지 질문결론 도출 : 성립한다면 E는 CIP 검증을 통과하고, 그렇지 않으면 실패한다예측 경찰의 인과 연쇄 :
소수 민족 공동체 → 적선 정책 → 인종 격리 → 지역사회 투자 부족 → 학교 자금 부족 →
고용 기회 제한 → 집중된 빈곤 → 더 많은 범죄
카메라 증거의 인과 연쇄 :
소수 민족 공동체의 범죄 → 카메라가 범죄자 포착 → 범죄 위치 정보
CIP는 전통적 인과 방법의 문제를 회피한다:
인종 변수 조작 불필요 : 대신 부정의 메커니즘이 없을 때 증거 관계가 여전히 성립하는지 질문증거의 인식론적 관련성에 초점 : 인종 변화에 대한 알고리즘 출력의 민감성이 아님인종의 구조적 내재성 인정 : 인종을 독립적으로 조작 가능한 변수로 취급하지 않음DNA 샘플, 지문, 영상 기록 : CIP 검증 통과. 증거 가치가 범죄와의 인과 관계에 기반하며 부정의한 사회 조건에 의존하지 않음품행 증거 및 범죄 기록 : 검증 미통과 가능. 예측 가치가 구조적 부정의로 인한 범죄 환경에 의존하는 경우DNA 매칭, 감시 영상 인증 알고리즘 : CIP 검증 통과PredPol, HunchLab 등 예측 경찰 시스템 : 검증 미통과. 구조적 부정의로 인한 범죄 공간 집중에 의존즉각적 반복 피해에 기반한 예측 도구 : 검증 통과 가능유전적 요인 시나리오 :환자가 유전적 변이로 인해 약물 대사 능력 저하 CIP 결과 : 검증 통과. 유전적 변이는 공정한 세계에서도 관련성 유지동반 질환 시나리오 :2형 당뇨병 등 동반 질환이 약물 효과 감소, 그러나 유병률은 구조적 부정의의 영향 CIP 결과 : 검증 통과. 생물학적 관계는 공정한 세계에서도 성립사회적 변수 시나리오 :알고리즘이 저소득, 주택 불안정 등 사회적 변수로 치료 결과 예측 CIP 결과 : 검증 미통과. 더 공정한 세계에서 이들 변수는 치료 효과를 더 이상 예측하지 않을 것도덕적 차이의 설명 : CIP는 카메라 알고리즘이 예측 경찰 알고리즘보다 도덕적으로 더 수용 가능한 이유를 성공적으로 설명분야 간 적용성 : 원칙이 형사 사법 및 의료 분야 모두에서 실용적 가치 입증적용 유형의 구분 : 처벌적 대 지원적 적용이 다른 도덕적 고려 필요처벌적 적용 : CIP 검증을 통과하지 못한 증거는 신중하게 사용해야 함지원적 적용 : CIP 검증 미통과가 오히려 증거를 교정적 개입에 사용하는 추가적 이유 제공역사적 데이터는 특정 소수 민족 공동체의 높은 당뇨병 위험 보여줌 증거가 CIP 검증을 통과하지 못하지만, 이는 예방적 치료 지도에 사용하는 이유 강화 역사적 범죄 데이터를 지원적 개입에 사용 가능: 가로등 개선, 지역사회 중재 프로그램 처벌적 조치에만 사용하지 않음: 순찰 증가, 정지 수색 확대 통계적 공정성 기준 : 기회의 균등화, 보정 등인과 공정성 : Chiappa & Gillam의 경로 특정 반사실적 공정성반사실적 공정성 : Kusner 등의 개별 반사실적 방법구조적 부정의 : Hellman의 복합 부정의 이론예측적 정의 : Lazar & Stone의 예측 패리티 원칙증거론적 전환 : 알고리즘 출력에서 증거 자체의 도덕적 지위로 초점 이동메커니즘 수준 분석 : 증거에 증명력을 부여하는 인과 메커니즘의 심층 분석적용 지향적 구분 : 다양한 유형의 적용에 차등화된 지침 제공CIP는 새로운 도덕적 평가 차원 제공 : 기존 알고리즘 공정성 이론 보완증거의 도덕적 지위가 중요 : 알고리즘의 통계적 성능뿐만 아니라 증거 기초의 도덕적 수용 가능성 고려 필요적용 유형이 도덕적 요구 결정 : 처벌적 및 지원적 적용이 다른 도덕적 기준 필요반사실적 추론의 인식론적 도전 : 구조적 부정의가 없는 세계 평가는 합리적 인과 이론 지원 필요복잡한 인과 메커니즘 식별의 어려움 : 실제로 모든 관련 인과 메커니즘을 정확히 식별하기 어려울 수 있음적용 경계의 모호성 : 처벌적 및 지원적 적용 간의 경계가 일부 경우 불명확할 수 있음CIP의 운영화 : CIP 검증을 적용하기 위한 더 구체적인 도구 및 지침 개발분야 간 확장 : 교육, 고용 등 다른 민감한 분야에 원칙 적용기존 공정성 기준과의 통합 : CIP와 통계적 공정성 기준의 조화 메커니즘 탐색개념적 혁신성 강함 : 알고리즘 공정성 연구의 새로운 차원 제시, 중요한 이론적 공백 해소철학적 기초 견고 : 증거론 및 도덕 철학의 통찰을 알고리즘 공정성 논의에 성공적으로 통합실용적 가치 높음 : 실제 알고리즘 배포에 구체적인 도덕적 지침 프레임워크 제공논증 엄밀함 : 상세한 사례 분석 및 비교 논증으로 핵심 주장 지지학제 간 통합 : 컴퓨터 과학, 철학, 법학, 공공 정책의 관점 성공적 통합운영화의 도전 : CIP 검증이 복잡한 현실 시나리오에서의 적용이 실제적 어려움 직면 가능가치 판단 의존성 : "구조적 부정의"의 구성 자체가 가치 판단을 포함하여 논쟁의 여지 있음계산 복잡성 : 복잡한 인과 네트워크에서 반사실적 시나리오 평가가 계산상 도전적일 수 있음문화적 상대성 : 다양한 사회 및 문화 배경에서 공정성에 대한 이해가 상이할 수 있음학술적 기여 : 알고리즘 공정성 연구의 새로운 이론적 방향 개척정책적 가치 : 정부 및 조직의 알고리즘 사용 정책 수립에 중요한 참고 자료 제공실무적 지침 : 알고리즘 개발자 및 배포자에게 도덕적 의사결정 프레임워크 제공분야 간 영향 : 법학, 공공 정책, 윤리학 등 다양한 분야의 관련 연구에 영향 미칠 가능성고위험 알고리즘 적용 : 특히 형사 사법, 의료, 교육 등 민감한 분야에 적합정책 수립 : 정부의 알고리즘 거버넌스 정책 수립에 이론적 지지 제공알고리즘 감시 : 제3자 알고리즘 감시에 평가 프레임워크 제공윤리 위원회 의사결정 : 기관 윤리 위원회의 알고리즘 프로젝트 평가에 도구 제공본 논문은 알고리즘 공정성, 구조적 부정의, 증거론 등 다양한 분야의 중요 문헌을 인용하고 있다:
알고리즘 공정성 : Kusner et al. (2017)의 반사실적 공정성, Chiappa & Gillam (2018)의 경로 특정 공정성구조적 부정의 : Young (2011)의 구조적 부정의 이론, Hellman (2023)의 복합 부정의실증 연구 : 적선 정책, 인종 격리가 범죄 및 건강에 미치는 영향에 관한 광범위한 실증 연구법학 이론 : 법적 절차에서 통계적 증거 사용에 관한 관련 문헌본 논문은 알고리즘 공정성 연구에 중요한 이론적 기여를 제공한다. 제시된 반사실적 독립 원칙은 깊이 있는 철학적 통찰뿐만 아니라 중요한 실무적 가치를 지닌다. 운영화 측면에서 여전히 도전 과제가 있지만, 해당 분야의 향후 발전을 위한 중요한 방향을 제시하고 있다.