2025-11-21T02:31:16.003696

Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms

Loi, Di Bello, Cangiotti
The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.
academic

증거 없는 부정의: 공정한 알고리즘을 위한 새로운 반사실적 검증

기본 정보

  • 논문 ID: 2510.12822
  • 제목: Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
  • 저자: Michele Loi, Marcello Di Bello, Nicolò Cangiotti
  • 분류: cs.CY (컴퓨터와 사회), cs.AI (인공지능), cs.LG (기계학습)
  • 발표 시간: 2025년 10월 10일
  • 논문 링크: https://arxiv.org/abs/2510.12822

초록

본 논문은 알고리즘 공정성의 간과된 중요한 측면을 탐구한다: 알고리즘 출력의 증거 가치 자체가 구조적 부정의에 의존하는지 여부. 저자들은 두 가지 경찰 알고리즘 사례를 비교하여 새로운 도덕적 평가 기준을 제시한다. 역사적 범죄 데이터에 기반한 예측 경찰 알고리즘과 카메라 기록으로 진행 중인 범죄를 포착하는 시스템이 그것이다. 이 기준은 증거가 현실 세계에서 증명력을 가지는지뿐만 아니라, 관련 부정의가 없는 인접 가능 세계에서도 증명력을 유지하는지 고려할 것을 요구한다. 예측 경찰 알고리즘은 이 검증을 통과하지 못하는 반면, 카메라 기반 시스템은 통과한다.

연구 배경 및 동기

핵심 문제

기존 알고리즘 공정성 연구는 주로 통계적 기준(예: 기회의 균등화, 보정), 인과 및 반사실적 방법, 구조적 및 복합 부정의의 역할에 초점을 맞추고 있으나, 한 가지 핵심 측면을 간과하고 있다: 알고리즘 출력의 증거 가치 자체가 구조적 부정의에 의존하는지 여부.

문제의 중요성

  1. 도덕적 직관의 불일치: 두 경찰 알고리즘 모두 소수 민족 공동체에 대한 불균형적 영향을 초래하지만, 도덕적 수용 가능성에 대한 직관은 다르다
  2. 이론적 공백: 기존 공정성 이론은 카메라 기반 알고리즘이 예측 경찰 알고리즘보다 도덕적으로 더 수용 가능한 이유를 설명할 수 없다
  3. 실제 적용 필요: 형사 사법, 의료 등 민감한 분야에서 알고리즘 적용을 지도할 더 정교한 프레임워크 필요

기존 방법의 한계

  1. 통계적 기준: 두 알고리즘 모두 인종 집단 간 다른 오류율을 생성하므로 도덕적 차이를 포착할 수 없다
  2. 인과 방법: 인종을 조작 가능한 이산 변수로 취급하여 복잡한 구조적 현상에서 인종의 내재성을 간과한다
  3. 복합 부정의 이론: 두 알고리즘 모두에 동등하게 적용되어 도덕적 차이를 구분할 수 없다

핵심 기여

  1. 반사실적 독립 원칙(CIP) 제시: 증거 기반 알고리즘의 수용 가능성을 판단하기 위한 새로운 도덕적 평가 프레임워크
  2. CIP 검증 방법 수립: 증거가 구조적 부정의가 없는 세계에서도 증명력을 유지하는지 평가하는 체계적 절차
  3. 분야 간 적용 지침 제공: 형사 사법 및 의료 분야에 원칙을 적용하여 실용성 입증
  4. 처벌적 및 지원적 적용 구분: 다양한 유형의 알고리즘 적용에 차등화된 도덕적 지침 제공

방법론 상세 설명

반사실적 독립 원칙(CIP) 정의

CIP는 두 가지 핵심 구성 요소를 포함한다:

CIP 검증

결과 O(예: 범죄 위치)에 관한 증거 E에 대해, 관련 구조적 부정의가 존재하지 않는 인접 가능 세계에서 E가 O에 대한 증명 가치를 유지하는지 확인한다. 그렇다면 E는 검증을 통과하고, 그렇지 않으면 실패한다.

하위 사용 지침

E가 CIP 검증을 통과하는지 여부는 그 수용 가능한 하위 사용을 결정하는 도덕적으로 관련된 고려 사항이다. 증거의 처벌적 사용(예: 경찰 파견 또는 개인의 자유 제한)의 경우, 증거가 검증을 통과하지 못할 때 통과할 때보다 더 신중해야 한다.

CIP 검증의 구체적 단계

  1. 메커니즘 식별: 증거 E를 결과 O와 연결하는 메커니즘 결정
  2. 부정의 판단: 해당 메커니즘이 구조적 부정의의 일부인지 결정
  3. 반사실적 세계 평가: 그렇다면, 부정의 메커니즘을 제거한 인접 반사실적 세계를 평가하고 증거 연결이 여전히 성립하는지 질문
  4. 결론 도출: 성립한다면 E는 CIP 검증을 통과하고, 그렇지 않으면 실패한다

인과 연쇄 분석 예시

예측 경찰의 인과 연쇄:

소수 민족 공동체 → 적선 정책 → 인종 격리 → 지역사회 투자 부족 → 학교 자금 부족 → 
고용 기회 제한 → 집중된 빈곤 → 더 많은 범죄

카메라 증거의 인과 연쇄:

소수 민족 공동체의 범죄 → 카메라가 범죄자 포착 → 범죄 위치 정보

기존 방법과의 차이

CIP는 전통적 인과 방법의 문제를 회피한다:

  • 인종 변수 조작 불필요: 대신 부정의 메커니즘이 없을 때 증거 관계가 여전히 성립하는지 질문
  • 증거의 인식론적 관련성에 초점: 인종 변화에 대한 알고리즘 출력의 민감성이 아님
  • 인종의 구조적 내재성 인정: 인종을 독립적으로 조작 가능한 변수로 취급하지 않음

실험 설정 및 적용 사례

형사 사법 분야 적용

전통적 증거 평가

  • DNA 샘플, 지문, 영상 기록: CIP 검증 통과. 증거 가치가 범죄와의 인과 관계에 기반하며 부정의한 사회 조건에 의존하지 않음
  • 품행 증거 및 범죄 기록: 검증 미통과 가능. 예측 가치가 구조적 부정의로 인한 범죄 환경에 의존하는 경우

알고리즘 도구 평가

  • DNA 매칭, 감시 영상 인증 알고리즘: CIP 검증 통과
  • PredPol, HunchLab 등 예측 경찰 시스템: 검증 미통과. 구조적 부정의로 인한 범죄 공간 집중에 의존
  • 즉각적 반복 피해에 기반한 예측 도구: 검증 통과 가능

의료 분야 적용

세 가지 시나리오 분석

  1. 유전적 요인 시나리오:
    • 환자가 유전적 변이로 인해 약물 대사 능력 저하
    • CIP 결과: 검증 통과. 유전적 변이는 공정한 세계에서도 관련성 유지
  2. 동반 질환 시나리오:
    • 2형 당뇨병 등 동반 질환이 약물 효과 감소, 그러나 유병률은 구조적 부정의의 영향
    • CIP 결과: 검증 통과. 생물학적 관계는 공정한 세계에서도 성립
  3. 사회적 변수 시나리오:
    • 알고리즘이 저소득, 주택 불안정 등 사회적 변수로 치료 결과 예측
    • CIP 결과: 검증 미통과. 더 공정한 세계에서 이들 변수는 치료 효과를 더 이상 예측하지 않을 것

실험 결과 및 발견

주요 발견

  1. 도덕적 차이의 설명: CIP는 카메라 알고리즘이 예측 경찰 알고리즘보다 도덕적으로 더 수용 가능한 이유를 성공적으로 설명
  2. 분야 간 적용성: 원칙이 형사 사법 및 의료 분야 모두에서 실용적 가치 입증
  3. 적용 유형의 구분: 처벌적 대 지원적 적용이 다른 도덕적 고려 필요

처벌적 대 지원적 적용의 역전 효과

  • 처벌적 적용: CIP 검증을 통과하지 못한 증거는 신중하게 사용해야 함
  • 지원적 적용: CIP 검증 미통과가 오히려 증거를 교정적 개입에 사용하는 추가적 이유 제공

구체적 사례 분석

당뇨병 예방 프로젝트

  • 역사적 데이터는 특정 소수 민족 공동체의 높은 당뇨병 위험 보여줌
  • 증거가 CIP 검증을 통과하지 못하지만, 이는 예방적 치료 지도에 사용하는 이유 강화

지역사회 경찰

  • 역사적 범죄 데이터를 지원적 개입에 사용 가능: 가로등 개선, 지역사회 중재 프로그램
  • 처벌적 조치에만 사용하지 않음: 순찰 증가, 정지 수색 확대

관련 연구

알고리즘 공정성 연구 맥락

  1. 통계적 공정성 기준: 기회의 균등화, 보정 등
  2. 인과 공정성: Chiappa & Gillam의 경로 특정 반사실적 공정성
  3. 반사실적 공정성: Kusner 등의 개별 반사실적 방법
  4. 구조적 부정의: Hellman의 복합 부정의 이론
  5. 예측적 정의: Lazar & Stone의 예측 패리티 원칙

본 논문의 독특한 기여

  • 증거론적 전환: 알고리즘 출력에서 증거 자체의 도덕적 지위로 초점 이동
  • 메커니즘 수준 분석: 증거에 증명력을 부여하는 인과 메커니즘의 심층 분석
  • 적용 지향적 구분: 다양한 유형의 적용에 차등화된 지침 제공

결론 및 논의

주요 결론

  1. CIP는 새로운 도덕적 평가 차원 제공: 기존 알고리즘 공정성 이론 보완
  2. 증거의 도덕적 지위가 중요: 알고리즘의 통계적 성능뿐만 아니라 증거 기초의 도덕적 수용 가능성 고려 필요
  3. 적용 유형이 도덕적 요구 결정: 처벌적 및 지원적 적용이 다른 도덕적 기준 필요

한계

  1. 반사실적 추론의 인식론적 도전: 구조적 부정의가 없는 세계 평가는 합리적 인과 이론 지원 필요
  2. 복잡한 인과 메커니즘 식별의 어려움: 실제로 모든 관련 인과 메커니즘을 정확히 식별하기 어려울 수 있음
  3. 적용 경계의 모호성: 처벌적 및 지원적 적용 간의 경계가 일부 경우 불명확할 수 있음

향후 연구 방향

  1. CIP의 운영화: CIP 검증을 적용하기 위한 더 구체적인 도구 및 지침 개발
  2. 분야 간 확장: 교육, 고용 등 다른 민감한 분야에 원칙 적용
  3. 기존 공정성 기준과의 통합: CIP와 통계적 공정성 기준의 조화 메커니즘 탐색

심층 평가

장점

  1. 개념적 혁신성 강함: 알고리즘 공정성 연구의 새로운 차원 제시, 중요한 이론적 공백 해소
  2. 철학적 기초 견고: 증거론 및 도덕 철학의 통찰을 알고리즘 공정성 논의에 성공적으로 통합
  3. 실용적 가치 높음: 실제 알고리즘 배포에 구체적인 도덕적 지침 프레임워크 제공
  4. 논증 엄밀함: 상세한 사례 분석 및 비교 논증으로 핵심 주장 지지
  5. 학제 간 통합: 컴퓨터 과학, 철학, 법학, 공공 정책의 관점 성공적 통합

부족한 점

  1. 운영화의 도전: CIP 검증이 복잡한 현실 시나리오에서의 적용이 실제적 어려움 직면 가능
  2. 가치 판단 의존성: "구조적 부정의"의 구성 자체가 가치 판단을 포함하여 논쟁의 여지 있음
  3. 계산 복잡성: 복잡한 인과 네트워크에서 반사실적 시나리오 평가가 계산상 도전적일 수 있음
  4. 문화적 상대성: 다양한 사회 및 문화 배경에서 공정성에 대한 이해가 상이할 수 있음

영향력 평가

  1. 학술적 기여: 알고리즘 공정성 연구의 새로운 이론적 방향 개척
  2. 정책적 가치: 정부 및 조직의 알고리즘 사용 정책 수립에 중요한 참고 자료 제공
  3. 실무적 지침: 알고리즘 개발자 및 배포자에게 도덕적 의사결정 프레임워크 제공
  4. 분야 간 영향: 법학, 공공 정책, 윤리학 등 다양한 분야의 관련 연구에 영향 미칠 가능성

적용 시나리오

  1. 고위험 알고리즘 적용: 특히 형사 사법, 의료, 교육 등 민감한 분야에 적합
  2. 정책 수립: 정부의 알고리즘 거버넌스 정책 수립에 이론적 지지 제공
  3. 알고리즘 감시: 제3자 알고리즘 감시에 평가 프레임워크 제공
  4. 윤리 위원회 의사결정: 기관 윤리 위원회의 알고리즘 프로젝트 평가에 도구 제공

참고 문헌

본 논문은 알고리즘 공정성, 구조적 부정의, 증거론 등 다양한 분야의 중요 문헌을 인용하고 있다:

  • 알고리즘 공정성: Kusner et al. (2017)의 반사실적 공정성, Chiappa & Gillam (2018)의 경로 특정 공정성
  • 구조적 부정의: Young (2011)의 구조적 부정의 이론, Hellman (2023)의 복합 부정의
  • 실증 연구: 적선 정책, 인종 격리가 범죄 및 건강에 미치는 영향에 관한 광범위한 실증 연구
  • 법학 이론: 법적 절차에서 통계적 증거 사용에 관한 관련 문헌

본 논문은 알고리즘 공정성 연구에 중요한 이론적 기여를 제공한다. 제시된 반사실적 독립 원칙은 깊이 있는 철학적 통찰뿐만 아니라 중요한 실무적 가치를 지닌다. 운영화 측면에서 여전히 도전 과제가 있지만, 해당 분야의 향후 발전을 위한 중요한 방향을 제시하고 있다.