Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
Loi, Di Bello, Cangiotti
The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.
academic
Доказательства без несправедливости: новый контрфактический тест для справедливых алгоритмов
В данной статье рассматривается игнорируемое, но важное измерение справедливости алгоритмов: зависит ли сама доказательственная ценность выходных данных алгоритма от структурной несправедливости. Авторы предлагают новый стандарт морального оценивания, сравнивая два случая алгоритмов правоохранительной деятельности — предиктивные алгоритмы полицейской деятельности на основе исторических данных о преступлениях и системы на основе видеозаписей текущих преступлений. Этот стандарт требует рассмотрения не только того, обладает ли доказательство убедительной силой в реальном мире, но и сохраняет ли оно убедительную силу в близких возможных мирах без соответствующей несправедливости. Алгоритмы предиктивной полицейской деятельности не проходят этот тест, тогда как системы на основе видеозаписей его проходят.
Существующие исследования справедливости алгоритмов сосредоточены на статистических стандартах (таких как уравненные коэффициенты ошибок, калибровка), причинно-следственных и контрфактических методах, а также роли структурной и комплексной несправедливости, но упускают ключевое измерение: зависит ли сама доказательственная ценность выходных данных алгоритма от структурной несправедливости.
Расхождение моральной интуиции: несмотря на то, что оба типа алгоритмов правоохранительной деятельности приводят к непропорциональному воздействию на этнические меньшинства, люди имеют различные моральные суждения об их приемлемости
Теоретический пробел: существующие теории справедливости не объясняют, почему алгоритмы на основе видеозаписей морально более приемлемы, чем предиктивная полицейская деятельность
Практические потребности: необходима более детальная база для руководства применением алгоритмов в чувствительных областях, таких как уголовное правосудие и здравоохранение
Статистические стандарты: не могут уловить моральные различия между двумя алгоритмами, так как оба производят различные уровни ошибок в расовых группах
Причинно-следственные методы: рассматривают расу как манипулируемую дискретную переменную, игнорируя её встроенность в сложные структурные явления
Теория комплексной несправедливости: одинаково применима к обоим алгоритмам и не может различить их моральные различия
Предложен принцип контрфактической независимости (CIP): новая база морального оценивания для определения приемлемости алгоритмов на основе доказательств
Установлена методология CIP-теста: систематические шаги для оценки того, сохраняет ли доказательство убедительную силу в мире без структурной несправедливости
Предоставлено руководство по применению в различных областях: применение принципа к уголовному правосудию и здравоохранению, демонстрирующее его практическую полезность
Различие между карательным и поддерживающим применением: дифференцированное моральное руководство для различных типов применения алгоритмов
Для доказательства E относительно результата O (например, места преступления) проверяется, сохраняет ли E свою доказательственную ценность для O в близких возможных мирах, где отсутствует соответствующая структурная несправедливость. Если да, E проходит тест; если нет, то не проходит.
Прохождение или непрохождение E CIP-теста является морально релевантным фактором при определении приемлемого использования доказательства в последующих целях. Для карательного использования доказательства (например, направления полиции или ограничения личной свободы) следует проявлять большую осторожность, когда доказательство не проходит CIP-тест, чем когда оно его проходит.
Определение механизма: выявление механизма, связывающего доказательство E с результатом O
Определение несправедливости: установление того, является ли этот механизм частью структурной несправедливости
Оценка контрфактического мира: если да, оценить близкий контрфактический мир, в котором удален механизм несправедливости, и спросить, сохраняется ли связь доказательства
Вывод: если связь сохраняется, E проходит CIP-тест; если нет, то не проходит
Этнические меньшинства → Политика красных линий → Расовая сегрегация →
Недостаточные инвестиции в сообщество → Недостаточное финансирование школ →
Ограниченные возможности трудоустройства → Концентрированная бедность → Больше преступлений
Причинно-следственная цепь видеодоказательств:
Преступление в сообществе этнических меньшинств → Видеокамера фиксирует преступника →
Информация о месте преступления
ДНК-образцы, отпечатки пальцев, видеозаписи: проходят CIP-тест, так как их доказательственная ценность основана на причинно-следственной связи с преступлением, не зависящей от несправедливых социальных условий
Доказательства характера и криминальной истории: могут не пройти тест, если их предсказательная ценность зависит от криминальной среды, вызванной структурной несправедливостью
Алгоритмы сопоставления ДНК, аутентификации видеозаписей: проходят CIP-тест
Системы предиктивной полицейской деятельности, такие как PredPol и HunchLab: не проходят тест, так как зависят от скопления преступной активности в пространстве, вызванного структурной несправедливостью
Предиктивные инструменты, основанные на немедленной повторной виктимизации: могут пройти тест
Объяснение моральных различий: CIP успешно объясняет, почему алгоритмы на основе видеозаписей морально более приемлемы, чем предиктивная полицейская деятельность
Применимость в различных областях: принцип демонстрирует практическую ценность как в уголовном правосудии, так и в здравоохранении
Различие типов применения: карательное и поддерживающее применение требуют различных моральных соображений
Карательное применение: доказательства, не прошедшие CIP-тест, должны использоваться с осторожностью
Поддерживающее применение: непрохождение CIP-теста предоставляет дополнительное основание для использования доказательства в целях компенсирующего вмешательства
Исторические данные о преступлениях могут использоваться для поддерживающих вмешательств: улучшение уличного освещения, программы общественного посредничества
А не только для карательных мер: увеличение патрулей, расширение остановок и обысков
CIP предоставляет новое моральное измерение оценивания: дополняет существующие теории справедливости алгоритмов
Моральный статус доказательства имеет значение: необходимо рассматривать не только статистическую производительность алгоритма, но и моральную приемлемость его доказательственной базы
Тип применения определяет моральные требования: карательное и поддерживающее применение требуют различных моральных стандартов
Эпистемологические вызовы контрфактического рассуждения: оценка миров без структурной несправедливости требует обоснованной причинно-следственной теории
Сложность определения сложных причинно-следственных механизмов: на практике может быть сложно точно определить все релевантные причинно-следственные механизмы
Размытость границ применения: граница между карательным и поддерживающим применением может быть неясной в некоторых случаях
Вызовы операционализации: применение CIP-теста в сложных реальных сценариях может столкнуться с практическими трудностями
Зависимость от ценностных суждений: само определение того, что составляет "структурную несправедливость", включает ценностные суждения и может быть предметом споров
Вычислительная сложность: оценка контрфактических сценариев в сложных причинно-следственных сетях может быть вычислительно сложной
Культурная относительность: понимание справедливости может различаться в разных социальных и культурных контекстах
Структурная несправедливость: теория структурной несправедливости Young (2011), комплексная несправедливость Hellman (2023)
Эмпирические исследования: обширные эмпирические исследования влияния политики красных линий, расовой сегрегации на преступность и здоровье
Правовая теория: соответствующая литература об использовании статистических доказательств в судебных разбирательствах
Данная статья предоставляет важный теоретический вклад в исследования справедливости алгоритмов. Предложенный принцип контрфактической независимости не только содержит глубокие философские идеи, но и обладает значительной практической ценностью. Несмотря на сохраняющиеся вызовы в области операционализации, работа указывает на важные направления для будущего развития этой области.