2025-11-21T02:31:16.003696

Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms

Loi, Di Bello, Cangiotti

The growing philosophical literature on algorithmic fairness has examined statistical criteria such as equalized odds and calibration, causal and counterfactual approaches, and the role of structural and compounding injustices. Yet an important dimension has been overlooked: whether the evidential value of an algorithmic output itself depends on structural injustice. Our paradigmatic pair of examples contrasts a predictive policing algorithm, which relies on historical crime data, with a camera-based system that records ongoing offenses, both designed to guide police deployment. In evaluating the moral acceptability of acting on a piece of evidence, we must ask not only whether the evidence is probative in the actual world, but also whether it would remain probative in nearby worlds without the relevant injustices. The predictive policing algorithm fails this test, but the camera-based system passes it. When evidence fails the test, it is morally problematic to use it punitively, more so than evidence that passes the test.

academic

Доказательства без несправедливости: новый контрфактический тест для справедливых алгоритмов

Основная информация

ID статьи: 2510.12822
Название: Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms
Авторы: Michele Loi, Marcello Di Bello, Nicolò Cangiotti
Классификация: cs.CY (компьютеры и общество), cs.AI (искусственный интеллект), cs.LG (машинное обучение)
Дата публикации: 10 октября 2025 г.
Ссылка на статью: https://arxiv.org/abs/2510.12822

Аннотация

В данной статье рассматривается игнорируемое, но важное измерение справедливости алгоритмов: зависит ли сама доказательственная ценность выходных данных алгоритма от структурной несправедливости. Авторы предлагают новый стандарт морального оценивания, сравнивая два случая алгоритмов правоохранительной деятельности — предиктивные алгоритмы полицейской деятельности на основе исторических данных о преступлениях и системы на основе видеозаписей текущих преступлений. Этот стандарт требует рассмотрения не только того, обладает ли доказательство убедительной силой в реальном мире, но и сохраняет ли оно убедительную силу в близких возможных мирах без соответствующей несправедливости. Алгоритмы предиктивной полицейской деятельности не проходят этот тест, тогда как системы на основе видеозаписей его проходят.

Исследовательский контекст и мотивация

Основная проблема

Существующие исследования справедливости алгоритмов сосредоточены на статистических стандартах (таких как уравненные коэффициенты ошибок, калибровка), причинно-следственных и контрфактических методах, а также роли структурной и комплексной несправедливости, но упускают ключевое измерение: зависит ли сама доказательственная ценность выходных данных алгоритма от структурной несправедливости.

Важность проблемы

Расхождение моральной интуиции: несмотря на то, что оба типа алгоритмов правоохранительной деятельности приводят к непропорциональному воздействию на этнические меньшинства, люди имеют различные моральные суждения об их приемлемости
Теоретический пробел: существующие теории справедливости не объясняют, почему алгоритмы на основе видеозаписей морально более приемлемы, чем предиктивная полицейская деятельность
Практические потребности: необходима более детальная база для руководства применением алгоритмов в чувствительных областях, таких как уголовное правосудие и здравоохранение

Ограничения существующих подходов

Статистические стандарты: не могут уловить моральные различия между двумя алгоритмами, так как оба производят различные уровни ошибок в расовых группах
Причинно-следственные методы: рассматривают расу как манипулируемую дискретную переменную, игнорируя её встроенность в сложные структурные явления
Теория комплексной несправедливости: одинаково применима к обоим алгоритмам и не может различить их моральные различия

Основные вклады

Предложен принцип контрфактической независимости (CIP): новая база морального оценивания для определения приемлемости алгоритмов на основе доказательств
Установлена методология CIP-теста: систематические шаги для оценки того, сохраняет ли доказательство убедительную силу в мире без структурной несправедливости
Предоставлено руководство по применению в различных областях: применение принципа к уголовному правосудию и здравоохранению, демонстрирующее его практическую полезность
Различие между карательным и поддерживающим применением: дифференцированное моральное руководство для различных типов применения алгоритмов

Подробное описание методологии

Определение принципа контрфактической независимости (CIP)

CIP состоит из двух основных компонентов:

CIP-тест

Для доказательства E относительно результата O (например, места преступления) проверяется, сохраняет ли E свою доказательственную ценность для O в близких возможных мирах, где отсутствует соответствующая структурная несправедливость. Если да, E проходит тест; если нет, то не проходит.

Руководство по использованию в последующих целях

Прохождение или непрохождение E CIP-теста является морально релевантным фактором при определении приемлемого использования доказательства в последующих целях. Для карательного использования доказательства (например, направления полиции или ограничения личной свободы) следует проявлять большую осторожность, когда доказательство не проходит CIP-тест, чем когда оно его проходит.

Конкретные этапы CIP-теста

Определение механизма: выявление механизма, связывающего доказательство E с результатом O
Определение несправедливости: установление того, является ли этот механизм частью структурной несправедливости
Оценка контрфактического мира: если да, оценить близкий контрфактический мир, в котором удален механизм несправедливости, и спросить, сохраняется ли связь доказательства
Вывод: если связь сохраняется, E проходит CIP-тест; если нет, то не проходит

Пример анализа причинно-следственной цепи

Причинно-следственная цепь предиктивной полицейской деятельности:

Этнические меньшинства → Политика красных линий → Расовая сегрегация → 
Недостаточные инвестиции в сообщество → Недостаточное финансирование школ → 
Ограниченные возможности трудоустройства → Концентрированная бедность → Больше преступлений

Причинно-следственная цепь видеодоказательств:

Преступление в сообществе этнических меньшинств → Видеокамера фиксирует преступника → 
Информация о месте преступления

Различия с существующими методами

CIP избегает проблем традиционных причинно-следственных методов:

Не требует манипулирования переменной расы: вместо этого спрашивает, сохраняется ли связь доказательства в отсутствие механизмов несправедливости
Сосредоточена на эпистемологической релевантности доказательства: а не на чувствительности выходных данных алгоритма к изменениям расы
Признает структурную встроенность расы: не рассматривает расу как независимо манипулируемую переменную

Экспериментальная установка и прикладные случаи

Применение в области уголовного правосудия

Традиционная оценка доказательств

ДНК-образцы, отпечатки пальцев, видеозаписи: проходят CIP-тест, так как их доказательственная ценность основана на причинно-следственной связи с преступлением, не зависящей от несправедливых социальных условий
Доказательства характера и криминальной истории: могут не пройти тест, если их предсказательная ценность зависит от криминальной среды, вызванной структурной несправедливостью

Оценка алгоритмических инструментов

Алгоритмы сопоставления ДНК, аутентификации видеозаписей: проходят CIP-тест
Системы предиктивной полицейской деятельности, такие как PredPol и HunchLab: не проходят тест, так как зависят от скопления преступной активности в пространстве, вызванного структурной несправедливостью
Предиктивные инструменты, основанные на немедленной повторной виктимизации: могут пройти тест

Применение в области здравоохранения

Анализ трёх сценариев

Сценарий генетических факторов:
- Пациент имеет генетическую мутацию, снижающую способность метаболизма лекарств
- Результат CIP: проходит тест, генетическая мутация остаётся релевантной в справедливом мире
Сценарий сопутствующих заболеваний:
- Сопутствующие заболевания, такие как диабет 2 типа, снижают эффективность лекарств, но их распространённость зависит от структурной несправедливости
- Результат CIP: проходит тест, биологическая связь сохраняется в справедливом мире
Сценарий социальных переменных:
- Алгоритм основан на социальных переменных, таких как низкий доход и нестабильное жилище, для предсказания результатов лечения
- Результат CIP: не проходит тест, в более справедливом мире эти переменные больше не будут предсказывать результаты лечения

Результаты экспериментов и выводы

Основные выводы

Объяснение моральных различий: CIP успешно объясняет, почему алгоритмы на основе видеозаписей морально более приемлемы, чем предиктивная полицейская деятельность
Применимость в различных областях: принцип демонстрирует практическую ценность как в уголовном правосудии, так и в здравоохранении
Различие типов применения: карательное и поддерживающее применение требуют различных моральных соображений

Эффект инверсии между карательным и поддерживающим применением

Карательное применение: доказательства, не прошедшие CIP-тест, должны использоваться с осторожностью
Поддерживающее применение: непрохождение CIP-теста предоставляет дополнительное основание для использования доказательства в целях компенсирующего вмешательства

Анализ конкретных случаев

Программа профилактики диабета

Исторические данные показывают повышенный риск диабета в некоторых сообществах этнических меньшинств
Хотя доказательство не проходит CIP-тест, это усиливает обоснованность его использования для руководства профилактическим уходом

Общественное полицейское патрулирование

Исторические данные о преступлениях могут использоваться для поддерживающих вмешательств: улучшение уличного освещения, программы общественного посредничества
А не только для карательных мер: увеличение патрулей, расширение остановок и обысков

Связанные работы

Контекст исследований справедливости алгоритмов

Статистические стандарты справедливости: уравненные коэффициенты ошибок, калибровка и другие
Причинно-следственная справедливость: путь-специфичная контрфактическая справедливость Chiappa & Gillam
Контрфактическая справедливость: индивидуальный контрфактический подход Kusner и соавторов
Структурная несправедливость: теория комплексной несправедливости Hellman
Предиктивное правосудие: принцип предиктивного паритета Lazar & Stone

Уникальный вклад данной работы

Поворот к доказательственной теории: переход от внимания к выходным данным алгоритма к вниманию к моральному статусу самого доказательства
Анализ на уровне механизмов: глубокий анализ причинно-следственных механизмов, придающих доказательству убедительную силу
Дифференцированное руководство по применению: различные моральные стандарты для различных типов применения

Заключение и обсуждение

Основные выводы

CIP предоставляет новое моральное измерение оценивания: дополняет существующие теории справедливости алгоритмов
Моральный статус доказательства имеет значение: необходимо рассматривать не только статистическую производительность алгоритма, но и моральную приемлемость его доказательственной базы
Тип применения определяет моральные требования: карательное и поддерживающее применение требуют различных моральных стандартов

Ограничения

Эпистемологические вызовы контрфактического рассуждения: оценка миров без структурной несправедливости требует обоснованной причинно-следственной теории
Сложность определения сложных причинно-следственных механизмов: на практике может быть сложно точно определить все релевантные причинно-следственные механизмы
Размытость границ применения: граница между карательным и поддерживающим применением может быть неясной в некоторых случаях

Направления будущих исследований

Операционализация CIP: разработка более конкретных инструментов и руководств для применения CIP-теста
Расширение в другие области: применение принципа к образованию, занятости и другим чувствительным областям
Интеграция с существующими стандартами справедливости: изучение механизмов согласования CIP со статистическими стандартами справедливости

Глубокая оценка

Преимущества

Высокая концептуальная новизна: предлагает новое измерение в исследованиях справедливости алгоритмов, заполняя важный теоретический пробел
Прочная философская основа: успешно вводит идеи из теории доказательств и моральной философии в обсуждение справедливости алгоритмов
Высокая практическая ценность: предоставляет конкретную базу морального руководства для фактического развёртывания алгоритмов
Строгая аргументация: подробные анализы случаев и сравнительные аргументы поддерживают основные положения
Междисциплинарная интеграция: успешно объединяет перспективы компьютерных наук, философии, права и государственной политики

Недостатки

Вызовы операционализации: применение CIP-теста в сложных реальных сценариях может столкнуться с практическими трудностями
Зависимость от ценностных суждений: само определение того, что составляет "структурную несправедливость", включает ценностные суждения и может быть предметом споров
Вычислительная сложность: оценка контрфактических сценариев в сложных причинно-следственных сетях может быть вычислительно сложной
Культурная относительность: понимание справедливости может различаться в разных социальных и культурных контекстах

Оценка влияния

Академический вклад: открывает новое теоретическое направление в исследованиях справедливости алгоритмов
Политическая ценность: предоставляет важный справочный материал для разработки государственной политики в отношении использования алгоритмов
Практическое руководство: предоставляет разработчикам и развёртывающим алгоритмы лицам базу морального принятия решений
Междисциплинарное влияние: может влиять на соответствующие исследования в праве, государственной политике, этике и других областях

Применимые сценарии

Применение высокорисковых алгоритмов: особенно применимо к чувствительным областям, таким как уголовное правосудие, медицина и образование
Разработка политики: предоставляет теоретическую поддержку для разработки государственной политики управления алгоритмами
Аудит алгоритмов: предоставляет базу оценивания для аудита алгоритмов третьей стороной
Решения этических комитетов: предоставляет инструменты для оценки проектов алгоритмов этическими комитетами учреждений

Библиография

В статье цитируются важные работы из нескольких областей, включая справедливость алгоритмов, структурную несправедливость и теорию доказательств:

Справедливость алгоритмов: контрфактическая справедливость Kusner et al. (2017), путь-специфичная справедливость Chiappa & Gillam (2018)
Структурная несправедливость: теория структурной несправедливости Young (2011), комплексная несправедливость Hellman (2023)
Эмпирические исследования: обширные эмпирические исследования влияния политики красных линий, расовой сегрегации на преступность и здоровье
Правовая теория: соответствующая литература об использовании статистических доказательств в судебных разбирательствах

Данная статья предоставляет важный теоретический вклад в исследования справедливости алгоритмов. Предложенный принцип контрфактической независимости не только содержит глубокие философские идеи, но и обладает значительной практической ценностью. Несмотря на сохраняющиеся вызовы в области операционализации, работа указывает на важные направления для будущего развития этой области.