Introduction: Healthcare AI models often inherit biases from their training data. While efforts have primarily targeted bias in structured data, mental health heavily depends on unstructured data. This study aims to detect and mitigate linguistic differences related to non-biological differences in the training data of AI models designed to assist in pediatric mental health screening. Our objectives are: (1) to assess the presence of bias by evaluating outcome parity across sex subgroups, (2) to identify bias sources through textual distribution analysis, and (3) to develop a de-biasing method for mental health text data. Methods: We examined classification parity across demographic groups and assessed how gendered language influences model predictions. A data-centric de-biasing method was applied, focusing on neutralizing biased terms while retaining salient clinical information. This methodology was tested on a model for automatic anxiety detection in pediatric patients. Results: Our findings revealed a systematic under-diagnosis of female adolescent patients, with a 4% lower accuracy and a 9% higher False Negative Rate (FNR) compared to male patients, likely due to disparities in information density and linguistic differences in patient notes. Notes for male patients were on average 500 words longer, and linguistic similarity metrics indicated distinct word distributions between genders. Implementing our de-biasing approach reduced diagnostic bias by up to 27%, demonstrating its effectiveness in enhancing equity across demographic groups. Discussion: We developed a data-centric de-biasing framework to address gender-based content disparities within clinical text. By neutralizing biased language and enhancing focus on clinically essential information, our approach demonstrates an effective strategy for mitigating bias in AI healthcare models trained on text.
- ID статьи: 2501.00129
- Название: A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection
- Авторы: Julia Ive, Paulina Bondaronek, Vishal Yadav, Daniel Santel, Tracy Glauser, Tina Cheng, Jeffrey R. Strawn, Greeshma Agasthya, Jordan Tschida, Sanghyun Choo, Mayanka Chandrashekar, Anuj J. Kapadia, John Pestian
- Классификация: cs.CL cs.AI
- Учреждения: University College London, Queen Mary University of London, Cincinnati Children's Hospital Medical Center, Oak Ridge National Laboratory и др.
- Тип статьи: Исследовательская работа
В данном исследовании предлагается подход к устранению демографической предвзятости, ориентированный на данные, для моделей искусственного интеллекта в области детского психического здоровья. Исследование выявило систематическое недодиагностирование у пациентов женского пола подросткового возраста с точностью на 4% ниже, чем у пациентов мужского пола, и уровнем ложноотрицательных результатов на 9% выше. Благодаря методам устранения предвзятости, включающим фильтрацию информационной плотности и замену гендерно-нейтральных слов, удалось сократить диагностическую предвзятость на 27%, предоставив эффективное решение для справедливости медицинского ИИ.
- Распространённость предвзятости ИИ: Модели медицинского ИИ часто наследуют предвзятость из обучающих данных, что может усугубить медицинское неравенство, особенно для меньшинств
- Специфика психического здоровья: Психическое здоровье в значительной степени зависит от неструктурированных текстовых данных (клинические заметки), в то время как существующие исследования по устранению предвзятости сосредоточены в основном на структурированных данных
- Кризис психического здоровья детей: После COVID-19 распространённость симптомов тревожности у детей удвоилась, особенно среди подростков женского пола
- Сложность и вызовы скрининга психического здоровья у детей
- Огромный потенциал ИИ в расширении диагностики психического здоровья
- Срочная необходимость обеспечения справедливого и эффективного применения инструментов ИИ в различных популяциях
- Традиционные методы устранения предвзятости (такие как деобиасирование словесных вложений, состязательное обучение) неприменимы в медицинской области
- Гетерогенность медицинских данных (из различных медицинских учреждений) не получила должного внимания
- Отсутствие специализированной структуры деобиасирования для медицинских текстов
- Выявление систематической предвзятости: Впервые выявлена и количественно оценена гендерная предвзятость при выявлении тревожности у детей, с значительно более высоким уровнем ложноотрицательных результатов у пациентов женского пола
- Структура деобиасирования, ориентированная на данные: Предложены методы деобиасирования, специально адаптированные для медицинских текстов, включая фильтрацию информационной плотности и нейтрализацию гендерных слов
- Проверка эффективности: Валидация методов на реальных клинических данных с сокращением диагностической предвзятости до 27%
- Анализ интерпретируемости: Использование технологии LIME для анализа словарного запаса, на котором основаны решения модели, выявление источников предвзятости
Входные данные: Последовательность текстов клинических заметок пациента-ребёнка
Выходные данные: Двоичная классификация (тревожность/отсутствие тревожности)
Цель: Сокращение различий в производительности между группами разного пола при сохранении точности прогнозирования
Использование нескольких показателей для оценки предвзятости модели:
- Сбалансированный коэффициент ошибок (BER):
BER=2(FP+TNFP)+(FN+TPFN)
- Коэффициент ложноотрицательных результатов (FNR): Измерение частоты пропусков диагноза
- Коэффициент ложноположительных результатов (FPR): Измерение частоты ошибочных диагнозов
- Коэффициент BER: Отношение BER непривилегированной группы к привилегированной группе, >1,25 указывает на значительную предвзятость
Анализ различий в текстовых характеристиках между популяциями разного пола:
- Средняя длина заметки
- Процент медицинской терминологии
- Процент словарного запаса с гендерной предвзятостью
- Расстояние Жаккара и оценки знакомства
- Использование оценок TF-IDF для расчёта важности предложения
- Удаление 20% предложений с наименьшей информационной ценностью
- Балансировка информационной плотности между различными группами
- Автоматическое выявление имён и местоимений и других слов с гендерной предвзятостью
- Использование инструмента Stanza для извлечения собственных имён
- Замена гендерно-специфичных слов нейтральными альтернативами
- Имена → "person1", "person2" и т.д.
- Местоимения → "he/she" → "they"
Объединение фильтрации информационной плотности и замены гендерных слов для синергетического эффекта
- Модель Transformer на основе Clinical-BigBird
- Предварительно обучена на клинических текстах
- Поддерживает длинные последовательности входных данных (до 4 096 токенов)
- Параметры тонкой настройки: 2 эпохи, скорость обучения 1e-5, размер пакета 8
- Источник: Cincinnati Children's Hospital Medical Center
- Масштаб: 1,3 млн пациентов, 63 млн клинических заметок
- Временной диапазон: январь 2009 г. – март 2022 г.
- Случаи тревожности: 84 426 случаев, прошедших критерии отбора
- Окончательные данные: 73 288 пациентов, 7,81 млн заметок
- Разделение на 5 возрастных групп: 5, 8, 10, 12, 15 лет
- 3 700–5 064 обучающих образца на группу
- 852–1 278 тестовых образцов на группу
- Сопоставление случай-контроль 1:1 (по возрасту и полу)
- Дедупликация: заметки с косинусным сходством ≥0,8
- Выбор последних 25 заметок
- Ограничение длины входных данных 1 000 токенами
- Точность (Accuracy)
- Коэффициент ложноотрицательных результатов (FNR) – основной показатель
- Коэффициент ложноположительных результатов (FPR)
- Сбалансированный коэффициент ошибок (BER)
- Процент неопределённых прогнозов (вероятность в диапазоне 0,4, 0,6)
| Показатель | Мужчины | Женщины | Разница |
|---|
| Точность | – | –4% | Ниже у женщин |
| FNR | – | +9% | Выше у женщин |
| Неопределённые прогнозы | – | +5% | Выше у женщин |
| Длина заметки | Базовая | –500 слов | Короче у женщин |
- Сходство словарного запаса: Индекс Жаккара 0,54 (между мужчинами и женщинами)
- Распределение терминов: Индекс Жаккара 0,34 (значительные различия)
- Минимальное сходство: Группы 5 и 15 лет (Жаккар 0,43)
Оптимальный метод (tf-idf_filt):
- Сокращение разрыва FNR на 0,024 (улучшение на 27%)
- Bin 5: разрыв FNR снизился с 0,13 до 0,02
- Bin 15: разрыв FNR снизился с 0,13 до 0,07
- Коэффициент BER снизился с 1,33 до 0,98 (Bin 10)
| Метод | Улучшение FNR | Сохранение производительности | Снижение неопределённости |
|---|
| rnd_filt | Без последовательного эффекта | ✓ | – |
| tf-idf_filt | –0,024 | ✓ | –4% |
| gen_sub | +0,008 | ✓ | –3% |
| Комбинированный метод | –0,022 | ✓ | –12% |
Использование LIME для анализа словарного запаса, на котором основаны решения модели:
- Исходная модель: 10% случаев прогнозирования зависят от слов с предвзятостью
- tf-idf_filt: Сокращение до 3%
- Комбинированный метод: Снижение частоты слов с предвзятостью на 50%
- Средний FNR для других расовых групп выше на 0,05
- Комбинированный метод сократил разрыв FNR на 0,034
- Доказывает универсальность метода
- Методы предварительной обработки: переборка, увеличение данных
- Модификация алгоритмов: состязательное деобиасирование, модификация целевой функции
- Методы постобработки: калибровка, преобразование вложений
- Обмен атрибутами: обмен словами с чувствительными атрибутами
- Деобиасирование вложений: удаление гендерного компонента из словесных вложений
- Состязательное обучение: наказание прогнозов, зависящих от защищённых атрибутов
- Расовая предвзятость в коммерческих алгоритмах прогнозирования
- Групповые различия в прогнозировании риска самоубийства
- Демографическая предвзятость в моделях патологии
- Распространённость предвзятости: Модели выявления тревожности у детей демонстрируют систематическое недодиагностирование у пациентов женского пола
- Различия в текстах – источник проблемы: Заметки пациентов разного пола существенно отличаются по информационной плотности и языковому распределению
- Эффективность подхода, ориентированного на данные: Балансировка информационной плотности и языковая нейтрализация значительно сокращают предвзятость
- Клиническое значение: Сокращение предвзятости на 27% имеет важное значение для улучшения диагностики у пациентов женского пола
- Зависимость от качества данных: Эффективность метода ограничена качеством и согласованностью текстов электронных медицинских записей
- Единственный тип предвзятости: Сосредоточение только на гендерной предвзятости без учёта других демографических характеристик
- Способность к обобщению: Необходимо дальнейшее подтверждение способности к обобщению в различных клинических условиях
- Биологические различия: Сложность полного разделения биологических и социокультурных различий
- Расширение на другие заболевания психического здоровья и популяции
- Разработка более тонких методов выявления и смягчения предвзятости
- Интеграция многомодальных данных (текст + структурированные данные)
- Установление стандартизированной структуры оценки справедливости медицинского ИИ
- Важность проблемы: Сосредоточение на критической области детского психического здоровья с важной социальной ценностью
- Инновационность методов: Предложение структуры деобиасирования, ориентированной на данные, специально адаптированной для медицинских текстов
- Полнота экспериментов: Валидация на крупномасштабных реальных клинических данных с многомерным анализом предвзятости
- Практическая ценность: Простые и эффективные методы, легко развёртываемые в клинической среде
- Интерпретируемость: Использование технологий LIME и других методов для обеспечения интерпретируемого анализа решений модели
- Теоретическая глубина: Отсутствие глубокого теоретического анализа механизмов возникновения предвзятости
- Ограничения методов: Методы деобиасирования относительно просты, что может привести к чрезмерному упрощению
- Единственность оценки: Основной акцент на справедливости классификации без учёта других аспектов справедливости, таких как калибровка
- Долгосрочное воздействие: Отсутствие оценки влияния деобиасирования на долгосрочную производительность и способность модели к обобщению
- Академический вклад: Предоставление важного тематического исследования и методологического справочника для исследований предвзятости в медицинском NLP
- Практическая ценность: Предоставление конкретных решений для улучшения справедливости клинических систем ИИ
- Политическое значение: Предоставление технической поддержки для регулирования и стандартизации справедливости медицинского ИИ
- Воспроизводимость: Подробное описание методов с хорошей воспроизводимостью
- Системы поддержки клинических решений: Скрининг и диагностическая помощь при психических расстройствах
- Улучшение качества медицинского обслуживания: Выявление и смягчение предвзятости в существующих системах медицинского ИИ
- Нормативное соответствие: Соответствие требованиям справедливости и этики медицинского ИИ
- Исследовательский инструмент: Предоставление методологической основы для других исследований предвзятости в медицинском ИИ
В статье цитируются важные работы в области справедливости машинного обучения, деобиасирования NLP и медицинского ИИ, включая:
- Feldman et al. (2015) – Стандарты измерения справедливости
- Bolukbasi et al. (2016) – Деобиасирование словесных вложений
- Obermeyer et al. (2019) – Расовая предвзятость в медицинских алгоритмах
- Ribeiro et al. (2016) – Метод интерпретируемости LIME
Общая оценка: Это исследовательская работа, имеющая важное значение в области справедливости медицинского ИИ. Она не только выявляет проблему гендерной предвзятости в ИИ для детского психического здоровья, но и предлагает практические решения. Хотя существует место для улучшения в теоретической глубине и сложности методов, её практическая ценность и социальное значение делают её важным вкладом в эту область.