2025-11-16T13:49:12.700878

A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection

Ive, Bondaronek, Yadav et al.

Introduction: Healthcare AI models often inherit biases from their training data. While efforts have primarily targeted bias in structured data, mental health heavily depends on unstructured data. This study aims to detect and mitigate linguistic differences related to non-biological differences in the training data of AI models designed to assist in pediatric mental health screening. Our objectives are: (1) to assess the presence of bias by evaluating outcome parity across sex subgroups, (2) to identify bias sources through textual distribution analysis, and (3) to develop a de-biasing method for mental health text data. Methods: We examined classification parity across demographic groups and assessed how gendered language influences model predictions. A data-centric de-biasing method was applied, focusing on neutralizing biased terms while retaining salient clinical information. This methodology was tested on a model for automatic anxiety detection in pediatric patients. Results: Our findings revealed a systematic under-diagnosis of female adolescent patients, with a 4% lower accuracy and a 9% higher False Negative Rate (FNR) compared to male patients, likely due to disparities in information density and linguistic differences in patient notes. Notes for male patients were on average 500 words longer, and linguistic similarity metrics indicated distinct word distributions between genders. Implementing our de-biasing approach reduced diagnostic bias by up to 27%, demonstrating its effectiveness in enhancing equity across demographic groups. Discussion: We developed a data-centric de-biasing framework to address gender-based content disparities within clinical text. By neutralizing biased language and enhancing focus on clinically essential information, our approach demonstrates an effective strategy for mitigating bias in AI healthcare models trained on text.

academic

Une Approche Centrée sur les Données pour Détecter et Atténuer les Biais Démographiques dans les Textes de Santé Mentale Pédiatrique : Une Étude de Cas sur la Détection de l'Anxiété

Informations Fondamentales

ID de l'article: 2501.00129
Titre: A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection
Auteurs: Julia Ive, Paulina Bondaronek, Vishal Yadav, Daniel Santel, Tracy Glauser, Tina Cheng, Jeffrey R. Strawn, Greeshma Agasthya, Jordan Tschida, Sanghyun Choo, Mayanka Chandrashekar, Anuj J. Kapadia, John Pestian
Classification: cs.CL cs.AI
Institutions: University College London, Queen Mary University of London, Cincinnati Children's Hospital Medical Center, Oak Ridge National Laboratory, etc.
Type d'article: Article de recherche

Résumé

Cette étude aborde la question des biais démographiques dans les modèles d'IA de santé mentale pédiatrique en proposant une approche de débiaisage centrée sur les données. L'étude révèle un sous-diagnostic systématique chez les adolescentes, avec une précision inférieure de 4 % par rapport aux patients masculins et un taux de faux négatifs supérieur de 9 %. Grâce à des méthodes de débiaisage incluant le filtrage par densité informationnelle et la substitution de termes neutres sur le plan du genre, le biais diagnostique a été réduit de 27 %, offrant une solution efficace pour l'équité de l'IA médicale.

Contexte et Motivation de la Recherche

Identification du Problème

Prévalence des biais en IA: Les modèles d'IA médicale héritent fréquemment des biais présents dans les données d'entraînement, pouvant exacerber les inégalités en matière de santé, particulièrement pour les groupes minoritaires
Spécificité de la santé mentale: La santé mentale dépend fortement de données textuelles non structurées (notes cliniques), alors que les recherches existantes sur le débiaisage se concentrent principalement sur les données structurées
Crise de la santé mentale pédiatrique: La prévalence des symptômes d'anxiété chez les enfants a doublé après la COVID-19, particulièrement chez les adolescentes

Importance

Complexité et défis du dépistage de la santé mentale chez l'enfant
Potentiel considérable de l'IA pour élargir le diagnostic en santé mentale
Besoin urgent d'assurer l'équité et l'efficacité des outils d'IA dans différents groupes de population

Limitations des Approches Existantes

Les techniques de débiaisage traditionnelles (comme le débiaisage des plongements de mots, l'entraînement adversarial) ne s'appliquent pas au domaine médical
L'hétérogénéité des données médicales (provenant de différentes institutions) n'a pas été suffisamment prise en compte
Absence de cadre de débiaisage spécialisé pour les textes médicaux

Contributions Principales

Identification systématique des biais: Première identification et quantification des biais de genre dans la détection de l'anxiété pédiatrique, avec un taux de faux négatifs significativement plus élevé chez les patientes
Cadre de débiaisage centré sur les données: Proposition de méthodes de débiaisage spécialement adaptées aux textes médicaux, incluant le filtrage par densité informationnelle et la neutralisation des termes de genre
Validation de l'efficacité: Vérification de l'efficacité de la méthode sur des données cliniques réelles, réduisant le biais diagnostique jusqu'à 27 %
Analyse d'interprétabilité: Utilisation de la technique LIME pour analyser le vocabulaire sur lequel reposent les décisions du modèle, révélant les sources de biais

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée: Séquence de texte de notes cliniques de patients pédiatriques Sortie: Prédiction binaire (anxiété/pas d'anxiété) Objectif: Réduire les écarts de performance entre les groupes de genres différents tout en maintenant la précision prédictive

Cadre de Détection des Biais

1. Évaluation de l'Équité de Classification

Évaluation des biais du modèle à l'aide de plusieurs métriques:

Taux d'Erreur Équilibré (BER): $BER = \frac{(\frac{FP}{FP+TN}) + (\frac{FN}{FN+TP})}{2}$
Taux de Faux Négatifs (FNR): Mesure le taux de non-diagnostic
Taux de Faux Positifs (FPR): Mesure le taux de diagnostic erroné
Ratio BER: Rapport du BER du groupe non privilégié au groupe privilégié, >1,25 indique un biais significatif

2. Analyse de la Distribution Textuelle

Analyse des différences dans les caractéristiques textuelles entre groupes de population:

Longueur moyenne des notes
Pourcentage de terminologie médicale
Pourcentage de vocabulaire biaisé par le genre
Distance de Jaccard et scores de familiarité

Méthodes de Débiaisage

1. Filtrage par Densité Informationnelle (tf-idf_filt)

Calcul de l'importance des phrases à l'aide de scores TF-IDF
Suppression des 20 % de phrases avec le moins d'information
Équilibrage de la densité informationnelle entre différents groupes

2. Débiaisage des Termes de Genre (gen_sub)

Détection automatique des noms propres et pronoms biaisés par le genre
Extraction des noms propres à l'aide de l'outil Stanza
Remplacement des termes spécifiques au genre par des alternatives neutres
- Noms propres → "person1", "person2", etc.
- Pronoms → "he/she" → "they"

3. Méthode Combinée (tf-idf_filt+gen_sub)

Combinaison du filtrage par densité informationnelle et de la substitution de termes de genre pour exploiter les effets synergiques

Architecture du Modèle

Modèle Transformer basé sur Clinical-BigBird
Pré-entraîné spécifiquement sur des textes cliniques
Support des entrées de longues séquences (jusqu'à 4 096 tokens)
Paramètres d'ajustement fin: 2 epochs, taux d'apprentissage 1e-5, taille de lot 8

Configuration Expérimentale

Ensemble de Données

Source: Cincinnati Children's Hospital Medical Center
Taille: 1,3 million de patients, 63 millions de notes cliniques
Période: Janvier 2009 - Mars 2022
Cas d'anxiété: 84 426 cas répondant aux critères de sélection
Données finales: 73 288 patients, 7,81 millions de notes

Stratégie de Regroupement par Âge

Division en 5 groupes d'âge: 5, 8, 10, 12, 15 ans
3 700 à 5 064 échantillons d'entraînement par groupe
852 à 1 278 échantillons de test
Appariement cas-témoin 1:1 (par âge et genre)

Prétraitement des Données

Dédoublonnage: notes avec similarité cosinus ≥ 0,8
Sélection des 25 notes les plus récentes
Limitation de la longueur d'entrée à 1 000 tokens

Métriques d'Évaluation

Précision (Accuracy)
Taux de Faux Négatifs (FNR) - métrique principale
Taux de Faux Positifs (FPR)
Taux d'Erreur Équilibré (BER)
Pourcentage de prédictions incertaines (probabilité dans l'intervalle 0,4, 0,6)

Résultats Expérimentaux

Principales Conclusions

1. Biais de Genre Systématique

Métrique	Hommes	Femmes	Différence
Précision	-	-4%	Plus faible chez les femmes
FNR	-	+9%	Plus élevé chez les femmes
Prédictions incertaines	-	+5%	Plus élevé chez les femmes
Longueur des notes	Référence	-500 mots	Plus court chez les femmes

2. Différences de Distribution Textuelle

Similarité lexicale: Indice de Jaccard 0,54 (entre hommes et femmes)
Distribution des termes: Indice de Jaccard 0,34 (différence significative)
Similarité minimale: Groupes d'âge 5 et 15 ans (Jaccard 0,43)

3. Effets du Débiaisage

Meilleure méthode (tf-idf_filt):

Réduction de l'écart FNR de 0,024 (amélioration de 27 %)
Bin 5: Écart FNR réduit de 0,13 à 0,02
Bin 15: Écart FNR réduit de 0,13 à 0,07
Ratio BER réduit de 1,33 à 0,98 (Bin 10)

Études d'Ablation

Méthode	Amélioration FNR	Maintien de Performance	Réduction d'Incertitude
rnd_filt	Aucun effet cohérent	✓	-
tf-idf_filt	-0,024	✓	-4%
gen_sub	+0,008	✓	-3%
Méthode combinée	-0,022	✓	-12%

Analyse d'Interprétabilité

Analyse à l'aide de LIME du vocabulaire sur lequel repose le modèle:

Modèle original: 10 % des cas de prédiction dépendent de vocabulaire biaisé
tf-idf_filt: Réduit à 3 %
Méthode combinée: Fréquence du vocabulaire biaisé réduite de 50 %

Validation Interraciale

FNR moyen 0,05 plus élevé pour les autres groupes raciaux
La méthode combinée réduit l'écart FNR de 0,034
Démontre l'applicabilité générale de la méthode

Travaux Connexes

Équité en Apprentissage Automatique

Techniques de prétraitement: rééchantillonnage, augmentation de données
Modifications algorithmiques: débiaisage adversarial, modification de la fonction objectif
Techniques de post-traitement: calibrage, transformation d'embeddings

Méthodes de Débiaisage en NLP

Échange d'attributs: échange de vocabulaire d'attributs sensibles
Débiaisage d'embeddings: suppression de la composante de genre dans les embeddings de mots
Entraînement adversarial: pénalisation des prédictions influencées par les attributs protégés

Biais en IA Médicale

Biais raciaux dans les algorithmes de prédiction commerciaux
Disparités de groupes dans la prédiction du risque suicidaire
Biais démographiques dans les modèles de pathologie

Conclusions et Discussion

Conclusions Principales

Ubiquité des biais: Les modèles de détection de l'anxiété pédiatrique présentent un sous-diagnostic systématique chez les patientes
Différences textuelles comme source: Différences significatives dans la densité informationnelle et la distribution linguistique des notes entre patients de genres différents
Efficacité de l'approche centrée sur les données: L'équilibrage de la densité informationnelle et la neutralisation du langage réduisent significativement les biais
Importance clinique: La réduction de 27 % des biais a une valeur importante pour améliorer le diagnostic chez les patientes

Limitations

Dépendance à la qualité des données: L'efficacité de la méthode est limitée par la qualité et la cohérence du texte des dossiers médicaux électroniques
Type de biais unique: Concentration sur les biais de genre, sans considération d'autres caractéristiques démographiques
Capacité de généralisation: La capacité de généralisation dans différents environnements cliniques nécessite une vérification supplémentaire
Différences biologiques: Difficulté à distinguer complètement les différences biologiques des différences socioculturelles

Directions Futures

Extension à d'autres maladies de santé mentale et groupes de population
Développement de techniques de détection et d'atténuation des biais plus raffinées
Intégration de données multimodales (texte + données structurées)
Établissement d'un cadre normalisé d'évaluation de l'équité en IA médicale

Évaluation Approfondie

Points Forts

Importance du problème: Concentration sur le domaine critique de la santé mentale pédiatrique, avec une valeur sociale importante
Innovation méthodologique: Proposition d'un cadre de débiaisage centré sur les données spécialement adapté aux textes médicaux
Suffisance expérimentale: Vérification sur des données cliniques réelles à grande échelle, analyse multidimensionnelle des biais
Valeur pratique: Méthodes simples et efficaces, faciles à déployer dans les environnements cliniques
Interprétabilité: Fourniture d'analyses interprétables des décisions du modèle à l'aide de techniques comme LIME

Insuffisances

Profondeur théorique: Manque d'analyse théorique approfondie des mécanismes de génération des biais
Limitations méthodologiques: Les méthodes de débiaisage sont relativement simples, pouvant présenter des risques de sursimp lification
Évaluation unique: Concentration principale sur l'équité de classification, manque d'autres dimensions d'équité comme l'étalonnage
Impact à long terme: Absence d'évaluation des effets du débiaisage sur la performance à long terme et la capacité de généralisation du modèle

Impact

Contribution académique: Fourniture d'études de cas et de références méthodologiques importantes pour la recherche sur les biais en IA médicale et NLP
Valeur pratique: Fourniture de solutions concrètes pour l'amélioration de l'équité des systèmes d'IA cliniques
Signification politique: Soutien technique pour la réglementation et l'établissement de normes pour l'IA médicale
Reproductibilité: Description détaillée de la méthode, avec bonne reproductibilité

Scénarios d'Application

Systèmes d'aide à la décision clinique: Systèmes de dépistage et d'assistance au diagnostic en santé mentale
Amélioration de la qualité médicale: Identification et atténuation des biais dans les systèmes d'IA médicale existants
Conformité réglementaire: Satisfaction des exigences d'équité et d'éthique en IA médicale
Outils de recherche: Fourniture de base méthodologique pour d'autres recherches sur les biais en IA médicale

Références

Cet article cite des travaux importants dans les domaines de l'équité en apprentissage automatique, du débiaisage en NLP et de l'IA médicale, notamment:

Feldman et al. (2015) - Métriques d'équité
Bolukbasi et al. (2016) - Débiaisage d'embeddings de mots
Obermeyer et al. (2019) - Biais raciaux dans les algorithmes médicaux
Ribeiro et al. (2016) - Méthode d'interprétabilité LIME

Évaluation Globale: Cet article de recherche possède une valeur importante dans le domaine de l'équité en IA médicale. Non seulement il identifie le problème des biais de genre dans l'IA de santé mentale pédiatrique, mais il propose également des solutions pratiques. Bien qu'il y ait une marge d'amélioration en termes de profondeur théorique et de complexité méthodologique, sa valeur pratique et son importance sociale en font une contribution importante au domaine.