2025-11-16T13:49:12.700878

A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection

Ive, Bondaronek, Yadav et al.
Introduction: Healthcare AI models often inherit biases from their training data. While efforts have primarily targeted bias in structured data, mental health heavily depends on unstructured data. This study aims to detect and mitigate linguistic differences related to non-biological differences in the training data of AI models designed to assist in pediatric mental health screening. Our objectives are: (1) to assess the presence of bias by evaluating outcome parity across sex subgroups, (2) to identify bias sources through textual distribution analysis, and (3) to develop a de-biasing method for mental health text data. Methods: We examined classification parity across demographic groups and assessed how gendered language influences model predictions. A data-centric de-biasing method was applied, focusing on neutralizing biased terms while retaining salient clinical information. This methodology was tested on a model for automatic anxiety detection in pediatric patients. Results: Our findings revealed a systematic under-diagnosis of female adolescent patients, with a 4% lower accuracy and a 9% higher False Negative Rate (FNR) compared to male patients, likely due to disparities in information density and linguistic differences in patient notes. Notes for male patients were on average 500 words longer, and linguistic similarity metrics indicated distinct word distributions between genders. Implementing our de-biasing approach reduced diagnostic bias by up to 27%, demonstrating its effectiveness in enhancing equity across demographic groups. Discussion: We developed a data-centric de-biasing framework to address gender-based content disparities within clinical text. By neutralizing biased language and enhancing focus on clinically essential information, our approach demonstrates an effective strategy for mitigating bias in AI healthcare models trained on text.
academic

Une Approche Centrée sur les Données pour Détecter et Atténuer les Biais Démographiques dans les Textes de Santé Mentale Pédiatrique : Une Étude de Cas sur la Détection de l'Anxiété

Informations Fondamentales

  • ID de l'article: 2501.00129
  • Titre: A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection
  • Auteurs: Julia Ive, Paulina Bondaronek, Vishal Yadav, Daniel Santel, Tracy Glauser, Tina Cheng, Jeffrey R. Strawn, Greeshma Agasthya, Jordan Tschida, Sanghyun Choo, Mayanka Chandrashekar, Anuj J. Kapadia, John Pestian
  • Classification: cs.CL cs.AI
  • Institutions: University College London, Queen Mary University of London, Cincinnati Children's Hospital Medical Center, Oak Ridge National Laboratory, etc.
  • Type d'article: Article de recherche

Résumé

Cette étude aborde la question des biais démographiques dans les modèles d'IA de santé mentale pédiatrique en proposant une approche de débiaisage centrée sur les données. L'étude révèle un sous-diagnostic systématique chez les adolescentes, avec une précision inférieure de 4 % par rapport aux patients masculins et un taux de faux négatifs supérieur de 9 %. Grâce à des méthodes de débiaisage incluant le filtrage par densité informationnelle et la substitution de termes neutres sur le plan du genre, le biais diagnostique a été réduit de 27 %, offrant une solution efficace pour l'équité de l'IA médicale.

Contexte et Motivation de la Recherche

Identification du Problème

  1. Prévalence des biais en IA: Les modèles d'IA médicale héritent fréquemment des biais présents dans les données d'entraînement, pouvant exacerber les inégalités en matière de santé, particulièrement pour les groupes minoritaires
  2. Spécificité de la santé mentale: La santé mentale dépend fortement de données textuelles non structurées (notes cliniques), alors que les recherches existantes sur le débiaisage se concentrent principalement sur les données structurées
  3. Crise de la santé mentale pédiatrique: La prévalence des symptômes d'anxiété chez les enfants a doublé après la COVID-19, particulièrement chez les adolescentes

Importance

  • Complexité et défis du dépistage de la santé mentale chez l'enfant
  • Potentiel considérable de l'IA pour élargir le diagnostic en santé mentale
  • Besoin urgent d'assurer l'équité et l'efficacité des outils d'IA dans différents groupes de population

Limitations des Approches Existantes

  • Les techniques de débiaisage traditionnelles (comme le débiaisage des plongements de mots, l'entraînement adversarial) ne s'appliquent pas au domaine médical
  • L'hétérogénéité des données médicales (provenant de différentes institutions) n'a pas été suffisamment prise en compte
  • Absence de cadre de débiaisage spécialisé pour les textes médicaux

Contributions Principales

  1. Identification systématique des biais: Première identification et quantification des biais de genre dans la détection de l'anxiété pédiatrique, avec un taux de faux négatifs significativement plus élevé chez les patientes
  2. Cadre de débiaisage centré sur les données: Proposition de méthodes de débiaisage spécialement adaptées aux textes médicaux, incluant le filtrage par densité informationnelle et la neutralisation des termes de genre
  3. Validation de l'efficacité: Vérification de l'efficacité de la méthode sur des données cliniques réelles, réduisant le biais diagnostique jusqu'à 27 %
  4. Analyse d'interprétabilité: Utilisation de la technique LIME pour analyser le vocabulaire sur lequel reposent les décisions du modèle, révélant les sources de biais

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée: Séquence de texte de notes cliniques de patients pédiatriques Sortie: Prédiction binaire (anxiété/pas d'anxiété) Objectif: Réduire les écarts de performance entre les groupes de genres différents tout en maintenant la précision prédictive

Cadre de Détection des Biais

1. Évaluation de l'Équité de Classification

Évaluation des biais du modèle à l'aide de plusieurs métriques:

  • Taux d'Erreur Équilibré (BER): BER=(FPFP+TN)+(FNFN+TP)2BER = \frac{(\frac{FP}{FP+TN}) + (\frac{FN}{FN+TP})}{2}
  • Taux de Faux Négatifs (FNR): Mesure le taux de non-diagnostic
  • Taux de Faux Positifs (FPR): Mesure le taux de diagnostic erroné
  • Ratio BER: Rapport du BER du groupe non privilégié au groupe privilégié, >1,25 indique un biais significatif

2. Analyse de la Distribution Textuelle

Analyse des différences dans les caractéristiques textuelles entre groupes de population:

  • Longueur moyenne des notes
  • Pourcentage de terminologie médicale
  • Pourcentage de vocabulaire biaisé par le genre
  • Distance de Jaccard et scores de familiarité

Méthodes de Débiaisage

1. Filtrage par Densité Informationnelle (tf-idf_filt)

  • Calcul de l'importance des phrases à l'aide de scores TF-IDF
  • Suppression des 20 % de phrases avec le moins d'information
  • Équilibrage de la densité informationnelle entre différents groupes

2. Débiaisage des Termes de Genre (gen_sub)

  • Détection automatique des noms propres et pronoms biaisés par le genre
  • Extraction des noms propres à l'aide de l'outil Stanza
  • Remplacement des termes spécifiques au genre par des alternatives neutres
    • Noms propres → "person1", "person2", etc.
    • Pronoms → "he/she" → "they"

3. Méthode Combinée (tf-idf_filt+gen_sub)

Combinaison du filtrage par densité informationnelle et de la substitution de termes de genre pour exploiter les effets synergiques

Architecture du Modèle

  • Modèle Transformer basé sur Clinical-BigBird
  • Pré-entraîné spécifiquement sur des textes cliniques
  • Support des entrées de longues séquences (jusqu'à 4 096 tokens)
  • Paramètres d'ajustement fin: 2 epochs, taux d'apprentissage 1e-5, taille de lot 8

Configuration Expérimentale

Ensemble de Données

  • Source: Cincinnati Children's Hospital Medical Center
  • Taille: 1,3 million de patients, 63 millions de notes cliniques
  • Période: Janvier 2009 - Mars 2022
  • Cas d'anxiété: 84 426 cas répondant aux critères de sélection
  • Données finales: 73 288 patients, 7,81 millions de notes

Stratégie de Regroupement par Âge

  • Division en 5 groupes d'âge: 5, 8, 10, 12, 15 ans
  • 3 700 à 5 064 échantillons d'entraînement par groupe
  • 852 à 1 278 échantillons de test
  • Appariement cas-témoin 1:1 (par âge et genre)

Prétraitement des Données

  • Dédoublonnage: notes avec similarité cosinus ≥ 0,8
  • Sélection des 25 notes les plus récentes
  • Limitation de la longueur d'entrée à 1 000 tokens

Métriques d'Évaluation

  • Précision (Accuracy)
  • Taux de Faux Négatifs (FNR) - métrique principale
  • Taux de Faux Positifs (FPR)
  • Taux d'Erreur Équilibré (BER)
  • Pourcentage de prédictions incertaines (probabilité dans l'intervalle 0,4, 0,6)

Résultats Expérimentaux

Principales Conclusions

1. Biais de Genre Systématique

MétriqueHommesFemmesDifférence
Précision--4%Plus faible chez les femmes
FNR-+9%Plus élevé chez les femmes
Prédictions incertaines-+5%Plus élevé chez les femmes
Longueur des notesRéférence-500 motsPlus court chez les femmes

2. Différences de Distribution Textuelle

  • Similarité lexicale: Indice de Jaccard 0,54 (entre hommes et femmes)
  • Distribution des termes: Indice de Jaccard 0,34 (différence significative)
  • Similarité minimale: Groupes d'âge 5 et 15 ans (Jaccard 0,43)

3. Effets du Débiaisage

Meilleure méthode (tf-idf_filt):

  • Réduction de l'écart FNR de 0,024 (amélioration de 27 %)
  • Bin 5: Écart FNR réduit de 0,13 à 0,02
  • Bin 15: Écart FNR réduit de 0,13 à 0,07
  • Ratio BER réduit de 1,33 à 0,98 (Bin 10)

Études d'Ablation

MéthodeAmélioration FNRMaintien de PerformanceRéduction d'Incertitude
rnd_filtAucun effet cohérent-
tf-idf_filt-0,024-4%
gen_sub+0,008-3%
Méthode combinée-0,022-12%

Analyse d'Interprétabilité

Analyse à l'aide de LIME du vocabulaire sur lequel repose le modèle:

  • Modèle original: 10 % des cas de prédiction dépendent de vocabulaire biaisé
  • tf-idf_filt: Réduit à 3 %
  • Méthode combinée: Fréquence du vocabulaire biaisé réduite de 50 %

Validation Interraciale

  • FNR moyen 0,05 plus élevé pour les autres groupes raciaux
  • La méthode combinée réduit l'écart FNR de 0,034
  • Démontre l'applicabilité générale de la méthode

Travaux Connexes

Équité en Apprentissage Automatique

  • Techniques de prétraitement: rééchantillonnage, augmentation de données
  • Modifications algorithmiques: débiaisage adversarial, modification de la fonction objectif
  • Techniques de post-traitement: calibrage, transformation d'embeddings

Méthodes de Débiaisage en NLP

  • Échange d'attributs: échange de vocabulaire d'attributs sensibles
  • Débiaisage d'embeddings: suppression de la composante de genre dans les embeddings de mots
  • Entraînement adversarial: pénalisation des prédictions influencées par les attributs protégés

Biais en IA Médicale

  • Biais raciaux dans les algorithmes de prédiction commerciaux
  • Disparités de groupes dans la prédiction du risque suicidaire
  • Biais démographiques dans les modèles de pathologie

Conclusions et Discussion

Conclusions Principales

  1. Ubiquité des biais: Les modèles de détection de l'anxiété pédiatrique présentent un sous-diagnostic systématique chez les patientes
  2. Différences textuelles comme source: Différences significatives dans la densité informationnelle et la distribution linguistique des notes entre patients de genres différents
  3. Efficacité de l'approche centrée sur les données: L'équilibrage de la densité informationnelle et la neutralisation du langage réduisent significativement les biais
  4. Importance clinique: La réduction de 27 % des biais a une valeur importante pour améliorer le diagnostic chez les patientes

Limitations

  1. Dépendance à la qualité des données: L'efficacité de la méthode est limitée par la qualité et la cohérence du texte des dossiers médicaux électroniques
  2. Type de biais unique: Concentration sur les biais de genre, sans considération d'autres caractéristiques démographiques
  3. Capacité de généralisation: La capacité de généralisation dans différents environnements cliniques nécessite une vérification supplémentaire
  4. Différences biologiques: Difficulté à distinguer complètement les différences biologiques des différences socioculturelles

Directions Futures

  1. Extension à d'autres maladies de santé mentale et groupes de population
  2. Développement de techniques de détection et d'atténuation des biais plus raffinées
  3. Intégration de données multimodales (texte + données structurées)
  4. Établissement d'un cadre normalisé d'évaluation de l'équité en IA médicale

Évaluation Approfondie

Points Forts

  1. Importance du problème: Concentration sur le domaine critique de la santé mentale pédiatrique, avec une valeur sociale importante
  2. Innovation méthodologique: Proposition d'un cadre de débiaisage centré sur les données spécialement adapté aux textes médicaux
  3. Suffisance expérimentale: Vérification sur des données cliniques réelles à grande échelle, analyse multidimensionnelle des biais
  4. Valeur pratique: Méthodes simples et efficaces, faciles à déployer dans les environnements cliniques
  5. Interprétabilité: Fourniture d'analyses interprétables des décisions du modèle à l'aide de techniques comme LIME

Insuffisances

  1. Profondeur théorique: Manque d'analyse théorique approfondie des mécanismes de génération des biais
  2. Limitations méthodologiques: Les méthodes de débiaisage sont relativement simples, pouvant présenter des risques de sursimp lification
  3. Évaluation unique: Concentration principale sur l'équité de classification, manque d'autres dimensions d'équité comme l'étalonnage
  4. Impact à long terme: Absence d'évaluation des effets du débiaisage sur la performance à long terme et la capacité de généralisation du modèle

Impact

  1. Contribution académique: Fourniture d'études de cas et de références méthodologiques importantes pour la recherche sur les biais en IA médicale et NLP
  2. Valeur pratique: Fourniture de solutions concrètes pour l'amélioration de l'équité des systèmes d'IA cliniques
  3. Signification politique: Soutien technique pour la réglementation et l'établissement de normes pour l'IA médicale
  4. Reproductibilité: Description détaillée de la méthode, avec bonne reproductibilité

Scénarios d'Application

  1. Systèmes d'aide à la décision clinique: Systèmes de dépistage et d'assistance au diagnostic en santé mentale
  2. Amélioration de la qualité médicale: Identification et atténuation des biais dans les systèmes d'IA médicale existants
  3. Conformité réglementaire: Satisfaction des exigences d'équité et d'éthique en IA médicale
  4. Outils de recherche: Fourniture de base méthodologique pour d'autres recherches sur les biais en IA médicale

Références

Cet article cite des travaux importants dans les domaines de l'équité en apprentissage automatique, du débiaisage en NLP et de l'IA médicale, notamment:

  • Feldman et al. (2015) - Métriques d'équité
  • Bolukbasi et al. (2016) - Débiaisage d'embeddings de mots
  • Obermeyer et al. (2019) - Biais raciaux dans les algorithmes médicaux
  • Ribeiro et al. (2016) - Méthode d'interprétabilité LIME

Évaluation Globale: Cet article de recherche possède une valeur importante dans le domaine de l'équité en IA médicale. Non seulement il identifie le problème des biais de genre dans l'IA de santé mentale pédiatrique, mais il propose également des solutions pratiques. Bien qu'il y ait une marge d'amélioration en termes de profondeur théorique et de complexité méthodologique, sa valeur pratique et son importance sociale en font une contribution importante au domaine.