Introduction: Healthcare AI models often inherit biases from their training data. While efforts have primarily targeted bias in structured data, mental health heavily depends on unstructured data. This study aims to detect and mitigate linguistic differences related to non-biological differences in the training data of AI models designed to assist in pediatric mental health screening. Our objectives are: (1) to assess the presence of bias by evaluating outcome parity across sex subgroups, (2) to identify bias sources through textual distribution analysis, and (3) to develop a de-biasing method for mental health text data. Methods: We examined classification parity across demographic groups and assessed how gendered language influences model predictions. A data-centric de-biasing method was applied, focusing on neutralizing biased terms while retaining salient clinical information. This methodology was tested on a model for automatic anxiety detection in pediatric patients. Results: Our findings revealed a systematic under-diagnosis of female adolescent patients, with a 4% lower accuracy and a 9% higher False Negative Rate (FNR) compared to male patients, likely due to disparities in information density and linguistic differences in patient notes. Notes for male patients were on average 500 words longer, and linguistic similarity metrics indicated distinct word distributions between genders. Implementing our de-biasing approach reduced diagnostic bias by up to 27%, demonstrating its effectiveness in enhancing equity across demographic groups. Discussion: We developed a data-centric de-biasing framework to address gender-based content disparities within clinical text. By neutralizing biased language and enhancing focus on clinically essential information, our approach demonstrates an effective strategy for mitigating bias in AI healthcare models trained on text.
- ID de l'article: 2501.00129
- Titre: A Data-Centric Approach to Detecting and Mitigating Demographic Bias in Pediatric Mental Health Text: A Case Study in Anxiety Detection
- Auteurs: Julia Ive, Paulina Bondaronek, Vishal Yadav, Daniel Santel, Tracy Glauser, Tina Cheng, Jeffrey R. Strawn, Greeshma Agasthya, Jordan Tschida, Sanghyun Choo, Mayanka Chandrashekar, Anuj J. Kapadia, John Pestian
- Classification: cs.CL cs.AI
- Institutions: University College London, Queen Mary University of London, Cincinnati Children's Hospital Medical Center, Oak Ridge National Laboratory, etc.
- Type d'article: Article de recherche
Cette étude aborde la question des biais démographiques dans les modèles d'IA de santé mentale pédiatrique en proposant une approche de débiaisage centrée sur les données. L'étude révèle un sous-diagnostic systématique chez les adolescentes, avec une précision inférieure de 4 % par rapport aux patients masculins et un taux de faux négatifs supérieur de 9 %. Grâce à des méthodes de débiaisage incluant le filtrage par densité informationnelle et la substitution de termes neutres sur le plan du genre, le biais diagnostique a été réduit de 27 %, offrant une solution efficace pour l'équité de l'IA médicale.
- Prévalence des biais en IA: Les modèles d'IA médicale héritent fréquemment des biais présents dans les données d'entraînement, pouvant exacerber les inégalités en matière de santé, particulièrement pour les groupes minoritaires
- Spécificité de la santé mentale: La santé mentale dépend fortement de données textuelles non structurées (notes cliniques), alors que les recherches existantes sur le débiaisage se concentrent principalement sur les données structurées
- Crise de la santé mentale pédiatrique: La prévalence des symptômes d'anxiété chez les enfants a doublé après la COVID-19, particulièrement chez les adolescentes
- Complexité et défis du dépistage de la santé mentale chez l'enfant
- Potentiel considérable de l'IA pour élargir le diagnostic en santé mentale
- Besoin urgent d'assurer l'équité et l'efficacité des outils d'IA dans différents groupes de population
- Les techniques de débiaisage traditionnelles (comme le débiaisage des plongements de mots, l'entraînement adversarial) ne s'appliquent pas au domaine médical
- L'hétérogénéité des données médicales (provenant de différentes institutions) n'a pas été suffisamment prise en compte
- Absence de cadre de débiaisage spécialisé pour les textes médicaux
- Identification systématique des biais: Première identification et quantification des biais de genre dans la détection de l'anxiété pédiatrique, avec un taux de faux négatifs significativement plus élevé chez les patientes
- Cadre de débiaisage centré sur les données: Proposition de méthodes de débiaisage spécialement adaptées aux textes médicaux, incluant le filtrage par densité informationnelle et la neutralisation des termes de genre
- Validation de l'efficacité: Vérification de l'efficacité de la méthode sur des données cliniques réelles, réduisant le biais diagnostique jusqu'à 27 %
- Analyse d'interprétabilité: Utilisation de la technique LIME pour analyser le vocabulaire sur lequel reposent les décisions du modèle, révélant les sources de biais
Entrée: Séquence de texte de notes cliniques de patients pédiatriques
Sortie: Prédiction binaire (anxiété/pas d'anxiété)
Objectif: Réduire les écarts de performance entre les groupes de genres différents tout en maintenant la précision prédictive
Évaluation des biais du modèle à l'aide de plusieurs métriques:
- Taux d'Erreur Équilibré (BER):
BER=2(FP+TNFP)+(FN+TPFN)
- Taux de Faux Négatifs (FNR): Mesure le taux de non-diagnostic
- Taux de Faux Positifs (FPR): Mesure le taux de diagnostic erroné
- Ratio BER: Rapport du BER du groupe non privilégié au groupe privilégié, >1,25 indique un biais significatif
Analyse des différences dans les caractéristiques textuelles entre groupes de population:
- Longueur moyenne des notes
- Pourcentage de terminologie médicale
- Pourcentage de vocabulaire biaisé par le genre
- Distance de Jaccard et scores de familiarité
- Calcul de l'importance des phrases à l'aide de scores TF-IDF
- Suppression des 20 % de phrases avec le moins d'information
- Équilibrage de la densité informationnelle entre différents groupes
- Détection automatique des noms propres et pronoms biaisés par le genre
- Extraction des noms propres à l'aide de l'outil Stanza
- Remplacement des termes spécifiques au genre par des alternatives neutres
- Noms propres → "person1", "person2", etc.
- Pronoms → "he/she" → "they"
Combinaison du filtrage par densité informationnelle et de la substitution de termes de genre pour exploiter les effets synergiques
- Modèle Transformer basé sur Clinical-BigBird
- Pré-entraîné spécifiquement sur des textes cliniques
- Support des entrées de longues séquences (jusqu'à 4 096 tokens)
- Paramètres d'ajustement fin: 2 epochs, taux d'apprentissage 1e-5, taille de lot 8
- Source: Cincinnati Children's Hospital Medical Center
- Taille: 1,3 million de patients, 63 millions de notes cliniques
- Période: Janvier 2009 - Mars 2022
- Cas d'anxiété: 84 426 cas répondant aux critères de sélection
- Données finales: 73 288 patients, 7,81 millions de notes
- Division en 5 groupes d'âge: 5, 8, 10, 12, 15 ans
- 3 700 à 5 064 échantillons d'entraînement par groupe
- 852 à 1 278 échantillons de test
- Appariement cas-témoin 1:1 (par âge et genre)
- Dédoublonnage: notes avec similarité cosinus ≥ 0,8
- Sélection des 25 notes les plus récentes
- Limitation de la longueur d'entrée à 1 000 tokens
- Précision (Accuracy)
- Taux de Faux Négatifs (FNR) - métrique principale
- Taux de Faux Positifs (FPR)
- Taux d'Erreur Équilibré (BER)
- Pourcentage de prédictions incertaines (probabilité dans l'intervalle 0,4, 0,6)
| Métrique | Hommes | Femmes | Différence |
|---|
| Précision | - | -4% | Plus faible chez les femmes |
| FNR | - | +9% | Plus élevé chez les femmes |
| Prédictions incertaines | - | +5% | Plus élevé chez les femmes |
| Longueur des notes | Référence | -500 mots | Plus court chez les femmes |
- Similarité lexicale: Indice de Jaccard 0,54 (entre hommes et femmes)
- Distribution des termes: Indice de Jaccard 0,34 (différence significative)
- Similarité minimale: Groupes d'âge 5 et 15 ans (Jaccard 0,43)
Meilleure méthode (tf-idf_filt):
- Réduction de l'écart FNR de 0,024 (amélioration de 27 %)
- Bin 5: Écart FNR réduit de 0,13 à 0,02
- Bin 15: Écart FNR réduit de 0,13 à 0,07
- Ratio BER réduit de 1,33 à 0,98 (Bin 10)
| Méthode | Amélioration FNR | Maintien de Performance | Réduction d'Incertitude |
|---|
| rnd_filt | Aucun effet cohérent | ✓ | - |
| tf-idf_filt | -0,024 | ✓ | -4% |
| gen_sub | +0,008 | ✓ | -3% |
| Méthode combinée | -0,022 | ✓ | -12% |
Analyse à l'aide de LIME du vocabulaire sur lequel repose le modèle:
- Modèle original: 10 % des cas de prédiction dépendent de vocabulaire biaisé
- tf-idf_filt: Réduit à 3 %
- Méthode combinée: Fréquence du vocabulaire biaisé réduite de 50 %
- FNR moyen 0,05 plus élevé pour les autres groupes raciaux
- La méthode combinée réduit l'écart FNR de 0,034
- Démontre l'applicabilité générale de la méthode
- Techniques de prétraitement: rééchantillonnage, augmentation de données
- Modifications algorithmiques: débiaisage adversarial, modification de la fonction objectif
- Techniques de post-traitement: calibrage, transformation d'embeddings
- Échange d'attributs: échange de vocabulaire d'attributs sensibles
- Débiaisage d'embeddings: suppression de la composante de genre dans les embeddings de mots
- Entraînement adversarial: pénalisation des prédictions influencées par les attributs protégés
- Biais raciaux dans les algorithmes de prédiction commerciaux
- Disparités de groupes dans la prédiction du risque suicidaire
- Biais démographiques dans les modèles de pathologie
- Ubiquité des biais: Les modèles de détection de l'anxiété pédiatrique présentent un sous-diagnostic systématique chez les patientes
- Différences textuelles comme source: Différences significatives dans la densité informationnelle et la distribution linguistique des notes entre patients de genres différents
- Efficacité de l'approche centrée sur les données: L'équilibrage de la densité informationnelle et la neutralisation du langage réduisent significativement les biais
- Importance clinique: La réduction de 27 % des biais a une valeur importante pour améliorer le diagnostic chez les patientes
- Dépendance à la qualité des données: L'efficacité de la méthode est limitée par la qualité et la cohérence du texte des dossiers médicaux électroniques
- Type de biais unique: Concentration sur les biais de genre, sans considération d'autres caractéristiques démographiques
- Capacité de généralisation: La capacité de généralisation dans différents environnements cliniques nécessite une vérification supplémentaire
- Différences biologiques: Difficulté à distinguer complètement les différences biologiques des différences socioculturelles
- Extension à d'autres maladies de santé mentale et groupes de population
- Développement de techniques de détection et d'atténuation des biais plus raffinées
- Intégration de données multimodales (texte + données structurées)
- Établissement d'un cadre normalisé d'évaluation de l'équité en IA médicale
- Importance du problème: Concentration sur le domaine critique de la santé mentale pédiatrique, avec une valeur sociale importante
- Innovation méthodologique: Proposition d'un cadre de débiaisage centré sur les données spécialement adapté aux textes médicaux
- Suffisance expérimentale: Vérification sur des données cliniques réelles à grande échelle, analyse multidimensionnelle des biais
- Valeur pratique: Méthodes simples et efficaces, faciles à déployer dans les environnements cliniques
- Interprétabilité: Fourniture d'analyses interprétables des décisions du modèle à l'aide de techniques comme LIME
- Profondeur théorique: Manque d'analyse théorique approfondie des mécanismes de génération des biais
- Limitations méthodologiques: Les méthodes de débiaisage sont relativement simples, pouvant présenter des risques de sursimp lification
- Évaluation unique: Concentration principale sur l'équité de classification, manque d'autres dimensions d'équité comme l'étalonnage
- Impact à long terme: Absence d'évaluation des effets du débiaisage sur la performance à long terme et la capacité de généralisation du modèle
- Contribution académique: Fourniture d'études de cas et de références méthodologiques importantes pour la recherche sur les biais en IA médicale et NLP
- Valeur pratique: Fourniture de solutions concrètes pour l'amélioration de l'équité des systèmes d'IA cliniques
- Signification politique: Soutien technique pour la réglementation et l'établissement de normes pour l'IA médicale
- Reproductibilité: Description détaillée de la méthode, avec bonne reproductibilité
- Systèmes d'aide à la décision clinique: Systèmes de dépistage et d'assistance au diagnostic en santé mentale
- Amélioration de la qualité médicale: Identification et atténuation des biais dans les systèmes d'IA médicale existants
- Conformité réglementaire: Satisfaction des exigences d'équité et d'éthique en IA médicale
- Outils de recherche: Fourniture de base méthodologique pour d'autres recherches sur les biais en IA médicale
Cet article cite des travaux importants dans les domaines de l'équité en apprentissage automatique, du débiaisage en NLP et de l'IA médicale, notamment:
- Feldman et al. (2015) - Métriques d'équité
- Bolukbasi et al. (2016) - Débiaisage d'embeddings de mots
- Obermeyer et al. (2019) - Biais raciaux dans les algorithmes médicaux
- Ribeiro et al. (2016) - Méthode d'interprétabilité LIME
Évaluation Globale: Cet article de recherche possède une valeur importante dans le domaine de l'équité en IA médicale. Non seulement il identifie le problème des biais de genre dans l'IA de santé mentale pédiatrique, mais il propose également des solutions pratiques. Bien qu'il y ait une marge d'amélioration en termes de profondeur théorique et de complexité méthodologique, sa valeur pratique et son importance sociale en font une contribution importante au domaine.