Hybrid Explanation-Guided Learning for Transformer-Based Chest X-Ray Diagnosis
Shu, Luo, Poellinger et al.
Transformer-based deep learning models have demonstrated exceptional performance in medical imaging by leveraging attention mechanisms for feature representation and interpretability. However, these models are prone to learning spurious correlations, leading to biases and limited generalization. While human-AI attention alignment can mitigate these issues, it often depends on costly manual supervision. In this work, we propose a Hybrid Explanation-Guided Learning (H-EGL) framework that combines self-supervised and human-guided constraints to enhance attention alignment and improve generalization. The self-supervised component of H-EGL leverages class-distinctive attention without relying on restrictive priors, promoting robustness and flexibility. We validate our approach on chest X-ray classification using the Vision Transformer (ViT), where H-EGL outperforms two state-of-the-art Explanation-Guided Learning (EGL) methods, demonstrating superior classification accuracy and generalization capability. Additionally, it produces attention maps that are better aligned with human expertise.
academic
Apprentissage Hybride Guidé par Explications pour le Diagnostic de Radiographies Thoraciques basé sur Transformers
Les modèles d'apprentissage profond basés sur Transformers ont démontré des capacités exceptionnelles de représentation des caractéristiques et d'interprétabilité dans l'imagerie médicale grâce aux mécanismes d'attention. Cependant, ces modèles sont susceptibles d'apprendre des corrélations fallacieuses, entraînant des biais et une capacité de généralisation limitée. Bien que l'alignement de l'attention homme-machine puisse atténuer ces problèmes, il dépend souvent d'une supervision manuelle coûteuse. Ce travail propose le cadre d'apprentissage hybride guidé par explications (H-EGL), combinant des contraintes auto-supervisées et guidées par l'homme pour améliorer l'alignement de l'attention et la capacité de généralisation. La composante auto-supervisée de H-EGL exploite l'attention discriminante des classes, sans dépendre de priors restrictifs, favorisant la robustesse et la flexibilité. Validée sur la tâche de classification de radiographies thoraciques avec Vision Transformer (ViT), H-EGL surpasse deux méthodes d'apprentissage guidé par explications de pointe, démontrant une précision de classification supérieure et une capacité de généralisation, tout en produisant des cartes d'attention mieux alignées avec les experts humains.
Le problème fondamental que cette recherche aborde concerne les corrélations fallacieuses et les problèmes d'alignement de l'attention dans les modèles d'imagerie médicale basés sur Transformers. Cela inclut spécifiquement :
Problème des corrélations fallacieuses : Les réseaux de neurones profonds sont susceptibles d'apprendre des corrélations fallacieuses dans les données, entraînant un apprentissage par raccourci, des biais et des problèmes d'équité
Défi de l'alignement de l'attention : Bien que l'alignement de l'attention homme-machine puisse améliorer la robustesse du modèle, il nécessite une annotation manuelle coûteuse
Limitations des méthodes existantes : Les méthodes purement auto-supervisées peuvent renforcer les interprétations erronées, tandis que les méthodes d'apprentissage contrastif manquent de méthodes standardisées pour générer des échantillons positifs et négatifs
Méthodes purement supervisées : Dépendent d'annotations d'experts coûteuses, avec un coût élevé
Méthodes purement auto-supervisées : Peuvent renforcer des explications fallacieuses ou mal alignées
Méthodes de contrainte traditionnelles : Dépendent de priors rigides tels que la parcimonie et la régularité, pouvant inhiber l'apprentissage de caractéristiques complexes
Proposition du cadre H-EGL : Première application d'une méthode d'apprentissage guidé par explications hybride à l'architecture Transformer, évaluant et améliorant l'alignement de l'attention homme-machine
Conception de la composante DAL : Proposition de l'apprentissage d'attention discriminante (Discriminative Attention Learning), exploitant les cartes d'attention discriminantes des classes pour l'apprentissage auto-supervisé
Amélioration des performances : Surpasse les méthodes de pointe existantes sur la tâche de classification de radiographies thoraciques, atteignant une AUC de 89,3%
Amélioration de l'interprétabilité : Génère des cartes d'attention mieux alignées avec les connaissances des experts, tout en maintenant les performances de classification
Entrée : Images de radiographies thoraciques et étiquettes de texte de maladies
Sortie : Prédictions de classification multi-étiquettes de maladies et cartes d'attention spécifiques aux classes
Objectif : Améliorer la précision de classification tout en générant des cartes d'attention alignées avec les régions annotées par les experts humains
où A_i est la carte d'attention générée par le modèle et M_i est le masque d'expert.
2. Apprentissage d'Attention Discriminante (DAL)
Amélioration de la discriminabilité des classes en minimisant la similarité des cartes d'attention entre différentes classes :
L_DAL = (2)/(C(C-1)) × ∑∑|S(A_i, A_j)|
où S(A_i, A_j) est la similarité cosinus entre les cartes d'attention A_i et A_j.
Pas de génération d'échantillons négatifs : DAL évite les problèmes complexes de construction d'échantillons négatifs de l'apprentissage contrastif traditionnel
Biais inductif flexible : Ne dépend pas de contraintes rigides telles que la parcimonie, préservant la capacité du modèle à apprendre des caractéristiques complexes
Exploitation directe de l'attention ViT : Tire pleinement parti du mécanisme d'attention inhérent aux Transformers, plutôt que d'utiliser des outils d'interprétation a posteriori
Stratégie de supervision hybride : Équilibre la guidance humaine et l'apprentissage autonome, réalisant un équilibre optimal entre efficacité des coûts et performances
H-EGL combine efficacement la supervision auto-supervisée et manuelle, réalisant des performances de classification supérieures et un alignement d'attention
La composante DAL fournit un biais inductif flexible, évitant la sur-régularisation
La stratégie hybride atteint un bon équilibre entre efficacité des coûts et performances
L'article cite plusieurs travaux connexes importants, notamment :
L'article original Vision Transformer (ViT) 3
Recherches sur les corrélations fallacieuses en imagerie médicale 2,5,6
Synthèse de l'apprentissage guidé par explications 4
Méthodes DWARF 11 et KAD 19
Évaluation Globale : Cet article de recherche de haute qualité apporte des contributions significatives au domaine de l'interprétabilité en imagerie médicale. Le cadre d'apprentissage hybride guidé par explications est bien conçu, la validation expérimentale est complète et les résultats sont convaincants. Malgré quelques limitations, il fournit une base solide et des directions prometteuses pour les recherches futures.