Hybrid Explanation-Guided Learning for Transformer-Based Chest X-Ray Diagnosis
Shu, Luo, Poellinger et al.
Transformer-based deep learning models have demonstrated exceptional performance in medical imaging by leveraging attention mechanisms for feature representation and interpretability. However, these models are prone to learning spurious correlations, leading to biases and limited generalization. While human-AI attention alignment can mitigate these issues, it often depends on costly manual supervision. In this work, we propose a Hybrid Explanation-Guided Learning (H-EGL) framework that combines self-supervised and human-guided constraints to enhance attention alignment and improve generalization. The self-supervised component of H-EGL leverages class-distinctive attention without relying on restrictive priors, promoting robustness and flexibility. We validate our approach on chest X-ray classification using the Vision Transformer (ViT), where H-EGL outperforms two state-of-the-art Explanation-Guided Learning (EGL) methods, demonstrating superior classification accuracy and generalization capability. Additionally, it produces attention maps that are better aligned with human expertise.
academic
Hybrid Explanation-Guided Learning für Transformer-basierte Thorax-Röntgen-Diagnose
Transformer-basierte Deep-Learning-Modelle haben durch Aufmerksamkeitsmechanismen außergewöhnliche Fähigkeiten in der Merkmalsdarstellung und Interpretierbarkeit in der medizinischen Bildgebung demonstriert. Diese Modelle neigen jedoch dazu, falsche Korrelationen zu erlernen, was zu Verzerrungen und begrenzter Verallgemeinerungsfähigkeit führt. Obwohl die Ausrichtung von Mensch-Maschinen-Aufmerksamkeit diese Probleme lindern kann, ist sie oft auf teure manuelle Überwachung angewiesen. Diese Arbeit präsentiert das Hybrid Explanation-Guided Learning (H-EGL)-Framework, das selbstüberwachte und manuell gelenkte Einschränkungen kombiniert, um die Aufmerksamkeitsausrichtung zu verbessern und die Verallgemeinerungsfähigkeit zu erhöhen. Die selbstüberwachte Komponente von H-EGL nutzt klassenunterscheidende Aufmerksamkeit ohne Abhängigkeit von restriktiven Priors und fördert Robustheit und Flexibilität. Die Validierung auf Thorax-Röntgen-Klassifizierungsaufgaben mit Vision Transformer (ViT) zeigt, dass H-EGL zwei hochmoderne Explanation-Guided-Learning-Methoden übertrifft und überlegene Klassifizierungsgenauigkeit, Verallgemeinerungsfähigkeit und Aufmerksamkeitskarten aufweist, die besser mit menschlichen Experten übereinstimmen.
Die Kernprobleme, die diese Forschung adressiert, sind falsche Korrelationen beim Lernen und Aufmerksamkeitsausrichtung in Transformer-basierten medizinischen Bildgebungsmodellen. Dies umfasst speziell:
Problem falscher Korrelationen: Tiefe neuronale Netze neigen dazu, falsche Korrelationen in Daten zu erlernen, was zu Shortcut-Lernen, Verzerrungen und Fairness-Problemen führt
Herausforderung der Aufmerksamkeitsausrichtung: Obwohl die Ausrichtung von Mensch-Maschinen-Aufmerksamkeit die Modellrobustheit verbessern kann, erfordert sie teure manuelle Annotationen
Einschränkungen bestehender Methoden: Rein selbstüberwachte Methoden können fehlerhafte Interpretationen verstärken, während Contrastive-Learning-Methoden standardisierte Methoden zur Generierung positiver und negativer Stichproben vermissen lassen
In der medizinischen Bildgebungsdiagnose sind Interpretierbarkeit und Zuverlässigkeit des Modells von entscheidender Bedeutung. Fehlerhafte Aufmerksamkeitsmuster können zu folgenden Konsequenzen führen:
Fehler bei klinischen Entscheidungen
Übersehen kritischer pathologischer Merkmale
Verallgemeinerungsversagen des Modells bei unterschiedlichen Datenverteilungen
H-EGL-Framework: Erstmalige Anwendung einer hybriden Explanation-Guided-Methode auf Transformer-Architektur mit Bewertung und Verbesserung der Mensch-Maschinen-Aufmerksamkeitsausrichtung
DAL-Komponente: Vorschlag von Discriminative Attention Learning (DAL), das klassenunterscheidende Aufmerksamkeitskarten für selbstüberwachtes Lernen nutzt
Leistungsverbesserung: Übertreffung bestehender hochmoderner Methoden bei Thorax-Röntgen-Klassifizierungsaufgaben mit AUC von 89,3%
Verbesserte Interpretierbarkeit: Generierung von Aufmerksamkeitskarten, die besser mit Expertenwissen übereinstimmen, während die Klassifizierungsleistung erhalten bleibt
Eingabe: Thorax-Röntgenbilder und Krankheitsetikett-Text
Ausgabe: Vorhersagen der Mehrklassen-Krankheitsklassifizierung und klassenspezifische Aufmerksamkeitskarten
Ziel: Verbesserung der Klassifizierungsgenauigkeit bei gleichzeitiger Generierung von Aufmerksamkeitskarten, die mit von menschlichen Experten annotierten Regionen übereinstimmen
Wobei A_i die vom Modell generierte Aufmerksamkeitskarte ist und M_i die Experten-Maske darstellt.
2. Discriminative Attention Learning (DAL)
Verbesserung der Klassenunterscheidung durch Minimierung der Ähnlichkeit von Aufmerksamkeitskarten verschiedener Klassen:
L_DAL = (2)/(C(C-1)) × ∑∑|S(A_i, A_j)|
Wobei S(A_i, A_j) die Kosinus-Ähnlichkeit zwischen den Aufmerksamkeitskarten A_i und A_j ist.
Keine Generierung negativer Stichproben erforderlich: DAL vermeidet die komplexe Konstruktion negativer Stichproben im traditionellen Contrastive Learning
Flexible induktive Verzerrung: Nicht abhängig von starren Constraints wie Sparsität, behält die Fähigkeit des Modells zur Erlernung komplexer Merkmale
Direkte Nutzung von ViT-Aufmerksamkeit: Vollständige Nutzung des inhärenten Aufmerksamkeitsmechanismus von Transformern statt Post-hoc-Interpretationswerkzeugen
Hybride Überwachungsstrategie: Ausgewogene Kombination von manueller Anleitung und autonomem Lernen für optimale Kosteneffizienz und Leistung
Dynamische Ausrichtungsmechanismen: Erkundung adaptiver Anpassung des Verhältnisses zwischen selbstüberwachtem und manuellem Lernen während des Trainings
Großflächige Validierung: Validierung auf größeren Datensätzen und mehr Krankheitskategorien
Cross-Modality-Erweiterung: Erweiterung auf andere medizinische Bildgebungsmodalitäten
Klinische Bereitstellung: Untersuchung der Anwendungseffektivität in echten klinischen Umgebungen
Das Papier zitiert mehrere wichtige verwandte Arbeiten, einschließlich:
Vision Transformer (ViT) Originalpapier 3
Forschung zu falschen Korrelationen in der medizinischen Bildgebung 2,5,6
Übersicht über Explanation-Guided Learning 4
DWARF-Methode 11 und KAD-Methode 19
Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier, das einen bedeutsamen Beitrag zum Bereich der Interpretierbarkeit in der medizinischen Bildgebung leistet. Das Hybrid Explanation-Guided-Learning-Framework ist rational konzipiert, die experimentelle Validierung ist umfassend und die Ergebnisse sind überzeugend. Trotz einiger Einschränkungen bietet es eine solide Grundlage und Richtung für zukünftige Forschung.