Hybrid Explanation-Guided Learning for Transformer-Based Chest X-Ray Diagnosis
Shu, Luo, Poellinger et al.
Transformer-based deep learning models have demonstrated exceptional performance in medical imaging by leveraging attention mechanisms for feature representation and interpretability. However, these models are prone to learning spurious correlations, leading to biases and limited generalization. While human-AI attention alignment can mitigate these issues, it often depends on costly manual supervision. In this work, we propose a Hybrid Explanation-Guided Learning (H-EGL) framework that combines self-supervised and human-guided constraints to enhance attention alignment and improve generalization. The self-supervised component of H-EGL leverages class-distinctive attention without relying on restrictive priors, promoting robustness and flexibility. We validate our approach on chest X-ray classification using the Vision Transformer (ViT), where H-EGL outperforms two state-of-the-art Explanation-Guided Learning (EGL) methods, demonstrating superior classification accuracy and generalization capability. Additionally, it produces attention maps that are better aligned with human expertise.
academic
Aprendizaje Guiado por Explicaciones Híbridas para Diagnóstico de Radiografías de Tórax Basado en Transformers
Los modelos de aprendizaje profundo basados en Transformers han demostrado capacidades excepcionales de representación de características e interpretabilidad a través de mecanismos de atención en imágenes médicas. Sin embargo, estos modelos son propensos a aprender correlaciones espurias, lo que genera sesgos y capacidad de generalización limitada. Aunque la alineación de atención humano-máquina puede mitigar estos problemas, a menudo depende de supervisión manual costosa. Este trabajo propone el marco de Aprendizaje Guiado por Explicaciones Híbridas (H-EGL), que combina restricciones autosupervisadas y guiadas por humanos para mejorar la alineación de atención y la capacidad de generalización. El componente autosupervisado de H-EGL aprovecha la atención discriminativa de clases sin depender de prioridades restrictivas, promoviendo robustez y flexibilidad. Validado en tareas de clasificación de radiografías de tórax utilizando Vision Transformer (ViT), H-EGL supera dos métodos de aprendizaje guiado por explicaciones de última generación, demostrando precisión de clasificación superior y capacidad de generalización, mientras produce mapas de atención mejor alineados con expertos humanos.
El problema central que aborda esta investigación es el de las correlaciones espurias de aprendizaje y los problemas de alineación de atención en modelos de imágenes médicas basados en Transformers. Específicamente incluye:
Problema de Correlaciones Espurias: Las redes neuronales profundas tienden a aprender correlaciones espurias en los datos, causando aprendizaje de atajos, sesgos y problemas de equidad
Desafío de Alineación de Atención: Aunque la alineación de atención humano-máquina puede mejorar la robustez del modelo, requiere anotaciones manuales costosas
Limitaciones de Métodos Existentes: Los métodos puramente autosupervisados pueden reforzar interpretaciones erróneas, mientras que los métodos de aprendizaje contrastivo carecen de métodos estandarizados para generar muestras positivas y negativas
En el diagnóstico de imágenes médicas, la interpretabilidad y confiabilidad del modelo son cruciales. Los patrones de atención incorrectos pueden conducir a:
Errores en la toma de decisiones clínicas
Omisión de características patológicas críticas
Fallo en la generalización del modelo en diferentes distribuciones de datos
Métodos Puramente Supervisados: Dependen de anotaciones costosas de expertos, con alto costo
Métodos Puramente Autosupervisados: Pueden reforzar interpretaciones falsas o incorrectamente alineadas
Métodos de Restricción Tradicionales: Dependen de prioridades rígidas como escasez y suavidad, que pueden inhibir el aprendizaje de características complejas
Propuesta del Marco H-EGL: Primera aplicación de métodos de explicación guiada híbrida a arquitecturas Transformer, evaluando y mejorando la alineación de atención humano-máquina
Diseño del Componente DAL: Propuesta de Aprendizaje de Atención Discriminativa (Discriminative Attention Learning), utilizando mapas de atención discriminativa de clases para aprendizaje autosupervisado
Mejora de Rendimiento: Supera métodos de última generación en tareas de clasificación de radiografías de tórax, alcanzando un AUC del 89.3%
Interpretabilidad Mejorada: Genera mapas de atención mejor alineados con conocimiento de expertos, manteniendo el rendimiento de clasificación
Entrada: Imágenes de radiografías de tórax y etiquetas de enfermedades en texto
Salida: Predicciones de clasificación de enfermedades multiétiqueta y mapas de atención específicos de clase
Objetivo: Mejorar la precisión de clasificación mientras se generan mapas de atención alineados con regiones anotadas por expertos humanos
Donde A_i es el mapa de atención generado por el modelo y M_i es la máscara del experto.
2. Aprendizaje de Atención Discriminativa (DAL)
Mejora la discriminabilidad de clases minimizando la similitud de mapas de atención entre diferentes clases:
L_DAL = (2)/(C(C-1)) × ∑∑|S(A_i, A_j)|
Donde S(A_i, A_j) es la similitud del coseno entre los mapas de atención A_i y A_j.
Sin Necesidad de Generación de Muestras Negativas: DAL evita el problema complejo de construcción de muestras negativas en aprendizaje contrastivo tradicional
Sesgo Inductivo Flexible: No depende de restricciones rígidas como escasez, manteniendo la capacidad del modelo para aprender características complejas
Aprovechamiento Directo de Atención ViT: Utiliza completamente el mecanismo de atención inherente de Transformers, en lugar de herramientas de explicación posteriores
Estrategia de Supervisión Híbrida: Equilibra la guía humana y el aprendizaje autónomo, logrando un balance óptimo entre costo-beneficio y rendimiento
Mecanismo de Alineación Dinámica: Exploración de ajuste adaptativo del grado de supervisión autosupervisada y alineación humana durante el entrenamiento
Validación a Gran Escala: Verificación en conjuntos de datos más grandes y más categorías de enfermedades
Extensión Multimodal: Extensión a otras modalidades de imágenes médicas
Despliegue Clínico: Investigación de efectos de aplicación en entornos clínicos reales
El artículo cita múltiples trabajos relacionados importantes, incluyendo:
Artículo original de Vision Transformer (ViT) 3
Investigación sobre correlaciones espurias en imágenes médicas 2,5,6
Revisión de aprendizaje guiado por explicaciones 4
Métodos DWARF 11 y KAD 19
Evaluación General: Este es un artículo de investigación de alta calidad que realiza contribuciones significativas en el campo de la interpretabilidad de imágenes médicas. El marco de aprendizaje guiado por explicaciones híbridas está bien diseñado, la validación experimental es exhaustiva y los resultados son convincentes. Aunque existen algunas limitaciones, proporciona una base sólida y dirección para investigación futura.