2025-11-19T06:52:13.983675

Graph Transformer with Disease Subgraph Positional Encoding for Improved Comorbidity Prediction

Qin, Liao
Comorbidity, the co-occurrence of multiple medical conditions in a single patient, profoundly impacts disease management and outcomes. Understanding these complex interconnections is crucial, especially in contexts where comorbidities exacerbate outcomes. Leveraging insights from the human interactome (HI) and advancements in graph-based methodologies, this study introduces Transformer with Subgraph Positional Encoding (TSPE) for disease comorbidity prediction. Inspired by Biologically Supervised Embedding (BSE), TSPE employs Transformer's attention mechanisms and Subgraph Positional Encoding (SPE) to capture interactions between nodes and disease associations. Our proposed SPE proves more effective than LPE, as used in Dwivedi et al.'s Graph Transformer, underscoring the importance of integrating clustering and disease-specific information for improved predictive accuracy. Evaluated on real clinical benchmark datasets (RR0 and RR1), TSPE demonstrates substantial performance enhancements over the state-of-the-art method, achieving up to 28.24% higher ROC AUC and 4.93% higher accuracy. This method shows promise for adaptation to other complex graph-based tasks and applications. The source code is available in the GitHub repository at: https://github.com/xihan-qin/TSPE-GraphTransformer.
academic

Transformador de Grafos con Codificación Posicional de Subgrafos de Enfermedades para Predicción Mejorada de Comorbilidad

Información Básica

Resumen

Este estudio propone un método de Transformador de Grafos basado en codificación posicional de subgrafos (TSPE) para abordar el problema de predicción de comorbilidad de enfermedades. El método utiliza datos del Interactoma Humano (Human Interactome, HI) y aprovecha el mecanismo de atención del Transformador y una novedosa codificación posicional de subgrafos (SPE) para capturar las interacciones entre nodos y las asociaciones de enfermedades. Los experimentos en los conjuntos de datos de referencia clínicos RR0 y RR1 demuestran que TSPE mejora el ROC AUC hasta un 28.24% en comparación con los métodos existentes más avanzados, con una mejora de precisión del 4.93%.

Antecedentes de Investigación y Motivación

Definición del Problema

  1. Problema Central: Predicción de comorbilidad de enfermedades, es decir, predecir la probabilidad de que múltiples enfermedades ocurran simultáneamente en el mismo paciente
  2. Importancia: La comorbilidad afecta significativamente la gestión de enfermedades, estrategias de tratamiento y resultados del pronóstico, particularmente en pandemias como COVID-19, donde ciertas comorbilidades conducen a resultados más graves
  3. Limitaciones de Métodos Existentes:
    • Los métodos tradicionales como la incrustación geodésica (GE) tienen un rendimiento limitado
    • El método más avanzado existente, BSE, aunque introduce un mecanismo de selección supervisada, sigue utilizando un clasificador SVM tradicional
    • El Transformador de Grafos de Dwivedi et al. utiliza codificación posicional de Laplace (LPE) que carece de información específica de enfermedades

Motivación de la Investigación

Basándose en la importancia enfatizada por la investigación BSE sobre la conectividad de nodos y las asociaciones de enfermedades, este trabajo explora la utilización del mecanismo de atención del modelo Transformador y codificación posicional de subgrafos especialmente diseñada para mejorar el rendimiento de predicción de comorbilidad.

Contribuciones Principales

  1. Marco TSPE Propuesto: Primera aplicación de la arquitectura Transformador a la tarea de predicción de comorbilidad de enfermedades, con diseño de estructura codificador-decodificador adaptada a datos de grafos
  2. Codificación Posicional de Subgrafos Innovadora (SPE): Combina información de agrupamiento de la codificación posicional de Laplace (LPE) e información de etiquetas de enfermedades de la codificación posicional de incrustación de codificador de grafos (GPE)
  3. Mejora Significativa de Rendimiento: Supera sustancialmente los métodos más avanzados existentes en ambos conjuntos de datos de referencia
  4. Experimentos de Ablación Exhaustivos: Valida la efectividad de diferentes métodos de codificación posicional

Explicación Detallada del Método

Definición de la Tarea

  • Entrada: Dos subgrafos de enfermedades en el gráfico del interactoma humano (conjuntos de nodos de proteínas)
  • Salida: Resultado de clasificación binaria que determina si dos enfermedades tienen comorbilidad
  • Restricción: Definición de muestras positivas y negativas basada en valores de riesgo relativo clínico (RR)

Arquitectura del Modelo

Marco General

TSPE adopta una arquitectura codificador-decodificador:

  • Codificador: Procesa incrustaciones de nodos de la enfermedad A
  • Decodificador: Procesa incrustaciones de nodos de la enfermedad B y aprende relaciones entre enfermedades a través de atención cruzada
  • Capa de Clasificación: Convierte la salida del decodificador en un resultado de clasificación binaria

Componentes Técnicos Clave

1. Generación de Incrustación de Nodos Se utiliza Node2Vec para generar incrustaciones de nodos con parámetros configurados como p=1, q=1 (paseo aleatorio equilibrado), con tamaño de ventana de 2.

2. Codificación Posicional de Subgrafos (SPE) SPE = (M + LPE), GPE, donde:

  • M: Matriz de incrustación de nodos
  • LPE: Codificación posicional de Laplace, captura información de agrupamiento del gráfico
  • GPE: Codificación posicional de incrustación de codificador de grafos, captura información de etiquetas de enfermedades

3. Proceso de Cálculo de GPE

Z = AW                    # (11) Cálculo de incrustación GEE
Z = UΣV^T                 # (12) Descomposición de valores singulares
GPE = U_d                 # (13) Seleccionar los primeros d vectores singulares izquierdos

4. Mecanismo de Clasificación

s = softmax(||X||²₂,axis=1)     # (6) Calcular vector de puntuación
y_cand = Σ(X·diag(s))_j         # (8) Suma ponderada
y_pred = σ(Wy_cand + b)         # (9) Predicción final

Puntos de Innovación Técnica

  1. Mecanismo de Atención Unificado: Utiliza atención multiencabezada sin máscara, permitiendo que el modelo atienda a todos los nodos dentro del subgrafo
  2. Codificación Posicional Específica de Enfermedad: GPE utiliza directamente información de etiquetas de enfermedades, siendo más específica que LPE tradicional
  3. Fusión de Información Multinivel: SPE captura simultáneamente la estructura topológica del gráfico (LPE) y el significado biológico (GPE)

Configuración Experimental

Conjunto de Datos

  • Fuente: Conjunto de datos del interactoma humano de Menche et al.
  • Escala: 13,460 nodos de proteína, 153 subgrafos de enfermedades, 10,743 pares de enfermedades
  • División del Conjunto de Datos:
    • RR0: RR > 0 como muestras positivas (82.6% muestras positivas)
    • RR1: RR > 1 como muestras positivas (58.4% muestras positivas)

Métricas de Evaluación

  • Métrica Principal: ROC AUC (apropiada para conjuntos de datos desequilibrados)
  • Métricas Secundarias: Precisión (Accuracy)

Métodos de Comparación

  • Node2Vec + SVM
  • BSE + Node2Vec + SVM (método más avanzado existente)

Detalles de Implementación

ParámetroValor
Número de Capas3
Tasa de Aprendizaje1e-04
Tamaño de Lote20
Dropout0.2
Dimensión de Incrustación de Nodos64
Número de Cabezas de Atención8
Dimensión de GPE8
Dimensión de LPE64

Resultados Experimentales

Resultados Principales

Conjunto de Datos RR0:

MétodoROC AUCPrecisión
SVM0.5309 ± 0.01050.8357 ± 0.0039
BSE_SVM0.6665 ± 0.03010.8765 ± 0.0117
TSPE0.9489 ± 0.05010.9069 ± 0.0683

Conjunto de Datos RR1:

MétodoROC AUCPrecisión
SVM0.5497 ± 0.00790.6150 ± 0.0078
BSE_SVM0.6469 ± 0.01830.6801 ± 0.0166
TSPE0.8009 ± 0.01520.7294 ± 0.0138

Experimentos de Ablación

Prueba de diferentes métodos de codificación posicional en el conjunto de datos RR1:

Codificación PosicionalROC AUCPrecisión
NoPE0.7971 ± 0.01460.7214 ± 0.0202
LPE0.8007 ± 0.01790.7234 ± 0.0202
SPE0.8009 ± 0.01520.7294 ± 0.0138

Hallazgos Experimentales

  1. Mejora Significativa de Rendimiento: TSPE mejora el ROC AUC en 28.24% en RR0 y 15.40% en RR1 en comparación con BSE_SVM
  2. Importancia de la Codificación Posicional: SPE muestra mejor rendimiento que LPE, demostrando el valor de la información de etiquetas de enfermedades
  3. Efectividad del Mecanismo de Atención: La arquitectura Transformador es significativamente superior al clasificador SVM tradicional

Trabajo Relacionado

Direcciones Principales de Investigación

  1. Métodos Basados en Redes: Utilización de redes de interacción de proteínas para predecir relaciones de enfermedades
  2. Métodos de Incrustación de Grafos: Como incrustación geodésica (GE) e Incrustación Supervisada Biológicamente (BSE)
  3. Transformadores de Grafos: Marco de Transformador de Grafos genérico de Dwivedi et al.

Ventajas de Este Trabajo

  1. Innovación Arquitectónica: Primera aplicación de Transformador a predicción de comorbilidad de enfermedades
  2. Mejora de Codificación: La SPE propuesta es más adecuada para tareas biomédicas que LPE estándar
  3. Avance de Rendimiento: Supera sustancialmente los métodos más avanzados existentes

Conclusiones y Discusión

Conclusiones Principales

  1. TSPE adapta exitosamente la arquitectura Transformador a la tarea de predicción de comorbilidad de enfermedades
  2. La codificación posicional de subgrafos SPE combina efectivamente información topológica y biológica
  3. El mecanismo de atención puede capturar efectivamente relaciones complejas entre nodos de proteínas

Limitaciones

  1. Dependencia de Datos: Requiere información de etiquetas de enfermedades para utilizar SPE
  2. Complejidad Computacional: La arquitectura Transformador tiene mayor costo computacional en comparación con métodos tradicionales
  3. Interpretabilidad: El significado biológico de los pesos de atención requiere investigación adicional

Direcciones Futuras

  1. Adaptación a otras tareas de predicción de relaciones de subgrafos
  2. Exploración de más tipos de métodos de codificación posicional
  3. Mejora de la interpretabilidad del modelo

Evaluación Profunda

Fortalezas

  1. Fuerte Innovación Metodológica: Primera aplicación exitosa de Transformador a predicción de comorbilidad de enfermedades
  2. Contribución Técnica Clara: El diseño de codificación posicional SPE es razonable y fusiona efectivamente múltiples tipos de información
  3. Diseño Experimental Completo: Incluye experimentos de comparación suficientes e investigación de ablación
  4. Mejora Significativa de Rendimiento: Logra mejoras sustanciales en ambos conjuntos de datos de referencia

Deficiencias

  1. Análisis Teórico Insuficiente: Falta análisis teórico profundo sobre por qué el Transformador es efectivo en esta tarea
  2. Eficiencia Computacional No Discutida: No se reportan comparaciones de tiempo de entrenamiento e eficiencia de inferencia
  3. Validación Biológica Limitada: Falta validación del significado biológico de los resultados predichos

Impacto

  1. Valor Académico: Proporciona nuevas perspectivas para la aplicación de Transformadores de Grafos en el campo biomédico
  2. Valor Práctico: Puede aplicarse directamente a sistemas de apoyo a decisiones clínicas
  3. Reproducibilidad: Proporciona implementación de código completa

Escenarios Aplicables

  1. Evaluación de riesgo de enfermedades y medicina personalizada
  2. Reposicionamiento de fármacos y predicción de efectos secundarios
  3. Otras tareas de predicción biomédica basadas en grafos

Referencias

  1. Menche et al. "Uncovering disease-disease relationships through the incomplete interactome." Science (2015)
  2. Dwivedi & Bresson. "A generalization of transformer networks to graphs." AAAI Workshop (2021)
  3. Grover & Leskovec. "node2vec: Scalable feature learning for networks." KDD (2016)

Evaluación General: Este es un artículo de investigación de alta calidad que introduce exitosamente la arquitectura Transformador en el campo de predicción de comorbilidad de enfermedades. El método de codificación posicional SPE propuesto posee motivación biológica clara e innovación técnica. Los resultados experimentales son impresionantes y proporcionan referencias valiosas para investigación en campos relacionados.