2025-11-19T06:52:13.983675

Graph Transformer with Disease Subgraph Positional Encoding for Improved Comorbidity Prediction

Qin, Liao

Comorbidity, the co-occurrence of multiple medical conditions in a single patient, profoundly impacts disease management and outcomes. Understanding these complex interconnections is crucial, especially in contexts where comorbidities exacerbate outcomes. Leveraging insights from the human interactome (HI) and advancements in graph-based methodologies, this study introduces Transformer with Subgraph Positional Encoding (TSPE) for disease comorbidity prediction. Inspired by Biologically Supervised Embedding (BSE), TSPE employs Transformer's attention mechanisms and Subgraph Positional Encoding (SPE) to capture interactions between nodes and disease associations. Our proposed SPE proves more effective than LPE, as used in Dwivedi et al.'s Graph Transformer, underscoring the importance of integrating clustering and disease-specific information for improved predictive accuracy. Evaluated on real clinical benchmark datasets (RR0 and RR1), TSPE demonstrates substantial performance enhancements over the state-of-the-art method, achieving up to 28.24% higher ROC AUC and 4.93% higher accuracy. This method shows promise for adaptation to other complex graph-based tasks and applications. The source code is available in the GitHub repository at: https://github.com/xihan-qin/TSPE-GraphTransformer.

academic

Transformador de Grafos con Codificación Posicional de Subgrafos de Enfermedades para Predicción Mejorada de Comorbilidad

Información Básica

ID del Artículo: 2503.03046
Título: Graph Transformer with Disease Subgraph Positional Encoding for Improved Comorbidity Prediction
Autores: Xihan Qin, Li Liao (Universidad de Delaware)
Clasificación: cs.LG (Aprendizaje Automático)
Enlace del Artículo: https://arxiv.org/abs/2503.03046
Enlace del Código: https://github.com/xihan-qin/TSPE-GraphTransformer

Resumen

Este estudio propone un método de Transformador de Grafos basado en codificación posicional de subgrafos (TSPE) para abordar el problema de predicción de comorbilidad de enfermedades. El método utiliza datos del Interactoma Humano (Human Interactome, HI) y aprovecha el mecanismo de atención del Transformador y una novedosa codificación posicional de subgrafos (SPE) para capturar las interacciones entre nodos y las asociaciones de enfermedades. Los experimentos en los conjuntos de datos de referencia clínicos RR0 y RR1 demuestran que TSPE mejora el ROC AUC hasta un 28.24% en comparación con los métodos existentes más avanzados, con una mejora de precisión del 4.93%.

Antecedentes de Investigación y Motivación

Definición del Problema

Problema Central: Predicción de comorbilidad de enfermedades, es decir, predecir la probabilidad de que múltiples enfermedades ocurran simultáneamente en el mismo paciente
Importancia: La comorbilidad afecta significativamente la gestión de enfermedades, estrategias de tratamiento y resultados del pronóstico, particularmente en pandemias como COVID-19, donde ciertas comorbilidades conducen a resultados más graves
Limitaciones de Métodos Existentes:
- Los métodos tradicionales como la incrustación geodésica (GE) tienen un rendimiento limitado
- El método más avanzado existente, BSE, aunque introduce un mecanismo de selección supervisada, sigue utilizando un clasificador SVM tradicional
- El Transformador de Grafos de Dwivedi et al. utiliza codificación posicional de Laplace (LPE) que carece de información específica de enfermedades

Motivación de la Investigación

Basándose en la importancia enfatizada por la investigación BSE sobre la conectividad de nodos y las asociaciones de enfermedades, este trabajo explora la utilización del mecanismo de atención del modelo Transformador y codificación posicional de subgrafos especialmente diseñada para mejorar el rendimiento de predicción de comorbilidad.

Contribuciones Principales

Marco TSPE Propuesto: Primera aplicación de la arquitectura Transformador a la tarea de predicción de comorbilidad de enfermedades, con diseño de estructura codificador-decodificador adaptada a datos de grafos
Codificación Posicional de Subgrafos Innovadora (SPE): Combina información de agrupamiento de la codificación posicional de Laplace (LPE) e información de etiquetas de enfermedades de la codificación posicional de incrustación de codificador de grafos (GPE)
Mejora Significativa de Rendimiento: Supera sustancialmente los métodos más avanzados existentes en ambos conjuntos de datos de referencia
Experimentos de Ablación Exhaustivos: Valida la efectividad de diferentes métodos de codificación posicional

Explicación Detallada del Método

Definición de la Tarea

Entrada: Dos subgrafos de enfermedades en el gráfico del interactoma humano (conjuntos de nodos de proteínas)
Salida: Resultado de clasificación binaria que determina si dos enfermedades tienen comorbilidad
Restricción: Definición de muestras positivas y negativas basada en valores de riesgo relativo clínico (RR)

Arquitectura del Modelo

Marco General

TSPE adopta una arquitectura codificador-decodificador:

Codificador: Procesa incrustaciones de nodos de la enfermedad A
Decodificador: Procesa incrustaciones de nodos de la enfermedad B y aprende relaciones entre enfermedades a través de atención cruzada
Capa de Clasificación: Convierte la salida del decodificador en un resultado de clasificación binaria

Componentes Técnicos Clave

1. Generación de Incrustación de Nodos Se utiliza Node2Vec para generar incrustaciones de nodos con parámetros configurados como p=1, q=1 (paseo aleatorio equilibrado), con tamaño de ventana de 2.

2. Codificación Posicional de Subgrafos (SPE) SPE = (M + LPE), GPE, donde:

M: Matriz de incrustación de nodos
LPE: Codificación posicional de Laplace, captura información de agrupamiento del gráfico
GPE: Codificación posicional de incrustación de codificador de grafos, captura información de etiquetas de enfermedades

3. Proceso de Cálculo de GPE

Z = AW                    # (11) Cálculo de incrustación GEE
Z = UΣV^T                 # (12) Descomposición de valores singulares
GPE = U_d                 # (13) Seleccionar los primeros d vectores singulares izquierdos

4. Mecanismo de Clasificación

s = softmax(||X||²₂,axis=1)     # (6) Calcular vector de puntuación
y_cand = Σ(X·diag(s))_j         # (8) Suma ponderada
y_pred = σ(Wy_cand + b)         # (9) Predicción final

Puntos de Innovación Técnica

Mecanismo de Atención Unificado: Utiliza atención multiencabezada sin máscara, permitiendo que el modelo atienda a todos los nodos dentro del subgrafo
Codificación Posicional Específica de Enfermedad: GPE utiliza directamente información de etiquetas de enfermedades, siendo más específica que LPE tradicional
Fusión de Información Multinivel: SPE captura simultáneamente la estructura topológica del gráfico (LPE) y el significado biológico (GPE)

Configuración Experimental

Conjunto de Datos

Fuente: Conjunto de datos del interactoma humano de Menche et al.
Escala: 13,460 nodos de proteína, 153 subgrafos de enfermedades, 10,743 pares de enfermedades
División del Conjunto de Datos:
- RR0: RR > 0 como muestras positivas (82.6% muestras positivas)
- RR1: RR > 1 como muestras positivas (58.4% muestras positivas)

Métricas de Evaluación

Métrica Principal: ROC AUC (apropiada para conjuntos de datos desequilibrados)
Métricas Secundarias: Precisión (Accuracy)

Métodos de Comparación

Node2Vec + SVM
BSE + Node2Vec + SVM (método más avanzado existente)

Detalles de Implementación

Parámetro	Valor
Número de Capas	3
Tasa de Aprendizaje	1e-04
Tamaño de Lote	20
Dropout	0.2
Dimensión de Incrustación de Nodos	64
Número de Cabezas de Atención	8
Dimensión de GPE	8
Dimensión de LPE	64

Resultados Experimentales

Resultados Principales

Conjunto de Datos RR0:

Método	ROC AUC	Precisión
SVM	0.5309 ± 0.0105	0.8357 ± 0.0039
BSE_SVM	0.6665 ± 0.0301	0.8765 ± 0.0117
TSPE	0.9489 ± 0.0501	0.9069 ± 0.0683

Conjunto de Datos RR1:

Método	ROC AUC	Precisión
SVM	0.5497 ± 0.0079	0.6150 ± 0.0078
BSE_SVM	0.6469 ± 0.0183	0.6801 ± 0.0166
TSPE	0.8009 ± 0.0152	0.7294 ± 0.0138

Experimentos de Ablación

Prueba de diferentes métodos de codificación posicional en el conjunto de datos RR1:

Codificación Posicional	ROC AUC	Precisión
NoPE	0.7971 ± 0.0146	0.7214 ± 0.0202
LPE	0.8007 ± 0.0179	0.7234 ± 0.0202
SPE	0.8009 ± 0.0152	0.7294 ± 0.0138

Hallazgos Experimentales

Mejora Significativa de Rendimiento: TSPE mejora el ROC AUC en 28.24% en RR0 y 15.40% en RR1 en comparación con BSE_SVM
Importancia de la Codificación Posicional: SPE muestra mejor rendimiento que LPE, demostrando el valor de la información de etiquetas de enfermedades
Efectividad del Mecanismo de Atención: La arquitectura Transformador es significativamente superior al clasificador SVM tradicional

Trabajo Relacionado

Direcciones Principales de Investigación

Métodos Basados en Redes: Utilización de redes de interacción de proteínas para predecir relaciones de enfermedades
Métodos de Incrustación de Grafos: Como incrustación geodésica (GE) e Incrustación Supervisada Biológicamente (BSE)
Transformadores de Grafos: Marco de Transformador de Grafos genérico de Dwivedi et al.

Ventajas de Este Trabajo

Innovación Arquitectónica: Primera aplicación de Transformador a predicción de comorbilidad de enfermedades
Mejora de Codificación: La SPE propuesta es más adecuada para tareas biomédicas que LPE estándar
Avance de Rendimiento: Supera sustancialmente los métodos más avanzados existentes

Conclusiones y Discusión

Conclusiones Principales

TSPE adapta exitosamente la arquitectura Transformador a la tarea de predicción de comorbilidad de enfermedades
La codificación posicional de subgrafos SPE combina efectivamente información topológica y biológica
El mecanismo de atención puede capturar efectivamente relaciones complejas entre nodos de proteínas

Limitaciones

Dependencia de Datos: Requiere información de etiquetas de enfermedades para utilizar SPE
Complejidad Computacional: La arquitectura Transformador tiene mayor costo computacional en comparación con métodos tradicionales
Interpretabilidad: El significado biológico de los pesos de atención requiere investigación adicional

Direcciones Futuras

Adaptación a otras tareas de predicción de relaciones de subgrafos
Exploración de más tipos de métodos de codificación posicional
Mejora de la interpretabilidad del modelo

Evaluación Profunda

Fortalezas

Fuerte Innovación Metodológica: Primera aplicación exitosa de Transformador a predicción de comorbilidad de enfermedades
Contribución Técnica Clara: El diseño de codificación posicional SPE es razonable y fusiona efectivamente múltiples tipos de información
Diseño Experimental Completo: Incluye experimentos de comparación suficientes e investigación de ablación
Mejora Significativa de Rendimiento: Logra mejoras sustanciales en ambos conjuntos de datos de referencia

Deficiencias

Análisis Teórico Insuficiente: Falta análisis teórico profundo sobre por qué el Transformador es efectivo en esta tarea
Eficiencia Computacional No Discutida: No se reportan comparaciones de tiempo de entrenamiento e eficiencia de inferencia
Validación Biológica Limitada: Falta validación del significado biológico de los resultados predichos

Impacto

Valor Académico: Proporciona nuevas perspectivas para la aplicación de Transformadores de Grafos en el campo biomédico
Valor Práctico: Puede aplicarse directamente a sistemas de apoyo a decisiones clínicas
Reproducibilidad: Proporciona implementación de código completa

Escenarios Aplicables

Evaluación de riesgo de enfermedades y medicina personalizada
Reposicionamiento de fármacos y predicción de efectos secundarios
Otras tareas de predicción biomédica basadas en grafos

Referencias

Menche et al. "Uncovering disease-disease relationships through the incomplete interactome." Science (2015)
Dwivedi & Bresson. "A generalization of transformer networks to graphs." AAAI Workshop (2021)
Grover & Leskovec. "node2vec: Scalable feature learning for networks." KDD (2016)

Evaluación General: Este es un artículo de investigación de alta calidad que introduce exitosamente la arquitectura Transformador en el campo de predicción de comorbilidad de enfermedades. El método de codificación posicional SPE propuesto posee motivación biológica clara e innovación técnica. Los resultados experimentales son impresionantes y proporcionan referencias valiosas para investigación en campos relacionados.