Graph Transformer with Disease Subgraph Positional Encoding for Improved Comorbidity Prediction
Qin, Liao
Comorbidity, the co-occurrence of multiple medical conditions in a single patient, profoundly impacts disease management and outcomes. Understanding these complex interconnections is crucial, especially in contexts where comorbidities exacerbate outcomes. Leveraging insights from the human interactome (HI) and advancements in graph-based methodologies, this study introduces Transformer with Subgraph Positional Encoding (TSPE) for disease comorbidity prediction. Inspired by Biologically Supervised Embedding (BSE), TSPE employs Transformer's attention mechanisms and Subgraph Positional Encoding (SPE) to capture interactions between nodes and disease associations. Our proposed SPE proves more effective than LPE, as used in Dwivedi et al.'s Graph Transformer, underscoring the importance of integrating clustering and disease-specific information for improved predictive accuracy. Evaluated on real clinical benchmark datasets (RR0 and RR1), TSPE demonstrates substantial performance enhancements over the state-of-the-art method, achieving up to 28.24% higher ROC AUC and 4.93% higher accuracy. This method shows promise for adaptation to other complex graph-based tasks and applications. The source code is available in the GitHub repository at: https://github.com/xihan-qin/TSPE-GraphTransformer.
academic
Graph Transformer con Positional Encoding di Sottografi di Malattie per la Previsione Migliorata della Comorbidità
Questo studio affronta il problema della previsione della comorbidità delle malattie proponendo un metodo Graph Transformer basato su positional encoding di sottografi (TSPE). Il metodo sfrutta i dati dell'interattoma umano (Human Interactome, HI), utilizzando il meccanismo di attenzione del Transformer e un innovativo positional encoding di sottografi (SPE) per catturare le interazioni tra nodi e le associazioni di malattie. Gli esperimenti sui dataset di riferimento clinico RR0 e RR1 dimostrano che TSPE migliora l'AUC ROC fino al 28,24% e l'accuratezza del 4,93% rispetto ai metodi migliori esistenti.
Problema Centrale: Previsione della comorbidità delle malattie, ovvero la previsione della probabilità che più malattie si verifichino simultaneamente nello stesso paziente
Importanza: La comorbidità influisce significativamente sulla gestione della malattia, sulle strategie terapeutiche e sui risultati prognostici, in particolare nelle pandemie come il COVID-19, dove specifiche comorbidità portano a risultati più gravi
Limitazioni dei Metodi Esistenti:
I metodi tradizionali come il geodesic embedding (GE) hanno prestazioni limitate
Il metodo migliore esistente BSE, sebbene introduca un meccanismo di selezione supervisionato, utilizza ancora il classificatore SVM tradizionale
Il Graph Transformer di Dwivedi et al. utilizza il positional encoding laplaciano (LPE) che manca di informazioni specifiche della malattia
Basandosi sull'importanza della connettività dei nodi e dell'associazione di malattie enfatizzata dalla ricerca BSE, questo articolo esplora l'utilizzo del meccanismo di attenzione del modello Transformer e di un positional encoding di sottografi appositamente progettato per migliorare le prestazioni di previsione della comorbidità.
Proposta del Framework TSPE: Prima applicazione dell'architettura Transformer al compito di previsione della comorbidità delle malattie, con una struttura encoder-decoder progettata per dati grafici
Innovativo Positional Encoding di Sottografi (SPE): Combina le informazioni di clustering del positional encoding laplaciano (LPE) e le informazioni di etichette di malattie del positional encoding dell'encoder grafico (GPE)
Miglioramento Significativo delle Prestazioni: Supera notevolmente i metodi migliori esistenti su entrambi i dataset di riferimento
Esperimenti di Ablazione Completi: Verifica l'efficacia di diversi metodi di positional encoding
1. Generazione di Embedding dei Nodi
Utilizza Node2Vec per generare embedding dei nodi con parametri p=1, q=1 (random walk bilanciato) e dimensione della finestra pari a 2.
LPE: Positional encoding laplaciano, cattura le informazioni di clustering del grafo
GPE: Positional encoding dell'encoder grafico, cattura le informazioni di etichette di malattie
3. Processo di Calcolo di GPE
Z = AW # (11) Calcolo embedding GEE
Z = UΣV^T # (12) Decomposizione ai valori singolari
GPE = U_d # (13) Selezione dei primi d vettori singolari sinistri
4. Meccanismo di Classificazione
s = softmax(||X||²₂,axis=1) # (6) Calcolo vettore di punteggio
y_cand = Σ(X·diag(s))_j # (8) Somma ponderata
y_pred = σ(Wy_cand + b) # (9) Previsione finale
Meccanismo di Attenzione Unificato: Utilizza attenzione multi-testa senza mascheramento, permettendo al modello di prestare attenzione a tutti i nodi nel sottografo
Positional Encoding Specifico della Malattia: GPE sfrutta direttamente le informazioni di etichette di malattie, più mirato rispetto all'LPE tradizionale
Fusione di Informazioni Multilivello: SPE cattura simultaneamente la struttura topologica del grafo (LPE) e il significato biologico (GPE)
Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità che introduce con successo l'architettura Transformer nel campo della previsione della comorbidità delle malattie. Il metodo di positional encoding SPE proposto ha una chiara motivazione biologica e innovazione tecnica. I risultati sperimentali sono impressionanti e forniscono un riferimento prezioso per la ricerca correlata.