Graph Transformer with Disease Subgraph Positional Encoding for Improved Comorbidity Prediction
Qin, Liao
Comorbidity, the co-occurrence of multiple medical conditions in a single patient, profoundly impacts disease management and outcomes. Understanding these complex interconnections is crucial, especially in contexts where comorbidities exacerbate outcomes. Leveraging insights from the human interactome (HI) and advancements in graph-based methodologies, this study introduces Transformer with Subgraph Positional Encoding (TSPE) for disease comorbidity prediction. Inspired by Biologically Supervised Embedding (BSE), TSPE employs Transformer's attention mechanisms and Subgraph Positional Encoding (SPE) to capture interactions between nodes and disease associations. Our proposed SPE proves more effective than LPE, as used in Dwivedi et al.'s Graph Transformer, underscoring the importance of integrating clustering and disease-specific information for improved predictive accuracy. Evaluated on real clinical benchmark datasets (RR0 and RR1), TSPE demonstrates substantial performance enhancements over the state-of-the-art method, achieving up to 28.24% higher ROC AUC and 4.93% higher accuracy. This method shows promise for adaptation to other complex graph-based tasks and applications. The source code is available in the GitHub repository at: https://github.com/xihan-qin/TSPE-GraphTransformer.
تقترح هذه الدراسة طريقة محول الرسم البياني القائمة على ترميز الموضع للرسم البياني الفرعي (TSPE) لمعالجة مشكلة التنبؤ بالأمراض المصاحبة (comorbidity). تستخدم الطريقة بيانات الشبكة البشرية للتفاعلات (Human Interactome, HI)، وتستفيد من آلية الانتباه في محول الرسم البياني وترميز موضع الرسم البياني الفرعي المبتكر (SPE) لالتقاط التفاعلات بين العقد والارتباطات بين الأمراض. أظهرت التجارب على مجموعات البيانات المرجعية السريرية RR0 و RR1 أن TSPE يحقق تحسناً يصل إلى 28.24% في ROC AUC و 4.93% في الدقة مقارنة بأفضل الطرق الموجودة.
المشكلة الأساسية: التنبؤ بالأمراض المصاحبة، أي التنبؤ باحتمالية حدوث عدة أمراض في نفس المريض في نفس الوقت
الأهمية: تؤثر الأمراض المصاحبة بشكل كبير على إدارة المرض واستراتيجيات العلاج والنتائج السريرية، خاصة في الأوبئة مثل COVID-19، حيث قد تؤدي أمراض مصاحبة معينة إلى نتائج أكثر حدة
قيود الطرق الموجودة:
الطرق التقليدية مثل geodesic embedding (GE) لها أداء محدود
أفضل طريقة موجودة BSE، على الرغم من إدخالها آلية الاختيار الموجهة، لا تزال تستخدم مصنف SVM تقليدي
محول الرسم البياني الذي اقترحه Dwivedi وآخرون يستخدم ترميز الموضع اللابلاسي (LPE) الذي يفتقر إلى المعلومات الخاصة بالمرض
بناءً على أهمية الاتصالية بين العقد والارتباطات بين الأمراض التي أكدتها دراسة BSE، تستكشف هذه الورقة استخدام آلية الانتباه في نموذج محول الرسم البياني وترميز موضع الرسم البياني الفرعي المصمم خصيصاً لتحسين أداء التنبؤ بالأمراض المصاحبة.
اقتراح إطار عمل TSPE: تطبيق معمارية محول الرسم البياني لأول مرة على مهمة التنبؤ بالأمراض المصاحبة، مع تصميم بنية مشفر-فك تشفير مناسبة لبيانات الرسم البياني
ترميز موضع الرسم البياني الفرعي المبتكر (SPE): يجمع بين معلومات التجميع من ترميز الموضع اللابلاسي (LPE) ومعلومات تسميات المرض من ترميز موضع مشفر الرسم البياني (GPE)
تحسن كبير في الأداء: يتفوق بشكل كبير على أفضل الطرق الموجودة على مجموعتي البيانات المرجعيتين
تجارب استبدال شاملة: التحقق من فعالية طرق ترميز الموضع المختلفة