2025-11-12T05:10:09.967264

Soft Graph Transformer for MIMO Detection

Hong, Liu, Bian et al.
We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
academic

محول الرسم البياني الناعم لكشف MIMO

المعلومات الأساسية

  • معرّف الورقة: 2509.12694
  • العنوان: Soft Graph Transformer for MIMO Detection
  • المؤلفون: Jiadong Hong¹, Lei Liu¹, Xinyu Bian², Wenjie Wang², Zhaoyang Zhang¹
  • المؤسسات: ¹كلية الهندسة الإلكترونية والمعلومات، جامعة تشجيانج، ²مختبر النظرية، شركة هواوي للتكنولوجيا
  • التصنيفات: cs.LG cs.IT eess.SP math.IT
  • تاريخ النشر: 17 سبتمبر 2025 (arXiv v2)
  • رابط الورقة: https://arxiv.org/abs/2509.12694

الملخص

تقترح هذه الورقة محول الرسم البياني الناعم (Soft Graph Transformer, SGT)، وهو معمارية عصبية ذات مدخلات-مخرجات ناعمة مصممة خصيصاً لكشف MIMO. على الرغم من أن كشف الحد الأقصى للاحتمالية (ML) يحقق دقة مثالية، إلا أن تعقيده الأسي غير قابل للتطبيق في الأنظمة الكبيرة، بينما تعتمد خوارزميات نقل الرسائل التقليدية على افتراضات تقاربية وغالباً ما تفشل في الأبعاد المحدودة. أظهرت كاشفات قائمة على محول Transformer مؤخراً أداءً ممتازاً، لكنها عادة تتجاهل بنية الرسم البياني العاملي لـ MIMO وتفشل في الاستفادة من المعلومات الناعمة السابقة. يعالج SGT هذه القيود من خلال الجمع بين آلية الانتباه الذاتي (ترميز الرموز والتبعيات السياقية داخل الرسوم البيانية الفرعية) وآلية الانتباه المتقاطع الموجهة بالرسم البياني (تنفيذ نقل الرسائل المنظم عبر الرسوم البيانية الفرعية). تسمح واجهة المدخلات الناعمة بدمج المعلومات السابقة المساعدة، مما ينتج مخرجات ناعمة فعالة مع الحفاظ على الكفاءة الحسابية.

الخلفية البحثية والدافع

تعريف المشكلة

أنظمة MIMO هي أساس الاتصالات اللاسلكية الحديثة، حيث توفر كفاءة طيفية عالية وروابط قوية، لكن كشف الرموز الفعال لا يزال يمثل مشكلة تحديًا.

قيود الطرق الموجودة

  1. كشف الحد الأقصى للاحتمالية: على الرغم من تحقيق دقة مثالية، فإن التعقيد الحسابي هو O(M^Nt) (حيث M هو عدد نقاط الكوكبة)، وهو غير قابل للتطبيق في الأنظمة الكبيرة
  2. خوارزميات نقل الرسائل: مثل AMP و OAMP و MAMP، على الرغم من التعقيد المنخفض، تعتمد على افتراضات تقاربية وضعيفة في إعدادات الأبعاد المحدودة
  3. طرق الكشف العميق: مثل OAMP-Net و DetNet، تتعلم معاملات الخوارزمية من البيانات، لكنها لا تزال محدودة بافتراضات الخوارزمية الأصلية
  4. طرق Transformer الموجودة:
    • RE-MIMO تفتقر إلى الوعي الصريح بالرسم البياني
    • MIMO القائم على Transformer يستخدم تحليل QR لكن بتكلفة عالية ويتجاهل بنية الرسم البياني العاملي

الدافع البحثي

مستوحاة من خوارزميات نقل الرسائل الكلاسيكية لكشف MIMO، تهدف هذه الورقة إلى تصميم معمارية Transformer قادرة على:

  1. الاستفادة من بنية الرسم البياني العاملي لـ MIMO
  2. دعم واجهة مدخلات-مخرجات ناعمة
  3. توفير نهج منطقي موحد للترميز السياقي ونقل الرسائل

المساهمات الأساسية

  1. اقتراح معمارية SGT: أول كاشف MIMO يوحد الانتباه الذاتي والمتقاطع الموجه بالرسم البياني العاملي في إطار عمل بأسلوب AMP
  2. طريقة الترميز الموجهة بالرسم البياني: تحويل الرسم البياني العاملي الكثيف المرجح لنظام MIMO إلى تمثيل ثنائي الرسم البياني الفرعي مناسب لمعالجة Transformer
  3. واجهة مدخلات-مخرجات ناعمة: دمج طبيعي للمعلومات السابقة الخارجية من وحدات المستقبل الأخرى
  4. تحسن الأداء: تحقيق دقة قريبة من كشف ML في أنظمة MIMO الصغيرة، مع إظهار نمو تعقيد تربيعي أفضل في الأنظمة الكبيرة

شرح الطريقة

تعريف المهمة

المدخلات:

  • متجه الإشارة المستقبلة y ∈ R^(2Nr)
  • مصفوفة القناة H ∈ R^(2Nr×2Nt)
  • معلومات تباين الضوضاء
  • معلومات ناعمة سابقة اختيارية (LLR)

المخرجات:

  • نسب الاحتمالية اللوغاريتمية (LLR) على مستوى البت، مناسبة لمفكك رموز القناة

القيود: نموذج النظام الخطي y = Hx + n، حيث n ~ N(0,Σ)

معمارية النموذج

1. الترميز الموجه بالرسم البياني (Graph-Aware Tokenization)

تحليل الرسم البياني العاملي لـ MIMO إلى رسمين بيانيين فرعيين:

رموز/رسم بياني فرعي للقيود الخطية:

T_lin = {τ_j = (y_j, h_j, σ²_j) | j ∈ {1,...,2Nr}}

حيث h_j هي الصف j من H، ترميز قيود الاحتمالية المحلية بين الإشارة المستقبلة والرموز المرسلة.

رموز/رسم بياني فرعي للرموز:

T_sym = {x_i^(l) | i ∈ {1,...,2Nt}}

تقابل عقد متغيرات الرموز المرسلة، تعمل كاستعلامات تتفاعل مع رموز القيود من خلال الانتباه المتقاطع.

2. تصميم آليات الانتباه

الانتباه الذاتي - ترميز السياق: توفير ترميز سياقي قوي داخل مجموعات الرموز المتجانسة، مما يضمن الاتساق بين الكيانات المتشابهة:

t̃_j = ∑_{k=1}^N α_{jk} W^V t_k
α_{jk} = softmax((W^Q t_j)^T (W^K t_k) / √d_k)

الانتباه المتقاطع - نقل الرسائل: تنفيذ نقل رسائل موجه بين أنواع الرموز غير المتجانسة:

t̃_j = ∑_i α_{ij} W^V t_i
α_{ij} = softmax((W^Q t_j)^T (W^K t_i) / √d_k)

3. واجهة المدخلات-المخرجات الناعمة

وحدة تضمين المدخلات الناعمة:

  • رموز الرموز: T_sym، البعد 2Nt, Nbits/2
  • رموز القيود الخطية: T_lin، البعد 2Nr, 2Nt+2
  • معالجة مستقلة من خلال FFN مخصص وإضافة ترميز الموضع

وحدة المخرجات الناعمة:

  • استقبال التمثيلات المضمنة: البعد 2Nt, d_model
  • المعالجة من خلال FFN + تفعيل Sigmoid
  • إنتاج المخرجات الناعمة النهائية: البعد 2Nt, Nbits/2

نقاط الابتكار التقني

  1. تصميم الانتباه المنظم: بخلاف CrossMPT، يجمع SGT الانتباه الذاتي والمتقاطع لخصائص الرسم البياني الفرعي المتجانس في MIMO
  2. مزايا الحفاظ على المعلومات: مقارنة بالطرق التي تستخدم تحليل QR، يحتفظ الترميز الموجه بالرسم البياني بمزيد من المعلومات على مستوى الرموز
  3. إطار عمل موحد: توحيد التحديثات المستوحاة من AMP مع معمارية Transformer، مما يحقق نقل رسائل قابل للتفسير

إعداد التجارب

مجموعة البيانات

  • نموذج القناة: قناة تلاشي Rayleigh تحت CSI المثالي
  • طريقة التعديل: QPSK (مفتاح إزاحة الطور الرباعي)
  • تكوين النظام: أنظمة MIMO 8×8 و 8×16 و 16×16
  • الضوضاء: ضوضاء غاوسية بيضاء مضافة

مؤشرات التقييم

  • BER (معدل خطأ البت): معدل خطأ البت
  • خسارة التدريب: تحليل التقارب
  • وقت التشغيل: تقييم الكفاءة الحسابية

طرق المقارنة

  • الطرق الكلاسيكية: LMMSE و OAMP و Maximum Likelihood
  • طرق التعلم العميق: OAMPNet2 و DetNet
  • طرق Transformer: Transformer-based MIMO و RE-MIMO
  • التجارب الاستئصالية: نسخة بدون انتباه متقاطع، نسخة ترميز فقط

تفاصيل التنفيذ

  • أبعاد النموذج: d_model = 128
  • عدد الطبقات: L = 8 طبقات
  • معاملات التدريب: معدل تعلم متطابق وحجم دفعة وخطوات تدريب
  • منصة الأجهزة: وحدة معالجة رسومات RTX 4090

نتائج التجارب

النتائج الرئيسية

مقارنة أداء BER:

  • في نظام MIMO 8×8، يتفوق SGT بشكل كبير على OAMPNet2 و Transformer-based MIMO
  • يحافظ على ميزة الأداء في الأنظمة 8×16 و 16×16
  • يقترب من أداء الحد الأعلى لكشف ML

تحليل وقت التشغيل (وحدة معالجة رسومات RTX 4090، 1000 عينة):

الطريقة8×88×1616×16
LMMSE0.00679s0.00718s0.00742s
OAMP0.02208s0.02234s0.02408s
OAMPNet20.03333s0.03415s0.03507s
Transformer-based MIMO0.03844s0.03924s0.04028s
SGT (المقترح)0.09351s0.09464s0.09498s

التجارب الاستئصالية

دور الترميز الموجه بالرسم البياني:

  • يحقق الترميز الكامل خسارة نهائية أقل في الأنظمة الصغيرة (8×8)
  • يتحقق من القدرة على الاحتفاظ بمعلومات تفصيلية على مستوى الرموز
  • يتطلب التعاون مع الانتباه المتقاطع في الأنظمة الكبيرة

مساهمة الانتباه المتقاطع:

  • تحقيق تقارب أسرع ودقة نهائية أفضل
  • توفير توجيه مشابه لمعالجة QR المسبقة، لكن قابل للتعلم بالكامل
  • تخفيف مشاكل توقف التدريب في الأنظمة الكبيرة

تحليل التعقيد

مقارنة التعقيد التقاربي:

الطريقةالتعقيداتجاه النمو
كشف MLO(M^Nt)أسي
OAMP/OAMPNetO(KNrNt²)تكعيبي
Transformer-based MIMOO(NrNt² + LNt²dmodel)تكعيبي
SGTL·O(Nr² + Nt² + NrNt)·dmodelتربيعي

الأعمال ذات الصلة

تطور طرق كشف MIMO

  1. الطرق الكلاسيكية: من الكشف الخطي (MMSE) إلى الكشف غير الخطي (ML)
  2. خوارزميات نقل الرسائل: تطور سلسلة خوارزميات AMP وقيودها
  3. طرق التعلم العميق: من DetNet إلى تطور طرق الكشف العميق

تطبيقات Transformer في الاتصالات

  1. فك تشفير القناة: ECCT يستفيد من رسم بياني Tanner لـ LDPC، CrossMPT يحاكي نقل الرسائل من خلال الانتباه المتقاطع
  2. كشف MIMO: مساهمات RE-MIMO و Transformer-based MIMO وأوجه قصورها

موضع هذه الورقة

SGT هو أول كاشف MIMO يدمج بنية الرسم البياني العاملي بشكل صريح في معمارية Transformer، موحداً ترميز السياق ونقل الرسائل.

الخلاصة والنقاش

الاستنتاجات الرئيسية

  1. يجمع SGT بنجاح بين قدرة نمذجة السياق في Transformer ونقل الرسائل المنظم في الرسم البياني العاملي
  2. يحقق أداءً قريباً من ML في أنظمة MIMO الصغيرة، مع الحفاظ على الكفاءة الحسابية
  3. توفر واجهة المدخلات-المخرجات الناعمة المرونة في التكامل مع وحدات المستقبل الأخرى
  4. يوفر نمو التعقيد التربيعي قابلية توسع أفضل في الأنظمة الكبيرة

القيود

  1. الحمل الحسابي: على الرغم من نمو التعقيد الأفضل، فإن وقت التشغيل المطلق لا يزال أعلى من الطرق التقليدية
  2. التحقق من الأنظمة الكبيرة: تتطلب أداء الكشف في إعدادات MIMO الكبيرة جداً مزيداً من البحث
  3. التحليل النظري: يفتقد تحليل التقارب النظري الصارم
  4. التكيف مع القناة: تم التحقق بشكل أساسي تحت قنوات تلاشي Rayleigh، ويتطلب التكيف مع نماذج قنوات أخرى مزيداً من الاستكشاف

الاتجاهات المستقبلية

  1. تحسين الكفاءة الحسابية بشكل أكبر وتقليل وقت التشغيل المطلق
  2. التوسع للتحقق من أنظمة MIMO الأكبر حجماً
  3. دراسة المتانة تحت ظروف قنوات مختلفة
  4. التحسين المشترك مع مكونات المستقبل الأخرى

التقييم المتعمق

المزايا

  1. ابتكار قوي: أول دمج صريح لبنية الرسم البياني العاملي في Transformer، تصميم جديد
  2. أساس نظري متين: نقل الرسائل المستوحى من إطار عمل AMP له دعم نظري قوي
  3. تجارب شاملة: تتضمن تجارب استئصالية مفصلة وتحليل التعقيد
  4. قيمة عملية عالية: تعزز واجهة المدخلات-المخرجات الناعمة مرونة التكامل في النظام
  5. كتابة واضحة: وصف دقيق للتفاصيل التقنية، رسوم بيانية بديهية

أوجه القصور

  1. تحسن الأداء محدود: التحسن مقارنة بـ baseline متسق لكن بحجم متواضع
  2. الكفاءة الحسابية: وقت التشغيل الفعلي أعلى بـ 2-3 مرات من الطرق التقليدية
  3. نطاق التحقق: التحقق بشكل أساسي في الأنظمة الصغيرة وظروف قنوات محددة
  4. نقص التحليل النظري: يفتقد ضمانات التقارب والأمثلية النظرية
  5. المقارنة غير شاملة: تفتقد المقارنة مع أحدث طرق التعلم العميق لكشف MIMO

التأثير

  1. المساهمة الأكاديمية: توفير أفكار جديدة لتطبيق Transformer في مشاكل معالجة الإشارات المنظمة
  2. القيمة العملية: توفير إطار عمل قابل للتفسير لأجيال قادمة من كواشف MIMO القائمة على التعلم العميق
  3. قابلية التكرار: وصف تفاصيل تقنية كافية، مما يسهل إعادة الإنتاج والتوسع

السيناريوهات المناسبة

  1. أنظمة MIMO الصغيرة إلى المتوسطة: ميزة أداء واضحة
  2. أنظمة المستقبل التي تتطلب تفاعل معلومات ناعمة: توفر واجهة SISO مرونة
  3. التطبيقات التي تتطلب قابلية تفسير: التصميم المنظم يسهل الفهم والتصحيح
  4. أنظمة النماذج الأولية البحثية: توفير إطار عمل أساسي لتطوير خوارزميات إضافية

المراجع

تستشهد الورقة بأدبيات مهمة في مجالات كشف MIMO وخوارزميات نقل الرسائل والتعلم العميق و Transformer، خاصة:

  • أدبيات الأساس لسلسلة خوارزميات AMP 1-3
  • الأعمال الممثلة لطرق الكشف العميق 4-6
  • الورقة الأصلية لمعمارية Transformer 7
  • الأعمال ذات الصلة لأنظمة الاتصالات القائمة على Transformer 8-11

التقييم الشامل: هذه ورقة ذات ابتكار تقني قوي، تجمع بنجاح بين معمارية Transformer وبنية الرسم البياني العاملي لكشف MIMO، وتقترح طريقة SGT ذات أساس نظري وقيمة عملية. على الرغم من وجود مجال للتحسين في الكفاءة الحسابية وحجم تحسن الأداء، فإنها توفر استكشافاً قيماً لتطبيق التعلم العميق في مشاكل معالجة الإشارات المنظمة.