We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
تقترح هذه الورقة محول الرسم البياني الناعم (Soft Graph Transformer, SGT)، وهو معمارية عصبية ذات مدخلات-مخرجات ناعمة مصممة خصيصاً لكشف MIMO. على الرغم من أن كشف الحد الأقصى للاحتمالية (ML) يحقق دقة مثالية، إلا أن تعقيده الأسي غير قابل للتطبيق في الأنظمة الكبيرة، بينما تعتمد خوارزميات نقل الرسائل التقليدية على افتراضات تقاربية وغالباً ما تفشل في الأبعاد المحدودة. أظهرت كاشفات قائمة على محول Transformer مؤخراً أداءً ممتازاً، لكنها عادة تتجاهل بنية الرسم البياني العاملي لـ MIMO وتفشل في الاستفادة من المعلومات الناعمة السابقة. يعالج SGT هذه القيود من خلال الجمع بين آلية الانتباه الذاتي (ترميز الرموز والتبعيات السياقية داخل الرسوم البيانية الفرعية) وآلية الانتباه المتقاطع الموجهة بالرسم البياني (تنفيذ نقل الرسائل المنظم عبر الرسوم البيانية الفرعية). تسمح واجهة المدخلات الناعمة بدمج المعلومات السابقة المساعدة، مما ينتج مخرجات ناعمة فعالة مع الحفاظ على الكفاءة الحسابية.
كشف الحد الأقصى للاحتمالية: على الرغم من تحقيق دقة مثالية، فإن التعقيد الحسابي هو O(M^Nt) (حيث M هو عدد نقاط الكوكبة)، وهو غير قابل للتطبيق في الأنظمة الكبيرة
خوارزميات نقل الرسائل: مثل AMP و OAMP و MAMP، على الرغم من التعقيد المنخفض، تعتمد على افتراضات تقاربية وضعيفة في إعدادات الأبعاد المحدودة
طرق الكشف العميق: مثل OAMP-Net و DetNet، تتعلم معاملات الخوارزمية من البيانات، لكنها لا تزال محدودة بافتراضات الخوارزمية الأصلية
طرق Transformer الموجودة:
RE-MIMO تفتقر إلى الوعي الصريح بالرسم البياني
MIMO القائم على Transformer يستخدم تحليل QR لكن بتكلفة عالية ويتجاهل بنية الرسم البياني العاملي
تستشهد الورقة بأدبيات مهمة في مجالات كشف MIMO وخوارزميات نقل الرسائل والتعلم العميق و Transformer، خاصة:
أدبيات الأساس لسلسلة خوارزميات AMP 1-3
الأعمال الممثلة لطرق الكشف العميق 4-6
الورقة الأصلية لمعمارية Transformer 7
الأعمال ذات الصلة لأنظمة الاتصالات القائمة على Transformer 8-11
التقييم الشامل: هذه ورقة ذات ابتكار تقني قوي، تجمع بنجاح بين معمارية Transformer وبنية الرسم البياني العاملي لكشف MIMO، وتقترح طريقة SGT ذات أساس نظري وقيمة عملية. على الرغم من وجود مجال للتحسين في الكفاءة الحسابية وحجم تحسن الأداء، فإنها توفر استكشافاً قيماً لتطبيق التعلم العميق في مشاكل معالجة الإشارات المنظمة.