We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
academic
Transformateur de Graphe Souple pour la Détection MIMO
Cet article propose le Transformateur de Graphe Souple (Soft Graph Transformer, SGT), une architecture neuronale à entrée souple-sortie souple conçue spécifiquement pour la détection MIMO. Bien que la détection par vraisemblance maximale (ML) atteigne une précision optimale, sa complexité exponentielle n'est pas viable pour les systèmes à grande échelle, tandis que les algorithmes de transmission de messages traditionnels reposent sur des hypothèses asymptotiques qui échouent souvent en dimensions finies. Les détecteurs récents basés sur Transformateur montrent des performances excellentes, mais ignorent généralement la structure du graphe factoriel MIMO et ne peuvent pas exploiter les informations de probabilité a priori souples. SGT résout ces limitations en combinant des mécanismes d'auto-attention (codant les dépendances contextuelles au sein des sous-graphes de symboles et de contraintes) et des mécanismes d'attention croisée conscients du graphe (effectuant une transmission de messages structurée entre sous-graphes). Son interface d'entrée souple permet l'intégration de probabilités a priori auxiliaires, produisant des sorties souples efficaces tout en maintenant l'efficacité computationnelle.
Les systèmes MIMO, bien qu'étant fondamentaux pour les communications sans fil modernes, offrant une efficacité spectrale élevée et des liaisons robustes, présentent toujours un défi pour la détection efficace de symboles.
Détection par vraisemblance maximale: Bien qu'elle atteigne une précision optimale, la complexité computationnelle est O(M^Nt) (M étant le nombre de points de constellation), ce qui n'est pas viable pour les systèmes à grande échelle
Algorithmes de transmission de messages: Tels que AMP, OAMP, MAMP, bien que de complexité inférieure, dépendent d'hypothèses asymptotiques et sont fragiles en configurations de dimensions finies
Méthodes de déroulement profond: Telles que OAMP-Net, DetNet, qui apprennent les paramètres d'algorithmes par les données, mais restent limitées par les hypothèses de l'algorithme original
Méthodes Transformateur existantes:
RE-MIMO manque de conscience explicite du graphe
MIMO basé sur Transformateur utilise la décomposition QR mais à coût élevé et ignore la structure du graphe factoriel
Proposition de l'architecture SGT: Premier détecteur MIMO unifiant l'auto-attention guidée par graphe factoriel et l'attention croisée dans un cadre de style AMP
Méthode de tokenisation consciente du graphe: Transforme le graphe factoriel dense pondéré du système MIMO en une représentation à deux sous-graphes adaptée au traitement par Transformateur
Interface d'entrée souple-sortie souple: Intègre naturellement les informations de probabilité a priori externes provenant d'autres modules du récepteur
Amélioration des performances: Atteint une précision proche de la détection ML dans les systèmes MIMO à petite échelle et démontre une croissance de complexité quadratique supérieure dans les systèmes à grande échelle
où h_j est la j-ième ligne de H, codant les contraintes de vraisemblance locale entre le signal reçu et les symboles transmis.
Tokens/Sous-graphe de Symboles:
T_sym = {x_i^(l) | i ∈ {1,...,2Nt}}
Correspond aux nœuds variables des symboles transmis, servant de requêtes d'intégration interagissant avec les tokens de contraintes via attention croisée.
Auto-attention - Codage Contextuel:
Fournit un codage contextuel robuste au sein d'ensembles de tokens homogènes, assurant la cohérence entre entités similaires:
Conception d'attention structurée: Contrairement à CrossMPT, SGT combine auto-attention et attention croisée adaptées aux caractéristiques de sous-graphes homogènes de MIMO
Avantages de préservation d'information: Comparée aux méthodes utilisant la décomposition QR, la tokenisation consciente du graphe préserve davantage d'informations au niveau des symboles
Cadre unifié: Unifie les mises à jour inspirées par AMP avec l'architecture Transformateur, réalisant une transmission de messages interprétable
SGT est le premier détecteur MIMO intégrant explicitement la structure du graphe factoriel dans une architecture Transformateur, unifiant le codage contextuel et la transmission de messages.
Surcharge computationnelle: Bien que la croissance de complexité soit supérieure, le temps d'exécution absolu reste plus élevé que les méthodes traditionnelles
Validation à grande échelle: Les performances de détection dans les configurations MIMO ultra-large nécessitent une recherche supplémentaire
Analyse théorique: Absence d'analyse rigoureuse de la convergence théorique
Adaptabilité aux canaux: Principalement validée sur canaux de Rayleigh en évanouissement, l'adaptabilité à d'autres modèles de canal reste à explorer
L'article cite des travaux importants dans les domaines de la détection MIMO, des algorithmes de transmission de messages, de l'apprentissage profond et des Transformateurs, notamment:
Littérature fondamentale de la série d'algorithmes AMP 1-3
Travaux représentatifs des méthodes de déroulement profond 4-6
Article original de l'architecture Transformateur 7
Travaux connexes de systèmes de communication basés sur Transformateur 8-11
Évaluation Globale: Cet article présente une innovation technique relativement forte, combinant avec succès l'architecture Transformateur avec la structure du graphe factoriel de la détection MIMO, proposant la méthode SGT avec fondations théoriques et valeur pratique. Bien qu'il y ait encore de la place pour l'amélioration en termes d'efficacité computationnelle et d'ampleur des améliorations de performance, il fournit une exploration précieuse de l'application de l'apprentissage profond aux problèmes de traitement de signaux structurés.