We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
Questo articolo propone il Soft Graph Transformer (SGT), un'architettura neurale a ingresso-uscita soft progettata specificamente per la rilevazione MIMO. Sebbene la rilevazione a massima verosimiglianza (ML) raggiunga precisione ottimale, la sua complessità esponenziale è infattibile nei sistemi su larga scala, mentre gli algoritmi tradizionali di passaggio di messaggi si basano su ipotesi asintotiche che spesso falliscono in dimensioni finite. I rilevatori basati su Transformer di recente sviluppo mostrano prestazioni eccellenti, ma generalmente trascurano la struttura del grafo fattoriale MIMO e non sfruttano le informazioni soft a priori. SGT affronta queste limitazioni combinando meccanismi di auto-attenzione (codifica delle dipendenze di contesto all'interno dei sottografi di simboli e vincoli) e meccanismi di attenzione incrociata consapevoli del grafo (esecuzione del passaggio di messaggi strutturato tra sottografi). La sua interfaccia a ingresso soft consente l'integrazione di priori ausiliari, producendo uscite soft efficaci mantenendo l'efficienza computazionale.
I sistemi MIMO, sebbene fondamentali per le comunicazioni wireless moderne, fornendo elevata efficienza spettrale e collegamenti robusti, presentano ancora la sfida della rilevazione efficiente dei simboli.
Rilevazione a Massima Verosimiglianza: Sebbene raggiunga precisione ottimale, la complessità computazionale è O(M^Nt) (dove M è il numero di punti di costellazione), infattibile nei sistemi su larga scala
Algoritmi di Passaggio di Messaggi: Metodi come AMP, OAMP, MAMP presentano complessità inferiore ma dipendono da ipotesi asintotiche, fragili in contesti a dimensioni finite
Metodi di Espansione Profonda: Approcci come OAMP-Net e DetNet apprendono i parametri dell'algoritmo dai dati, ma rimangono limitati dalle ipotesi dell'algoritmo originale
Metodi Transformer Esistenti:
RE-MIMO manca di consapevolezza esplicita del grafo
Transformer-based MIMO utilizza decomposizione QR ma con costi elevati e trascura la struttura del grafo fattoriale
Ispirato dai classici algoritmi di passaggio di messaggi per la rilevazione MIMO, questo articolo mira a progettare un'architettura Transformer in grado di:
Sfruttare la struttura del grafo fattoriale MIMO
Supportare un'interfaccia a ingresso-uscita soft
Fornire un approccio principiale che unifica la codifica del contesto e il passaggio di messaggi
Proposta dell'Architettura SGT: Primo rilevatore MIMO che unifica l'auto-attenzione guidata dal grafo fattoriale e l'attenzione incrociata in un framework di stile AMP
Metodo di Tokenizzazione Consapevole del Grafo: Trasforma il grafo fattoriale denso ponderato del sistema MIMO in una rappresentazione a due sottografi adatta all'elaborazione Transformer
Interfaccia a Ingresso-Uscita Soft: Integra naturalmente le informazioni a priori esterne provenienti da altri moduli del ricevitore
Miglioramento delle Prestazioni: Raggiunge precisione di rilevazione quasi-ML nei sistemi MIMO di piccola scala e dimostra una crescita di complessità quadratica superiore nei sistemi su larga scala
dove h_j è la j-esima riga di H, codificando i vincoli di verosimiglianza locale tra il segnale ricevuto e i simboli trasmessi.
Token di Simbolo/Sottografo:
T_sym = {x_i^(l) | i ∈ {1,...,2Nt}}
Corrisponde ai nodi variabili dei simboli trasmessi, fungendo da query embedding che interagiscono con i token di vincolo tramite attenzione incrociata.
Auto-Attenzione - Codifica del Contesto:
Fornisce una codifica del contesto robusta all'interno di insiemi di token omogenei, garantendo coerenza tra entità simili:
Progettazione dell'Attenzione Strutturata: A differenza di CrossMPT, SGT combina auto-attenzione e attenzione incrociata adattate alle caratteristiche dei sottografi omogenei di MIMO
Vantaggi della Conservazione dell'Informazione: Rispetto ai metodi che utilizzano decomposizione QR, la tokenizzazione consapevole del grafo conserva più informazioni a livello di simbolo
Framework Unificato: Unifica gli aggiornamenti ispirati da AMP con l'architettura Transformer, realizzando un passaggio di messaggi interpretabile
SGT è il primo rilevatore MIMO che integra esplicitamente la struttura del grafo fattoriale nell'architettura Transformer, unificando la codifica del contesto e il passaggio di messaggi.
L'articolo cita importanti letterature nei campi della rilevazione MIMO, algoritmi di passaggio di messaggi, apprendimento profondo e Transformer, in particolare:
Letterature fondamentali della serie di algoritmi AMP 1-3
Lavori rappresentativi dei metodi di espansione profonda 4-6
Lavori correlati su sistemi di comunicazione basati su Transformer 8-11
Valutazione Complessiva: Questo è un articolo con forte innovatività tecnica che combina con successo l'architettura Transformer con la struttura del grafo fattoriale della rilevazione MIMO, proponendo il metodo SGT con fondamenti teorici e valore pratico. Sebbene rimanga spazio per miglioramenti nell'efficienza computazionale e nell'entità del miglioramento delle prestazioni, fornisce un'esplorazione preziosa dell'applicazione dell'apprendimento profondo nei problemi di elaborazione di segnali strutturati.