We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
Este artículo propone el Transformador de Grafo Suave (Soft Graph Transformer, SGT), una arquitectura neural de entrada-salida suave diseñada específicamente para detección MIMO. Aunque la detección de máxima verosimilitud (ML) logra precisión óptima, su complejidad exponencial es inviable en sistemas a gran escala, mientras que los algoritmos tradicionales de paso de mensajes dependen de suposiciones asintóticas que frecuentemente fallan en dimensiones finitas. Los detectores basados en Transformador recientemente propuestos muestran un desempeño excelente, pero típicamente ignoran la estructura del grafo factorial MIMO y no pueden aprovechar información suave previa. SGT aborda estas limitaciones combinando mecanismos de autoatención (codificación de símbolos y dependencias contextuales dentro de subgrafos de restricciones) y mecanismos de atención cruzada conscientes del grafo (realizando paso de mensajes estructurado entre subgrafos). Su interfaz de entrada suave permite integrar información previa auxiliar, produciendo salidas suaves efectivas mientras se mantiene eficiencia computacional.
Aunque los sistemas MIMO son fundamentales para las comunicaciones inalámbricas modernas, proporcionando alta eficiencia espectral y enlaces robustos, la detección eficiente de símbolos sigue siendo un problema desafiante.
Detección de Máxima Verosimilitud: Aunque logra precisión óptima, la complejidad computacional es O(M^Nt) (donde M es el número de puntos de constelación), inviable en sistemas a gran escala
Algoritmos de Paso de Mensajes: Métodos como AMP, OAMP, MAMP tienen complejidad reducida pero dependen de suposiciones asintóticas, siendo frágiles en configuraciones de dimensión finita
Métodos de Despliegue Profundo: Enfoques como OAMP-Net y DetNet aprenden parámetros algorítmicos mediante datos, pero siguen limitados por suposiciones del algoritmo original
Métodos Transformador Existentes:
RE-MIMO carece de conciencia explícita del grafo
Transformer-based MIMO utiliza descomposición QR pero es costoso e ignora la estructura del grafo factorial
Propone Arquitectura SGT: Primer detector MIMO que unifica autoatención guiada por grafo factorial y atención cruzada en un marco de estilo AMP
Método de Tokenización Consciente del Grafo: Convierte el grafo factorial denso ponderado del sistema MIMO en representación de dos subgrafos adecuada para procesamiento Transformador
Interfaz de Entrada-Salida Suave: Integra naturalmente información previa externa de otros módulos receptores
Mejora de Desempeño: Logra precisión de detección cercana a ML en sistemas MIMO pequeños y demuestra crecimiento de complejidad cuadrática superior en sistemas grandes
donde h_j es la j-ésima fila de H, codificando restricciones de verosimilitud locales entre señal recibida y símbolos transmitidos.
Tokens/Subgrafo de Símbolos:
T_sym = {x_i^(l) | i ∈ {1,...,2Nt}}
Corresponde a nodos variables de símbolos transmitidos, actuando como incrustaciones de consulta interactuando con tokens de restricción mediante atención cruzada.
Autoatención - Codificación Contextual:
Proporciona codificación contextual robusta dentro de conjuntos de tokens homogéneos, asegurando consistencia entre entidades similares:
Diseño de Atención Estructurada: A diferencia de CrossMPT, SGT combina autoatención y atención cruzada adaptadas a características de subgrafos homogéneos de MIMO
Ventaja de Preservación de Información: Comparado con métodos usando descomposición QR, la tokenización consciente del grafo retiene más información a nivel de símbolo
Marco Unificado: Unifica actualizaciones inspiradas en AMP con arquitectura Transformador, realizando paso de mensajes interpretable
SGT es el primer detector MIMO que integra explícitamente estructura de grafo factorial en arquitectura Transformador, unificando codificación contextual y paso de mensajes.
Sobrecarga Computacional: Aunque el crecimiento de complejidad es superior, el tiempo de ejecución absoluto sigue siendo más alto que métodos tradicionales
Validación a Gran Escala: El desempeño de detección en configuraciones MIMO ultragigantes requiere investigación adicional
Análisis Teórico: Carece de análisis riguroso de convergencia teórica
Adaptabilidad de Canal: Validado principalmente bajo canal de desvanecimiento Rayleigh, la adaptabilidad a otros modelos de canal requiere exploración
El artículo cita literatura importante en campos de detección MIMO, algoritmos de paso de mensajes, aprendizaje profundo y Transformadores, particularmente:
Literatura fundamental de serie de algoritmos AMP 1-3
Trabajos representativos de métodos de despliegue profundo 4-6
Artículo original de arquitectura Transformador 7
Trabajos relacionados de sistemas de comunicación basados en Transformador 8-11
Evaluación General: Este es un artículo con innovación técnica relativamente fuerte que combina exitosamente arquitectura Transformador con estructura de grafo factorial de detección MIMO, proponiendo método SGT con base teórica y valor práctico. Aunque aún hay espacio para mejora en eficiencia computacional y magnitud de mejora de desempeño, proporciona exploración valiosa para aplicación de aprendizaje profundo en problemas de procesamiento de señales estructuradas.