2025-11-12T05:10:09.967264

Soft Graph Transformer for MIMO Detection

Hong, Liu, Bian et al.

We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.

academic

Soft Graph Transformer for MIMO Detection

基本信息

论文ID: 2509.12694
标题: Soft Graph Transformer for MIMO Detection
作者: Jiadong Hong¹, Lei Liu¹, Xinyu Bian², Wenjie Wang², Zhaoyang Zhang¹
机构: ¹浙江大学信息与电子工程学院, ²华为技术有限公司理论实验室
分类: cs.LG cs.IT eess.SP math.IT
发表时间: 2025年9月17日 (arXiv v2)
论文链接: https://arxiv.org/abs/2509.12694

摘要

本文提出了软图变换器(Soft Graph Transformer, SGT)，这是一个专为MIMO检测设计的软输入-软输出神经架构。虽然最大似然(ML)检测能达到最优精度，但其指数级复杂度在大规模系统中不可行，而传统的消息传递算法依赖于渐近假设，在有限维度下经常失效。最近基于Transformer的检测器表现出色，但通常忽略MIMO因子图结构且无法利用先验软信息。SGT通过结合自注意力机制(编码符号和约束子图内的上下文依赖)和图感知交叉注意力机制(执行跨子图的结构化消息传递)来解决这些局限性。其软输入接口允许整合辅助先验，在保持计算效率的同时产生有效的软输出。

研究背景与动机

问题定义

MIMO系统虽然是现代无线通信的基础，提供高频谱效率和鲁棒链路，但高效的符号检测仍然是一个挑战性问题。

现有方法的局限性

最大似然检测：虽然达到最优精度，但计算复杂度为O(M^Nt)（M为星座点数），在大规模系统中不可行
消息传递算法：如AMP、OAMP、MAMP等虽然复杂度较低，但依赖渐近假设，在有限维度设置下脆弱
深度展开方法：如OAMP-Net、DetNet等通过数据学习算法参数，但仍受限于原始算法的假设
现有Transformer方法：
- RE-MIMO缺乏明确的图感知
- Transformer-based MIMO使用QR分解但成本高昂且忽略因子图结构

研究动机

受经典消息传递MIMO检测启发，本文旨在设计一个能够：

利用MIMO因子图结构的Transformer架构
支持软输入-软输出接口
统一上下文编码和消息传递的原理性方法

核心贡献

提出SGT架构：首个将因子图引导的自注意力和交叉注意力统一在AMP风格框架中的MIMO检测器
图感知标记化方法：将MIMO系统的加权密集因子图转换为适合Transformer处理的双子图表示
软输入-软输出接口：自然整合来自其他接收器模块的外部先验信息
性能提升：在小规模MIMO系统中达到近ML检测精度，并在大规模系统中展现更优的二次复杂度增长

方法详解

任务定义

输入：

接收信号向量 y ∈ R^(2Nr)
信道矩阵 H ∈ R^(2Nr×2Nt)
噪声方差信息
可选的先验软信息(LLR)

输出：

比特级后验似然比(LLR)，适用于信道解码器

约束：线性系统模型 y = Hx + n，其中n ~ N(0,Σ)

模型架构

1. 图感知标记化(Graph-Aware Tokenization)

将MIMO因子图分解为两个子图：

线性约束标记/子图：

T_lin = {τ_j = (y_j, h_j, σ²_j) | j ∈ {1,...,2Nr}}

其中h_j是H的第j行，编码接收信号与传输符号间的局部似然约束。

符号标记/子图：

T_sym = {x_i^(l) | i ∈ {1,...,2Nt}}

对应传输符号的变量节点，作为查询嵌入通过交叉注意力与约束标记交互。

2. 注意力机制设计

自注意力 - 上下文编码：在同质标记集内提供强大的上下文编码，确保相似实体间的一致性：

t̃_j = ∑_{k=1}^N α_{jk} W^V t_k
α_{jk} = softmax((W^Q t_j)^T (W^K t_k) / √d_k)

交叉注意力 - 消息传递：实现异质标记类型间的定向消息传递：

t̃_j = ∑_i α_{ij} W^V t_i
α_{ij} = softmax((W^Q t_j)^T (W^K t_i) / √d_k)

3. 软输入-软输出接口

软输入嵌入模块：

符号标记：T_sym，维度2Nt, Nbits/2
线性约束标记：T_lin，维度2Nr, 2Nt+2
通过专用FFN独立处理并加入位置编码

软输出模块：

接收嵌入表示：维度2Nt, d_model
通过FFN + Sigmoid激活处理
产生最终软输出：维度2Nt, Nbits/2

技术创新点

结构化注意力设计：与CrossMPT不同，SGT针对MIMO的同构子图特性，结合自注意力和交叉注意力
信息保持优势：相比使用QR分解的方法，图感知标记化保留更多符号级信息
统一框架：将AMP启发的更新与Transformer架构统一，实现可解释的消息传递

实验设置

数据集

信道模型：完美CSI下的瑞利衰落信道
调制方式：QPSK(四相相移键控)
系统配置：8×8, 8×16, 16×16 MIMO系统
噪声：加性白高斯噪声

评价指标

BER (Bit Error Rate)：比特错误率
训练损失：收敛性分析
运行时间：计算效率评估

对比方法

经典方法：LMMSE, OAMP, Maximum Likelihood
深度学习方法：OAMPNet2, DetNet
Transformer方法：Transformer-based MIMO, RE-MIMO
消融实验：无交叉注意力版本，仅标记化版本

实现细节

模型维度：d_model = 128
网络层数：L = 8层
训练参数：相同学习率、批次大小和训练步数
硬件平台：RTX 4090 GPU

实验结果

主要结果

BER性能对比：

在8×8 MIMO系统中，SGT显著优于OAMPNet2和Transformer-based MIMO
在8×16和16×16系统中保持性能优势
接近ML检测的上界性能

运行时间分析(RTX 4090 GPU，1000样本)：

方法	8×8	8×16	16×16
LMMSE	0.00679s	0.00718s	0.00742s
OAMP	0.02208s	0.02234s	0.02408s
OAMPNet2	0.03333s	0.03415s	0.03507s
Transformer-based MIMO	0.03844s	0.03924s	0.04028s
SGT (提出)	0.09351s	0.09464s	0.09498s

消融实验

图感知标记化的作用：

完整标记化在小规模系统(8×8)中实现更低的最终损失
验证了保留详细符号级信息的能力
在大规模系统中需要交叉注意力的配合

交叉注意力的贡献：

实现更快收敛和更优最终精度
提供类似QR预处理的指导作用，但完全可学习
缓解大规模系统中的训练停滞问题

复杂度分析

渐近复杂度对比：

方法	复杂度	增长趋势
ML检测	O(M^Nt)	指数级
OAMP/OAMPNet	O(KNrNt²)	三次方
Transformer-based MIMO	O(NrNt² + LNt²dmodel)	三次方
SGT	L·O(Nr² + Nt² + NrNt)·dmodel	二次方