We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
论文ID : 2509.12694标题 : Soft Graph Transformer for MIMO Detection作者 : Jiadong Hong¹, Lei Liu¹, Xinyu Bian², Wenjie Wang², Zhaoyang Zhang¹机构 : ¹浙江大学信息与电子工程学院, ²华为技术有限公司理论实验室分类 : cs.LG cs.IT eess.SP math.IT发表时间 : 2025年9月17日 (arXiv v2)论文链接 : https://arxiv.org/abs/2509.12694 本文提出了软图变换器(Soft Graph Transformer, SGT),这是一个专为MIMO检测设计的软输入-软输出神经架构。虽然最大似然(ML)检测能达到最优精度,但其指数级复杂度在大规模系统中不可行,而传统的消息传递算法依赖于渐近假设,在有限维度下经常失效。最近基于Transformer的检测器表现出色,但通常忽略MIMO因子图结构且无法利用先验软信息。SGT通过结合自注意力机制(编码符号和约束子图内的上下文依赖)和图感知交叉注意力机制(执行跨子图的结构化消息传递)来解决这些局限性。其软输入接口允许整合辅助先验,在保持计算效率的同时产生有效的软输出。
MIMO系统虽然是现代无线通信的基础,提供高频谱效率和鲁棒链路,但高效的符号检测仍然是一个挑战性问题。
最大似然检测 :虽然达到最优精度,但计算复杂度为O(M^Nt)(M为星座点数),在大规模系统中不可行消息传递算法 :如AMP、OAMP、MAMP等虽然复杂度较低,但依赖渐近假设,在有限维度设置下脆弱深度展开方法 :如OAMP-Net、DetNet等通过数据学习算法参数,但仍受限于原始算法的假设现有Transformer方法 :
RE-MIMO缺乏明确的图感知 Transformer-based MIMO使用QR分解但成本高昂且忽略因子图结构 受经典消息传递MIMO检测启发,本文旨在设计一个能够:
利用MIMO因子图结构的Transformer架构 支持软输入-软输出接口 统一上下文编码和消息传递的原理性方法 提出SGT架构 :首个将因子图引导的自注意力和交叉注意力统一在AMP风格框架中的MIMO检测器图感知标记化方法 :将MIMO系统的加权密集因子图转换为适合Transformer处理的双子图表示软输入-软输出接口 :自然整合来自其他接收器模块的外部先验信息性能提升 :在小规模MIMO系统中达到近ML检测精度,并在大规模系统中展现更优的二次复杂度增长输入 :
接收信号向量 y ∈ R^(2Nr) 信道矩阵 H ∈ R^(2Nr×2Nt) 噪声方差信息 可选的先验软信息(LLR) 输出 :
约束 :线性系统模型 y = Hx + n,其中n ~ N(0,Σ)
将MIMO因子图分解为两个子图:
线性约束标记/子图 :
T_lin = {τ_j = (y_j, h_j, σ²_j) | j ∈ {1,...,2Nr}}
其中h_j是H的第j行,编码接收信号与传输符号间的局部似然约束。
符号标记/子图 :
T_sym = {x_i^(l) | i ∈ {1,...,2Nt}}
对应传输符号的变量节点,作为查询嵌入通过交叉注意力与约束标记交互。
自注意力 - 上下文编码 :
在同质标记集内提供强大的上下文编码,确保相似实体间的一致性:
t̃_j = ∑_{k=1}^N α_{jk} W^V t_k
α_{jk} = softmax((W^Q t_j)^T (W^K t_k) / √d_k)
交叉注意力 - 消息传递 :
实现异质标记类型间的定向消息传递:
t̃_j = ∑_i α_{ij} W^V t_i
α_{ij} = softmax((W^Q t_j)^T (W^K t_i) / √d_k)
软输入嵌入模块 :
符号标记:T_sym,维度2Nt, Nbits/2 线性约束标记:T_lin,维度2Nr, 2Nt+2 通过专用FFN独立处理并加入位置编码 软输出模块 :
接收嵌入表示:维度2Nt, d_model 通过FFN + Sigmoid激活处理 产生最终软输出:维度2Nt, Nbits/2 结构化注意力设计 :与CrossMPT不同,SGT针对MIMO的同构子图特性,结合自注意力和交叉注意力信息保持优势 :相比使用QR分解的方法,图感知标记化保留更多符号级信息统一框架 :将AMP启发的更新与Transformer架构统一,实现可解释的消息传递信道模型 :完美CSI下的瑞利衰落信道调制方式 :QPSK(四相相移键控)系统配置 :8×8, 8×16, 16×16 MIMO系统噪声 :加性白高斯噪声BER (Bit Error Rate) :比特错误率训练损失 :收敛性分析运行时间 :计算效率评估经典方法 :LMMSE, OAMP, Maximum Likelihood深度学习方法 :OAMPNet2, DetNetTransformer方法 :Transformer-based MIMO, RE-MIMO消融实验 :无交叉注意力版本,仅标记化版本模型维度 :d_model = 128网络层数 :L = 8层训练参数 :相同学习率、批次大小和训练步数硬件平台 :RTX 4090 GPUBER性能对比 :
在8×8 MIMO系统中,SGT显著优于OAMPNet2和Transformer-based MIMO 在8×16和16×16系统中保持性能优势 接近ML检测的上界性能 运行时间分析 (RTX 4090 GPU,1000样本):
方法 8×8 8×16 16×16 LMMSE 0.00679s 0.00718s 0.00742s OAMP 0.02208s 0.02234s 0.02408s OAMPNet2 0.03333s 0.03415s 0.03507s Transformer-based MIMO 0.03844s 0.03924s 0.04028s SGT (提出) 0.09351s 0.09464s 0.09498s
图感知标记化的作用 :
完整标记化在小规模系统(8×8)中实现更低的最终损失 验证了保留详细符号级信息的能力 在大规模系统中需要交叉注意力的配合 交叉注意力的贡献 :
实现更快收敛和更优最终精度 提供类似QR预处理的指导作用,但完全可学习 缓解大规模系统中的训练停滞问题 渐近复杂度对比 :
方法 复杂度 增长趋势 ML检测 O(M^Nt) 指数级 OAMP/OAMPNet O(KNrNt²) 三次方 Transformer-based MIMO O(NrNt² + LNt²dmodel) 三次方 SGT L·O(Nr² + Nt² + NrNt)·dmodel 二次方
经典方法 :从线性检测(MMSE)到非线性检测(ML)消息传递算法 :AMP系列算法的发展和局限性深度学习方法 :从DetNet到深度展开方法的演进信道解码 :ECCT利用LDPC Tanner图,CrossMPT通过交叉注意力模拟消息传递MIMO检测 :RE-MIMO和Transformer-based MIMO的贡献与不足SGT是首个将因子图结构明确整合到Transformer架构中的MIMO检测器,统一了上下文编码和消息传递。
SGT成功结合了Transformer的上下文建模能力和因子图的结构化消息传递 在小规模MIMO系统中达到近ML性能,同时保持计算效率 软输入-软输出接口提供了与其他接收器模块集成的灵活性 二次复杂度增长使其在大规模系统中更具扩展性 计算开销 :虽然复杂度增长更优,但绝对运行时间仍高于传统方法大规模验证 :超大规模MIMO设置下的检测性能需要进一步研究理论分析 :缺乏严格的理论收敛性分析信道适应性 :主要在瑞利衰落信道下验证,其他信道模型的适应性有待探索进一步优化计算效率,降低绝对运行时间 扩展到更大规模的MIMO系统验证 研究在不同信道条件下的鲁棒性 与其他接收器组件的联合优化 创新性强 :首次将因子图结构明确整合到Transformer中,设计新颖理论基础扎实 :基于AMP框架的消息传递有solid的理论支撑实验充分 :包含详细的消融实验和复杂度分析实用价值高 :软输入-软输出接口增强了系统集成的灵活性写作清晰 :技术细节描述准确,图表直观性能提升有限 :相比baseline的改进虽然一致但幅度不大计算效率 :实际运行时间比传统方法高2-3倍验证范围 :主要在小规模系统和特定信道条件下验证理论分析不足 :缺乏收敛性和最优性的理论保证对比不够全面 :缺少与最新深度学习MIMO检测方法的对比学术贡献 :为Transformer在结构化信号处理问题中的应用提供了新思路实用价值 :为下一代深度学习MIMO检测器提供了可解释的框架可复现性 :技术细节描述充分,便于复现和扩展小到中等规模MIMO系统 :性能优势明显需要软信息交互的接收器系统 :SISO接口提供灵活性对可解释性有要求的应用 :结构化设计便于理解和调试研究原型系统 :为进一步算法开发提供基础框架论文引用了MIMO检测、消息传递算法、深度学习和Transformer等领域的重要文献,特别是:
AMP系列算法的基础文献1-3 深度展开方法的代表工作4-6 Transformer架构的原始论文7 相关的Transformer-based通信系统工作8-11 总体评价 :这是一篇技术创新性较强的论文,成功将Transformer架构与MIMO检测的因子图结构结合,提出了有理论基础和实用价值的SGT方法。虽然在计算效率和性能提升幅度上仍有改进空间,但为深度学习在结构化信号处理问题中的应用提供了有价值的探索。