2025-11-15T23:31:10.781061

Degeneracy Cutting: A Local and Efficient Post-Processing for Belief Propagation Decoding of Quantum Low-Density Parity-Check Codes

Tsubouchi, Yamasaki, Tamiya
Quantum low-density parity-check (qLDPC) codes are promising for realizing scalable fault-tolerant quantum computation due to their potential for low-overhead protocols. A common approach to decoding qLDPC codes is to use the belief propagation (BP) decoder, followed by a post-processing step to enhance decoding accuracy. For real-time decoding, the post-processing algorithm is desirable to have a small computational cost and rely only on local operations on the Tanner graph to facilitate parallel implementation. To address this requirement, we propose degeneracy cutting (DC), an efficient post-processing technique for the BP decoder that operates on information restricted to the support of each stabilizer generator. DC selectively removes one variable node with the lowest error probability for each stabilizer generator, significantly improving decoding performance while retaining the favorable computational scaling and structure amenable to parallelization inherent to BP. We further extend our method to realistic noise models, including phenomenological and circuit-level noise models, by introducing the detector degeneracy matrix, which generalizes the notion of stabilizer-induced degeneracy to these settings. Numerical simulations demonstrate that BP+DC achieves decoding performance approaching that of BP followed by ordered statistics decoding (BP+OSD) in several settings, while requiring significantly less computational cost. Our results present BP+DC as a promising decoder for fault-tolerant quantum computing, offering a valuable balance of accuracy, efficiency, and suitability for parallel implementation.
academic

Degeneracy Cutting: A Local and Efficient Post-Processing for Belief Propagation Decoding of Quantum Low-Density Parity-Check Codes

基本信息

  • 论文ID: 2510.08695
  • 标题: Degeneracy Cutting: A Local and Efficient Post-Processing for Belief Propagation Decoding of Quantum Low-Density Parity-Check Codes
  • 作者: Kento Tsubouchi, Hayata Yamasaki, Shiro Tamiya
  • 分类: quant-ph (量子物理)
  • 发表时间: 2024年10月9日
  • 论文链接: https://arxiv.org/abs/2510.08695

摘要

量子低密度奇偶校验码(qLDPC)因其低开销协议的潜力,在实现可扩展容错量子计算方面极具前景。解码qLDPC码的常见方法是使用置信传播(BP)解码器,然后通过后处理步骤提高解码精度。对于实时解码,后处理算法需要具有较小的计算成本,并且仅依赖于Tanner图上的局部操作以便于并行实现。为了满足这一要求,本文提出了简并切割(DC),这是一种高效的BP解码器后处理技术,仅在每个稳定子生成元的支撑集上操作。DC选择性地为每个稳定子生成元移除具有最低错误概率的变量节点,在保持BP固有的有利计算缩放和并行化结构的同时,显著提高解码性能。

研究背景与动机

问题定义

  1. 核心问题:qLDPC码的置信传播解码因量子码的简并性而性能显著下降,需要高效的后处理方法来提高解码精度
  2. 实际需求:容错量子计算需要实时解码能力,要求解码算法具有低计算复杂度和高并行化潜力
  3. 现有方法局限性
    • BP+OSD虽然精度高,但计算复杂度为O(n³),不适合实时应用
    • 其他后处理方法要么计算复杂度高,要么依赖全局信息比较,难以并行化

研究动机

量子码的简并性是指不同的物理错误模式可能产生相同的症状,导致BP解码器无法区分这些模式。这种简并性特别在qLDPC码中造成严重的解码失败,因为低权重的稳定子生成元会产生大量可信的简并错误模式。

核心贡献

  1. 提出简并切割(DC)算法:一种仅基于局部信息的线性时间后处理技术
  2. 保持计算效率:将计算复杂度从O(n³)降低到O(n),同时保持接近BP+OSD的性能
  3. 引入检测器简并矩阵:将方法扩展到现实噪声模型(现象学和电路级噪声模型)
  4. 实现高度并行化:算法决策仅基于每个稳定子生成元内的局部比较,便于并行实现
  5. 数值验证:在表面码和双变量自行车(BB)码上验证了方法的有效性

方法详解

任务定义

给定:

  • 输入:Z型奇偶校验矩阵H_Z,观测到的症状s_Z,先验错误概率p
  • 输出:估计的X型错误ê_X,满足ê_X H_Z^T = s_Z且残余错误为平凡错误

核心算法:简并切割(DC)

算法流程

Algorithm 1: BP+DC decoder
Input: 奇偶校验矩阵H_X, H_Z; 观测症状s_Z; 先验错误概率p; BP最大迭代次数T_iter
Output: 估计的X型错误ê_X

1. (ê_X, p̂) ← BP_decode(H_Z, s_Z, p, T_iter)
2. if ê_X H_Z^T = s_Z then return ê_X
3. Cut_indexes ← {}
4. for each row vector h_X in H_X do
5.    i_min ← argmin_{i∈{i|(h_X)_i=1}} p̂_i
6.    Cut_indexes ← Cut_indexes ∪ {i_min}
7. Delete columns of H_Z indexed by Cut_indexes
8. (ê_X, p̂) ← BP_decode(H_Z, s_Z, p̂, T_iter)
9. return ê_X

核心思想

  1. 简并性识别:对于每个X型稳定子生成元h_X,识别其支撑集内错误概率最低的变量节点
  2. 节点移除:将这些节点从Tanner图中移除,破坏局部简并性
  3. 重新解码:在修改后的图上重新运行BP解码

技术创新点

1. 局部性优势

  • 与全局方法不同,DC仅在每个稳定子生成元内进行比较
  • 比较的节点数量由常数r(行权重)限制
  • 天然支持并行实现

2. 简并性处理机制

对于简并错误e_X和e'_X满足e_X + e'_X = h_X(稳定子生成元),DC通过移除支撑其中一个错误的变量节点来消除简并性。

3. 计算复杂度分析

  • 初始BP解码:O(n)
  • 节点识别和移除:O(n)(因为行权重有界)
  • 第二次BP解码:O(n)
  • 总复杂度:O(n)

扩展到现实噪声模型

检测器简并矩阵H_DDM

为了处理现象学和电路级噪声模型中的额外简并性,论文引入了检测器简并矩阵:

  1. 现象学噪声模型:包含测量错误引起的简并性
  2. 电路级噪声模型:包含权重为3的电路级简并性

构造方法

H_DDM的每一行代表满足以下条件的低权重错误:

  • h_DDM H_DCM^T = 0(不被检测器检测到)
  • h_DDM O^T = 0(不影响逻辑信息)

实验设置

测试码族

  1. 表面码:距离d∈{3,5,7}的旋转表面码
  2. 双变量自行车码:[[72,12,6]]、[[108,8,10]]、[[144,12,12]]

噪声模型

  1. 码容量噪声模型:仅数据量子比特发生独立比特翻转错误
  2. 现象学噪声模型:数据量子比特和症状测量都有错误
  3. 电路级噪声模型:完整的症状提取电路噪声

对比方法

  • BP解码器
  • BP+OSD解码器
  • BP+DC解码器
  • BP+DC+OSD解码器

实验结果

主要结果

码容量噪声模型

  • 表面码:BP+DC性能接近BP+OSD,但略有差距
  • BB码:BP+DC性能优于BP+OSD

现象学噪声模型

  • BP+DC在表面码和BB码上都实现了与BP+OSD相当的逻辑错误抑制
  • 计算复杂度从O(N³)降低到O(N)

电路级噪声模型

  • BP+DC在更复杂的噪声环境下仍保持与BP+OSD一个数量级内的性能
  • 对于更大距离的码,性能差距有所增加

重要发现

  1. BB码优势:对于BB码,使用先验概率p而非后验概率p̂作为第二次BP的输入能提高性能
  2. 有效性验证:BP+DC+OSD与BP+OSD性能匹配,证明修改后的Tanner图仍存在有效解
  3. 可扩展性:方法在不同码距和噪声模型下都表现出良好的可扩展性

相关工作

后处理方法分类

  1. 基于线性方程求解:OSD、局部统计解码、模糊聚类
  2. 基于序列决策:闭分支解码、决策树解码
  3. 基于图修改:稳定子失活、SymBreak、检查失认、引导抽取

本文优势

  • 唯一同时满足O(n)复杂度、局部决策和高性能的方法
  • 可扩展到现实噪声模型的稳定子基方法

结论与讨论

主要结论

  1. DC算法有效解决了BP解码中的简并性问题
  2. 在保持线性计算复杂度的同时实现了接近BP+OSD的性能
  3. 检测器简并矩阵成功将方法扩展到现实噪声模型

局限性

  1. 在电路级噪声模型下,随着码距增加性能差距可能扩大
  2. 当前的检测器简并矩阵构造可能未捕获所有相关简并性
  3. 对于某些码族(如表面码),使用后验概率作为第二次BP输入更有效,但原因尚未完全理解

未来方向

  1. 改进检测器简并矩阵:包含更高权重的平凡错误
  2. 与其他BP改进技术结合:如码自同构、记忆效应等
  3. 理论分析:建立解码阈值的严格证明
  4. 算法优化:在BP迭代过程中间歇性应用DC

深度评价

优点

  1. 实用价值高:解决了实时量子纠错的关键瓶颈
  2. 理论贡献:检测器简并矩阵概念具有普遍适用性
  3. 实验全面:涵盖多种码族和噪声模型
  4. 工程友好:高度并行化,适合硬件实现

不足

  1. 理论分析不足:缺乏对方法有效性的理论保证
  2. 参数调优:不同码族需要不同的参数选择策略
  3. 性能差距:在某些设置下仍与BP+OSD有明显差距

影响力

  1. 学术贡献:为qLDPC解码提供了新的实用方法
  2. 工程价值:为容错量子计算硬件设计提供了可行路径
  3. 可复现性:算法描述清晰,易于实现

适用场景

  1. 实时量子纠错:特别适合需要低延迟解码的场景
  2. 大规模量子计算:在资源受限的环境下提供平衡的性能
  3. 并行处理架构:充分利用现代并行计算能力

参考文献

论文引用了63篇相关文献,涵盖了量子纠错、LDPC码、置信传播算法等关键领域的重要工作,为研究提供了坚实的理论基础。


总体评价:这是一篇在量子纠错领域具有重要实用价值的论文。简并切割算法巧妙地平衡了解码性能、计算效率和实现复杂度,为实际的容错量子计算系统提供了有价值的解决方案。虽然在某些方面仍有改进空间,但其创新性和实用性使其成为该领域的重要贡献。