2025-11-15T10:19:11.421970

Hierarchical Qubit-Merging Transformer for Quantum Error Correction

Park, Kwak, Kim
For reliable large-scale quantum computation, a quantum error correction (QEC) scheme must effectively resolve physical errors to protect logical information. Leveraging recent advances in deep learning, neural network-based decoders have emerged as a promising approach to enhance the reliability of QEC. We propose the Hierarchical Qubit-Merging Transformer (HQMT), a novel and general decoding framework that explicitly leverages the structural graph of stabilizer codes to learn error correlations across multiple scales. Our architecture first computes attention locally on structurally related groups of stabilizers and then systematically merges these qubit-centric representations to build a global view of the error syndrome. The proposed HQMT achieves substantially lower logical error rates for surface codes by integrating a dedicated qubit-merging layer within the transformer architecture. Across various code distances, HQMT significantly outperforms previous neural network-based QEC decoders as well as a powerful belief propagation with ordered statistics decoding (BP+OSD) baseline. This hierarchical approach provides a scalable and effective framework for surface code decoding, advancing the realization of reliable quantum computing.
academic

Transformador Jerárquico de Fusión de Qubits para Corrección de Errores Cuánticos

Información Básica

  • ID del Artículo: 2510.11593
  • Título: Hierarchical Qubit-Merging Transformer for Quantum Error Correction
  • Autores: Seong-Joon Park (POSTECH), Hee-Youl Kwak (University of Ulsan), Yongjune Kim (POSTECH)
  • Clasificación: quant-ph cs.AI cs.LG
  • Fecha de Publicación: 14 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.11593

Resumen

Para lograr computación cuántica confiable a gran escala, los esquemas de corrección de errores cuánticos (QEC) deben resolver efectivamente los errores físicos para proteger la información lógica. Este artículo aprovecha los avances recientes en aprendizaje profundo y propone el Transformador Jerárquico de Fusión de Qubits (HQMT), un marco de decodificación universal novedoso que explota explícitamente el gráfico de estructura de códigos estabilizadores para aprender correlaciones de errores a múltiples escalas. La arquitectura primero calcula la atención localmente en grupos de estabilizadores relacionados estructuralmente, y luego fusiona sistemáticamente estas representaciones centradas en qubits para construir una vista global del síndrome de error. Al integrar capas especializadas de fusión de qubits en la arquitectura del transformador, HQMT logra tasas de error lógico significativamente más bajas en códigos de superficie, superando significativamente a decodificadores QEC de redes neuronales previos y a la línea base sólida BP+OSD en varias distancias de código.

Antecedentes de Investigación y Motivación

Problema Central

El desafío fundamental que enfrenta la computación cuántica es la fragilidad del estado cuántico. A diferencia de los bits clásicos, los qubits son susceptibles al ruido ambiental e imperfecciones operacionales, lo que causa errores como volteos de bits y volteos de fase. La corrección de errores cuánticos es una tecnología clave para lograr computación cuántica tolerante a fallos.

Importancia del Problema

  1. Necesidad de Practicidad en Computación Cuántica: Los algoritmos cuánticos a gran escala requieren mantener la coherencia del estado cuántico durante períodos prolongados
  2. Limitaciones Físicas: El teorema de no clonación cuántica hace que los métodos de corrección de errores redundantes tradicionales sean inaplicables
  3. Criticidad de la Latencia de Decodificación: El tiempo de respuesta del decodificador afecta directamente la velocidad de reloj de todo el sistema cuántico

Limitaciones de Métodos Existentes

  1. Algoritmos Clásicos: Aunque MWPM tiene garantías teóricas, su desempeño es limitado en patrones de error complejos
  2. Métodos de Redes Neuronales Tempranas: FFNN y CNN no aprovechan suficientemente las características estructurales de códigos cuánticos
  3. Decodificadores Iterativos: Métodos como BP+OSD tienen tiempo de decodificación impredecible, convirtiéndose en un cuello de botella del sistema

Motivación de la Investigación

Este artículo tiene como objetivo diseñar un decodificador de red neuronal que pueda explotar la estructura topológica de códigos cuánticos y proporcionar latencia de decodificación fija, optimizado especialmente para las correlaciones de errores jerárquicas del código de superficie.

Contribuciones Principales

  1. Propuesta de Arquitectura HQMT: Primer decodificador transformador jerárquico que modela explícitamente la estructura topológica del código de superficie
  2. Capa Innovadora de Fusión de Qubits: Fusiona representaciones de estabilizadores Z/X de grano fino en representaciones de nivel de qubit de grano grueso
  3. Mejora Significativa de Desempeño: Supera métodos de redes neuronales existentes y la línea base BP+OSD en múltiples distancias de código
  4. Verificación de Escalabilidad: Demuestra ventajas de desempeño con el crecimiento de la distancia de código y buenas características de pseudoumbral

Explicación Detallada del Método

Definición de la Tarea

Entrada: Vector de síndrome de error s=[sZ,sX]{0,1}nks = [s_Z, s_X] \in \{0,1\}^{n-k}, donde sZs_Z y sXs_X son síndromes de tipo Z y X respectivamente Salida: Predicción de operador lógico L^{Iˉ,Xˉ,Yˉ,Zˉ}\hat{L} \in \{\bar{I}, \bar{X}, \bar{Y}, \bar{Z}\}Objetivo: Minimizar la tasa de error lógico (LER)

Arquitectura del Modelo

Diseño General

HQMT adopta una arquitectura jerárquica de dos etapas:

  • Etapa 1: Procesamiento de grano fino, maneja estabilizadores de tipo Z y X por separado
  • Etapa 2: Procesamiento de grano grueso, maneja representaciones de nivel de qubit fusionadas

Componentes Clave

1. Estrategia de Incrustación Centrada en Qubits Para cada qubit físico q(i)q^{(i)}, se construyen dos parches:

  • Parche de tipo Z: pZ(i)=(vZ,1(i),...,vZ,m(i))p_Z^{(i)} = (v_{Z,1}^{(i)}, ..., v_{Z,m}^{(i)})
  • Parche de tipo X: pX(i)=(vX,1(i),...,vX,m(i))p_X^{(i)} = (v_{X,1}^{(i)}, ..., v_{X,m}^{(i)})

Donde:

undefined