Estimating properties of quantum states, such as fidelities, molecular energies, and correlation functions, is a fundamental task in quantum information science. Due to the limitation of practical quantum devices, including limited circuit depth and connectivity, estimating even linear properties encounters high sample complexity. To address this inefficiency, we propose a framework that optimizes sample complexity for estimating the expectation value of any observable using a shallow parameterized quantum circuit. Within this framework, we introduce two decomposition algorithms, a tensor network approach and a greedy projection approach that decompose the target observable into a linear combination of multiple observables, each of which can be diagonalized with the shallow circuit. Using this decomposition, we then apply an importance sampling algorithm to estimate the expectation value of the target observable. We numerically demonstrate the performance of our algorithm by estimating the expectation values of some specific Hamiltonians and inner product of a Slater determinant with a pure state, highlighting advantages compared to some conventional methods. Additionally, we derive the fundamental lower bound for the sample complexity required to estimate a target observable using a given shallow quantum circuit, thereby enhancing our understanding of the capabilities of shallow circuits in quantum learning tasks.
- ID del Artículo: 2407.19499
- Título: Estimación de valores esperados con circuitos cuánticos parametrizados
- Autores: Bujiao Wu, Lingyu Kong, Yuxuan Yan, Fuchuan Wei, Zhenhuan Liu
- Clasificación: quant-ph (Física Cuántica)
- Fecha de Publicación: Julio de 2024 (preimpresión arXiv, versión v2 actualizada el 16 de octubre de 2025)
- Enlace del Artículo: https://arxiv.org/abs/2407.19499
La estimación de propiedades de estados cuánticos (como fidelidad, energía molecular y funciones de correlación) es una tarea fundamental en la ciencia de la información cuántica. Debido a las limitaciones de los dispositivos cuánticos prácticos, incluyendo profundidad de circuito finita y conectividad limitada, incluso la estimación de propiedades lineales enfrenta problemas de alta complejidad de muestras. Para resolver esta ineficiencia, este artículo propone un marco que utiliza circuitos cuánticos parametrizados superficiales para optimizar la complejidad de muestras en la estimación de valores esperados de observables arbitrarios. Dentro de este marco, se introducen dos algoritmos de descomposición: el método de red tensorial y el método de proyección codicioso, que descomponen el observable objetivo en una combinación lineal de múltiples observables, cada uno de los cuales puede diagonalizarse con circuitos superficiales. Basándose en esta descomposición, se aplica un algoritmo de muestreo por importancia para estimar el valor esperado del observable objetivo.
La estimación de propiedades lineales de estados cuánticos Tr(ρH) es una tarea central en la ciencia de la información cuántica, donde ρ es el estado cuántico y H es el observable. Este tipo de problemas se presenta ampliamente en:
- Química Cuántica: Cálculo de energía del estado fundamental molecular
- Física de Muchos Cuerpos: Medición de funciones de correlación
- Información Cuántica: Evaluación de fidelidad de estados
- Protocolo de Sombra Clásica (Classical Shadow):
- La complejidad de muestras del protocolo CS local para observables k-locales es O(4^k)
- El protocolo CS global puede alcanzar complejidad O(1), pero requiere circuitos de profundidad logarítmica
- Ambos son "independientes de la medición", sin aprovechar información previa del observable objetivo
- Método de Descomposición de Pauli:
- Limitado a implementación con circuitos Clifford
- La descomposición se restringe a observables de Pauli
- Puede requerir circuitos profundos o alta complejidad de muestras
Los métodos existentes enfrentan los siguientes desafíos en dispositivos cuánticos recientes:
- Profundidad de circuito limitada
- Restricciones de conectividad
- Impacto del ruido
- Utilización insuficiente de información del observable
- Marco Unificado: Se propone un marco general para estimar propiedades lineales utilizando circuitos cuánticos parametrizados, unificando los protocolos de descomposición de Pauli existentes
- Dos Algoritmos de Descomposición:
- Descomposición de Proyección Codiciosa (GPD): Aplicable a hamiltonianos generales
- Descomposición de Red Tensorial (TND): Aplicable a hamiltonianos con representación compacta de red tensorial
- Cota Teórica Inferior: Se derivan cotas inferiores fundamentales para la complejidad de muestras requerida al estimar el observable objetivo utilizando circuitos cuánticos superficiales dados
- Verificación Numérica: Se validan las ventajas del algoritmo en hamiltonianos dispersos/densos y estimación de productos internos de determinantes de Slater
Dado:
- Estado cuántico desconocido ρ
- Observable objetivo H
- Circuito cuántico parametrizado de profundidad L: U_L(θ)
- Requisitos de precisión ε y probabilidad de éxito 1-δ
Objetivo: Estimar Tr(ρH) minimizando la complejidad de muestras
El marco se divide en dos fases: clásica y cuántica:
Fase Clásica: Descomponer el observable objetivo como
H≈∑k=1KUL(θ(k))†ΛkUL(θ(k))
donde Λ_k son matrices diagonales reales
Fase Cuántica: Usar muestreo por importancia para estimar el valor esperado
- Muestrear el término k con probabilidad p_k ∝ ||Λ_k||_2
- Ejecutar U_L(θ^{(k)}) y medir en la base computacional
- Aplicar el método de mediana de medias para obtener la estimación final
Idea Central: Encontrar iterativamente el mejor término aproximado U_L(θ)†ΛU_L(θ)
Flujo del Algoritmo:
- Inicializar H^{(0)} = H, k = 0
- Mientras ||H^{(k)}||_2 ≥ ε:
- Resolver el problema de optimización: θ^{(k)} = argmin_θ ||U_L(θ)H^{(k)}U_L†(θ) - diagU_L(θ)H^{(k)}U_L†(θ)||_F
- Establecer Λ_k = diagU_L(θ^{(k)})H^{(k)}U_L†(θ^{(k)})
- Actualizar H^{(k+1)} = H^{(k)} - U_L†(θ^{(k)})Λ_k U_L(θ^{(k)})
- k = k + 1
Análisis de Complejidad: El tiempo de procesamiento clásico es O(poly(n)·2^{ωn}), donde ω ≈ 2.37 es el exponente de multiplicación de matrices
Escenario Aplicable: El hamiltoniano objetivo posee una representación eficiente de Operador de Producto Matricial (MPO)
Objetivo de Optimización: Minimizar la función de pérdida
L=∣∣H−∑kUL(θk)†ΛkUL(θk)∣∣F2
Técnicas Clave:
- Representar U_L(θ_k) como red tensorial unitaria de profundidad L
- Representar Λ_k en forma MPO
- Usar contracción de red tensorial para calcular la función de pérdida
- Optimizar parámetros {θ^{(k)}, Λ_k} mediante descenso de gradiente
Cota Superior: El algoritmo 1 requiere T = O(||Λ||_1^2 log(1/δ)/ε_2^2) muestras, donde ||Λ||_1 es la suma de todos ||Λ_k||_2
Cota Inferior: Cualquier estrategia adaptativa de copia única que utilice circuitos parametrizados U_L(θ) requiere
T=Ω(ε2δ(H0)4nTr(H02)2)
donde H_0 es la parte sin traza de H, y δ(H_0) es el cuadrado del valor esperado máximo de H_0 en el conjunto de estados alcanzables
- Estimación de energía del estado fundamental de hamiltoniano disperso: Sistema de 8 qubits, 64 elementos distintos de cero
- Estimación de valor esperado de hamiltoniano denso: Matriz hermitiana aleatoria de 4 qubits
- Estimación de producto interno de determinantes de Slater: Sistema de 3 qubits, producto interno de determinante τ-Slater con estado puro
- Protocolo de Sombra Clásica: CS global y CS local
- Método de Descomposición de Pauli: Derandomized, C-LBCS, SG, Adaptive, OGM, etc.
- Métodos Especializados: Sombra Clásica Fermiónica (FCS)
- Puertas parametrizadas: Puerta iSWAP + producto tensorial de dos puertas de qubit único arbitrarias
- Algoritmo GPD: Profundidad L=4, K=20 u 80 términos de descomposición
- Algoritmo TND: Profundidad L=1, K=3 términos de descomposición
Hamiltoniano Disperso (8 qubits):
- Con 25848 muestras, el error de GPD es 0.030, significativamente mejor que el mejor método de comparación OGM con 0.097
- Con el aumento de muestras, GPD mantiene consistentemente el error más bajo
Hamiltoniano Denso (4 qubits):
- Con 25848 muestras, el error de GPD es 0.046, mejor que el mejor método de comparación OGM con 0.053
- La ventaja es más evidente con menos muestras
Producto Interno de Determinante de Slater (3 qubits):
- GPD logra el error más bajo en todos los números de muestras
- Con 25848 muestras, el error es 0.009, el mejor método de comparación es 0.012
Los resultados numéricos muestran:
- Con número fijo de términos de descomposición K, la distancia de Frobenius disminuye con el aumento de profundidad de circuito L
- Con profundidad de circuito fija, la distancia de Frobenius disminuye exponencialmente con el aumento del número de términos de descomposición K
Para hamiltonianos de baja dimensión de enlace:
- El método TND utiliza solo 3 términos de descomposición y profundidad de circuito de 1 capa
- Con 18000 pasos, el error es 0.050, mejor que los métodos tradicionales
- Tomografía Cuántica: Reconstrucción completa del estado cuántico, complejidad exponencial
- Tomografía de Sombra: Proporciona descripción clásica del estado, soporta estimación de múltiples propiedades
- Medición Local: Grupo Clifford de qubit único, adecuado para observables locales
- Medición Global: Grupo Clifford global, requiere circuitos profundos
- Circuitos Superficiales: Solución de compromiso, pero aún sin aprovechar completamente la información del observable
- Basado en expansión de Pauli del observable
- Implementado mediante circuitos Clifford y medición en base computacional
- El marco propuesto unifica estos métodos
- El marco propuesto unifica exitosamente los protocolos de medición existentes y se extiende a circuitos parametrizados generales
- Los algoritmos GPD y TND superan significativamente los métodos existentes en múltiples escenarios
- La cota inferior teórica establecida revela las limitaciones fundamentales de los circuitos superficiales en tareas de aprendizaje cuántico
- Algoritmo GPD:
- La complejidad de optimización clásica sigue siendo relativamente alta
- La estrategia codiciosa no garantiza optimalidad global
- El análisis teórico del número de términos de descomposición K es difícil
- Algoritmo TND:
- Solo aplicable a hamiltonianos con representación MPO eficiente
- Requiere técnicas adicionales de optimización de red tensorial
- Cota Inferior Teórica:
- Puede no ser suficientemente ajustada para observables de bajo rango (como fidelidad)
- Depende de la estimación precisa del parámetro de capacidad de circuito δ(H_0)
- Optimización de Algoritmos:
- Desarrollar algoritmos de descomposición más eficientes basados en aprendizaje automático
- Explorar estrategias de optimización global no codiciosas
- Perfeccionamiento Teórico:
- Establecer cotas inferiores de complejidad de muestras más ajustadas
- Analizar la relación entre el número de términos de descomposición K y la capacidad de circuito
- Extensión de Aplicaciones:
- Extender a estimación de propiedades no lineales
- Diseño de protocolos combinados con almacenamiento cuántico
- Reducir el número de cambios de configuración de hardware
- Contribuciones Teóricas:
- Proporciona un marco unificado que integra múltiples métodos existentes
- Establece cotas inferiores teóricas importantes, mejorando la comprensión de la capacidad de circuitos superficiales
- Innovación Metodológica:
- El algoritmo GPD es aplicable a hamiltonianos generales, con fuerte practicidad
- El algoritmo TND está optimizado para estructuras específicas, con alta eficiencia
- Aprovecha completamente la información previa del observable
- Experimentación Completa:
- Cubre múltiples escenarios de aplicación (hamiltonianos dispersos/densos, estimación de productos internos)
- Comparación con múltiples métodos principales, resultados convincentes
- Proporciona análisis de convergencia y desempeño promedio
- Problemas de Escalabilidad:
- La complejidad de optimización clásica de GPD crece exponencialmente con el número de qubits
- La practicidad en sistemas a gran escala requiere verificación
- Limitaciones Experimentales:
- La escala de experimentos numéricos es relativamente pequeña (máximo 8 qubits)
- Falta verificación en dispositivos cuánticos reales
- No se considera el impacto del ruido en el desempeño del algoritmo
- Brecha Teórica:
- Existe una brecha considerable entre cotas superiores e inferiores
- Falta garantía teórica rigurosa para la velocidad de convergencia del número de términos de descomposición K
- Valor Académico:
- Proporciona nuevo marco teórico para aprendizaje de estados cuánticos
- Avanza la comprensión de la capacidad de circuitos cuánticos superficiales
- Proporciona herramientas prácticas para diseño de algoritmos en computación cuántica reciente
- Valor Práctico:
- Filosofía de diseño de algoritmos adecuada para dispositivos NISQ
- Aplicaciones potenciales en química cuántica y física de muchos cuerpos
- Proporciona herramientas de referencia para verificación de ventaja cuántica
- Química Cuántica: Cálculo de energía y propiedades del estado fundamental molecular
- Simulación Cuántica: Medición de funciones de correlación en sistemas de muchos cuerpos
- Aprendizaje Automático Cuántico: Mapeo de características y métodos de núcleo
- Optimización Cuántica: Estimación de valor esperado de función objetivo
- Corrección de Errores Cuántico: Evaluación de fidelidad de palabra código y desempeño de corrección de errores
El artículo cita 66 referencias relacionadas, que abarcan trabajos importantes en los campos centrales de aprendizaje de estados cuánticos, medición aleatoria, sombra clásica, descomposición de Pauli, etc., proporcionando una base teórica sólida para la investigación.