2025-11-18T06:07:11.995553

Optimal learning of quantum Hamiltonians from high-temperature Gibbs states

Haah, Kothari, Tang

We study the problem of learning a Hamiltonian $H$ to precision $\varepsilon$, supposing we are given copies of its Gibbs state $Ï=\exp(-Î²H)/\operatorname{Tr}(\exp(-Î²H))$ at a known inverse temperature $Î²$. Anshu, Arunachalam, Kuwahara, and Soleimanifar (Nature Physics, 2021, arXiv:2004.07266) recently studied the sample complexity (number of copies of $Ï$ needed) of this problem for geometrically local $N$-qubit Hamiltonians. In the high-temperature (low $Î²$) regime, their algorithm has sample complexity poly$(N, 1/Î²,1/\varepsilon)$ and can be implemented with polynomial, but suboptimal, time complexity. In this paper, we study the same question for a more general class of Hamiltonians. We show how to learn the coefficients of a Hamiltonian to error $\varepsilon$ with sample complexity $S = O(\log N/(Î²\varepsilon)^{2})$ and time complexity linear in the sample size, $O(S N)$. Furthermore, we prove a matching lower bound showing that our algorithm's sample complexity is optimal, and hence our time complexity is also optimal. In the appendix, we show that virtually the same algorithm can be used to learn $H$ from a real-time evolution unitary $e^{-it H}$ in a small $t$ regime with similar sample and time complexity.

academic

Aprendizaje óptimo de hamiltonianos cuánticos a partir de estados de Gibbs a alta temperatura

Información Básica

ID del Artículo: 2108.04842
Título: Optimal learning of quantum Hamiltonians from high-temperature Gibbs states
Autores: Jeongwan Haah (Microsoft Quantum), Robin Kothari (Microsoft Quantum), Ewin Tang (University of Washington)
Clasificación: quant-ph cs.DS cs.LG
Fecha de Publicación: 17 de marzo de 2023 (versión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2108.04842

Resumen

Este artículo estudia el problema de aprender un hamiltoniano H a precisión ε a partir de copias del estado de Gibbs ρ=exp(-βH)/Tr(exp(-βH)) con temperatura inversa β conocida. En el régimen de alta temperatura (β bajo), los autores proponen un algoritmo de aprendizaje para la clase de hamiltonianos de baja intersección, logrando una complejidad de muestras S=O(logN/(βε)²) y complejidad temporal O(SN), y demuestran cotas inferiores coincidentes, lo que indica que el algoritmo es óptimo tanto en complejidad de muestras como de tiempo.

Antecedentes y Motivación de la Investigación

Definición del Problema

El problema de aprendizaje de hamiltonianos es una cuestión importante en la intersección de la física cuántica de muchos cuerpos y el aprendizaje automático. Dado múltiples copias del estado de equilibrio térmico (estado de Gibbs) de un hamiltoniano desconocido H, el objetivo es aprender los coeficientes del hamiltoniano. Este problema tiene motivación directa desde la física: el hamiltoniano describe las interacciones y la evolución temporal de un sistema cuántico, mientras que el estado de Gibbs es el estado en el que el sistema alcanza equilibrio térmico con el entorno a una temperatura dada.

Significado de la Investigación

Significado Físico: Comprender las propiedades fundamentales de sistemas cuánticos y predecir su comportamiento
Significado Computacional: Esta es la generalización cuántica del problema clásico de aprendizaje de campos aleatorios de Markov
Significado Teórico: Conecta la teoría de información cuántica con la teoría del aprendizaje estadístico

Limitaciones de Métodos Existentes

El trabajo de Anshu et al. (AAKS21) para hamiltonianos geométricamente locales tiene complejidad de muestras O(2^{poly(β)}N²logN/(β^c ε²)), que no es óptima en su dependencia de β y N
Falta análisis y optimización explícita de la complejidad temporal
Solo es aplicable a la clase de hamiltonianos geométricamente locales

Contribuciones Principales

Algoritmo Óptimo: Propone un algoritmo óptimo para aprender hamiltonianos de baja intersección en el régimen de alta temperatura, con complejidad de muestras O(logN/(βε)²) y complejidad temporal O(N logN/(βε)²)
Cota Inferior Coincidente: Demuestra una cota inferior coincidente para la complejidad de muestras Ω(exp(β)logN/(β²ε²)), alcanzando optimalidad en el régimen de alta temperatura
Clase de Hamiltonianos Más General: Extiende a hamiltonianos de baja intersección, que son más generales que los hamiltonianos geométricamente locales
Análisis Teórico: Mejora el análisis de convexidad fuerte de la función de partición logarítmica, mejorando el parámetro de convexidad fuerte a β²/2
Extensión a Evolución en Tiempo Real: Demuestra que el mismo algoritmo puede usarse para aprender hamiltonianos a partir de operadores unitarios de evolución en tiempo real e^{-itH}

Explicación Detallada de Métodos

Definición de la Tarea

Considere un hamiltoniano de un sistema de N qubits H = Σ_^M λ_a E_a, donde:

E_a son operadores de Pauli distintos y no identidad conocidos
λ_a ∈ -1,1 son los coeficientes a aprender
El hamiltoniano tiene baja intersección: cada operador actúa sobre un número constante de qubits, y cada operador tiene intersecciones no triviales de soporte con solo un número constante de otros operadores

Objetivo: Aprender los coeficientes {λ_a} a partir de copias del estado de Gibbs ρ = exp(-βH)/Tr(exp(-βH)) hasta error aditivo ε.

Marco Técnico Principal

1. Expansión de Conglomerados (Cluster Expansion)

Utiliza la técnica de expansión de conglomerados de la mecánica estadística para expandir el valor esperado ⟨E_a⟩ como serie de Taylor en β:

⟨E_a⟩(x) = β p₁^{(a)}(x) + β² p₂^{(a)}(x) + β³ p₃^{(a)}(x) + ...

donde p_m^{(a)} es un polinomio homogéneo de grado m, y p₁^{(a)}(x) = -x_a.

2. Flujo del Algoritmo

Paso 1: Estimación de Valores Esperados

Para cada operador de Pauli E_a, estima ⟨E_a⟩ a precisión βε
Utiliza coloración del grafo de interacción dual y mide operadores no superpuestos en paralelo
Complejidad de muestras: O(d/(β²ε²)log(M/δ))

Paso 2: Método de Newton-Raphson Define la función F_a(x) = Σ_^m β^k p_k^{(a)}(x) - Ê_a, con el objetivo de encontrar x donde F(x) es suficientemente pequeño.

Utiliza iteración de Newton-Raphson modificada:

x^{(t+1)} = Proj_{[-1,1]^M}[x^{(t)} + β^{-1} Σ_{k=0}^{K-1} (I + β^{-1}J(x^{(t)}))^k F(x^{(t)})]

3. Innovaciones Técnicas Clave

Cálculo de Derivadas de Conglomerados:

Diseña un algoritmo para calcular exactamente las derivadas de conglomerados D_W L
Complejidad temporal: (8m + L)poly(m)
Aprovecha las propiedades de integridad de las matrices de Pauli para aritmética exacta

Análisis de Matriz Jacobiana:

Demuestra que la matriz jacobiana J posee una propiedad de "banda diagonal"
Si b y a están a distancia k, entonces J_ tiene magnitud O(β^{k+1})
Esto hace que J esté cerca de -βI, facilitando la aproximación de J^{-1}

Análisis de Convergencia

Condición de Temperatura Crítica

El algoritmo funciona cuando β < β_c, donde β_c = (25e^6(d+1)^{10})^{-1} depende solo del grado d del grafo de interacción dual.

Propagación de Errores

Analiza la propagación de errores mediante el teorema del valor medio multivariado:

|x_a - λ_a| ≤ ||J^{-1}||_{∞→∞}(||F(x)||_∞ + ||F(λ)||_∞) ≤ 4ε

Configuración Experimental

Verificación Teórica

El artículo es principalmente un trabajo teórico, verificando la corrección y optimalidad del algoritmo mediante pruebas matemáticas, en lugar de experimentos empíricos.

Análisis de Complejidad

Complejidad de Muestras: O(logN/(βε)²) (error ℓ_∞), O(N/(βε)²) (error ℓ_2)
Complejidad Temporal: O(N logN/(βε)²) (ℓ_∞), O(N²/(βε)²) (ℓ_2)
Tiempo de Preprocesamiento: O(LMd log d) para construir el grafo de interacción dual

Resultados Experimentales

Resultados Teóricos Principales

Teorema de Cota Superior (Teorema 1.1)

Para hamiltonianos de baja intersección, bajo la condición β < β_c:

Error ℓ_∞ ε: complejidad de muestras O(1/(β²ε²) log(N/δ))
Error ℓ_2 ε: complejidad de muestras O(N/(β²ε²) log(N/δ))
La complejidad temporal es la complejidad de muestras multiplicada por N

Teorema de Cota Inferior (Teorema 1.2)

Existen hamiltonianos 2-locales tales que:

Error ℓ_∞: complejidad de muestras Ω(exp(β)/(β²ε²) log(N/δ))
Error ℓ_2: complejidad de muestras Ω(exp(β)N/(β²ε²))

Comparación con Trabajos Anteriores

Método	Complejidad de Muestras	Complejidad Temporal	Rango de Aplicación
AAKS21	O(N²logN/(β^c ε²))	O(N³logN/(β^c ε²))	Geométricamente local
Este trabajo	O(logN/(β²ε²))	O(N logN/(β²ε²))	Baja intersección
Caso clásico	O(logN/(β²ε²))	O(N logN/(β²ε²))	-

Bairey et al. (2019): Propone por primera vez aprender hamiltonianos a partir de estados estacionarios, pero carece de análisis de caso peor
AAKS21: Establece cotas superiores rigurosas de complejidad de muestras, pero no es óptima en múltiples parámetros
Caso Clásico: El aprendizaje de parámetros de campos aleatorios de Markov ya tiene algoritmos casi óptimos

Conexiones Técnicas

Expansión de Conglomerados: Toma prestada la técnica de expansión a alta temperatura de la mecánica estadística
Método de Newton: Aplicación de métodos clásicos de optimización en configuración cuántica
Cotas Inferiores de Teoría de Información: Utiliza el lema de Fano para establecer cotas inferiores de teoría de información

Conclusiones y Discusión

Conclusiones Principales

En el régimen de alta temperatura, el aprendizaje de hamiltonianos cuánticos puede alcanzar la misma complejidad óptima que en el caso clásico
El algoritmo propuesto es óptimo tanto en complejidad de muestras como de tiempo
La clase de hamiltonianos de baja intersección es más general que la geométricamente local, pero aún puede aprenderse eficientemente

Limitaciones

Restricción de Temperatura: El algoritmo solo funciona en el régimen de alta temperatura, con temperatura crítica dependiente del grado del grafo dual
Dependencia del Grado: Aunque es óptimo para grado fijo, la temperatura crítica disminuye rápidamente con el grado
Región de Baja Temperatura: El problema de aprendizaje en la región de baja temperatura permanece abierto

Direcciones Futuras

Ampliación del Rango de Temperatura: Buscar algoritmos que funcionen en un rango de temperatura más amplio
Hamiltonianos Locales Generales: Extender a casos donde el grado no es constante
Algoritmos de Baja Temperatura: Desarrollar algoritmos de aprendizaje efectivos para la región de baja temperatura
Verificación Experimental: Verificar el desempeño del algoritmo en sistemas cuánticos reales

Evaluación Profunda

Fortalezas

Completitud Teórica: Proporciona análisis completo de cotas superiores e inferiores coincidentes
Innovación Técnica: Combina ingeniosamente expansión de conglomerados y método de Newton
Optimalidad: Alcanza optimalidad simultáneamente en múltiples parámetros
Generalidad: Extiende a una clase de hamiltonianos más amplia que trabajos anteriores
Practicidad del Algoritmo: Proporciona algoritmo concreto implementable y análisis de complejidad

Deficiencias

Limitación del Rango de Aplicación: Solo es aplicable en el régimen de alta temperatura
Sensibilidad al Grado: La temperatura crítica tiene fuerte dependencia del grado
Falta de Experimentos: Trabajo puramente teórico, carece de verificación numérica
Ventaja Cuántica No Evidente: En la configuración estudiada, la complejidad del caso cuántico es la misma que en el caso clásico

Impacto

Contribución Teórica: Establece un punto de referencia para el aprendizaje de hamiltonianos cuánticos
Valor Metodológico: Demuestra la aplicación efectiva de técnicas clásicas en configuración cuántica
Investigación Posterior: Sienta las bases para investigación en regiones de baja temperatura y configuraciones más generales
Potencial Práctico: Proporciona orientación teórica para la caracterización experimental de sistemas cuánticos

Escenarios de Aplicación

Simulación Cuántica: Verificar la precisión de simuladores cuánticos
Ciencia de Materiales: Aprender hamiltonianos efectivos de sistemas de materia condensada
Computación Cuántica: Calibración y verificación de procesadores cuánticos
Investigación Fundamental: Comprender las propiedades de sistemas cuánticos de muchos cuerpos

Referencias

Anshu, A., Arunachalam, S., Kuwahara, T., & Soleimanifar, M. (2021). Sample-efficient learning of interacting quantum systems. Nature Physics.
Kuwahara, T., Kato, K., & Brandão, F. G. (2020). Clustering of conditional mutual information for quantum Gibbs states above a threshold temperature. Physical Review Letters.
Bresler, G. (2015). Efficiently learning Ising models on arbitrary graphs. STOC.
Klivans, A., & Meka, R. (2017). Learning graphical models using multiplicative weights. FOCS.