2025-11-18T06:07:11.995553

Optimal learning of quantum Hamiltonians from high-temperature Gibbs states

Haah, Kothari, Tang
We study the problem of learning a Hamiltonian $H$ to precision $\varepsilon$, supposing we are given copies of its Gibbs state $ρ=\exp(-βH)/\operatorname{Tr}(\exp(-βH))$ at a known inverse temperature $β$. Anshu, Arunachalam, Kuwahara, and Soleimanifar (Nature Physics, 2021, arXiv:2004.07266) recently studied the sample complexity (number of copies of $ρ$ needed) of this problem for geometrically local $N$-qubit Hamiltonians. In the high-temperature (low $β$) regime, their algorithm has sample complexity poly$(N, 1/β,1/\varepsilon)$ and can be implemented with polynomial, but suboptimal, time complexity. In this paper, we study the same question for a more general class of Hamiltonians. We show how to learn the coefficients of a Hamiltonian to error $\varepsilon$ with sample complexity $S = O(\log N/(β\varepsilon)^{2})$ and time complexity linear in the sample size, $O(S N)$. Furthermore, we prove a matching lower bound showing that our algorithm's sample complexity is optimal, and hence our time complexity is also optimal. In the appendix, we show that virtually the same algorithm can be used to learn $H$ from a real-time evolution unitary $e^{-it H}$ in a small $t$ regime with similar sample and time complexity.
academic

Aprendizaje óptimo de hamiltonianos cuánticos a partir de estados de Gibbs a alta temperatura

Información Básica

  • ID del Artículo: 2108.04842
  • Título: Optimal learning of quantum Hamiltonians from high-temperature Gibbs states
  • Autores: Jeongwan Haah (Microsoft Quantum), Robin Kothari (Microsoft Quantum), Ewin Tang (University of Washington)
  • Clasificación: quant-ph cs.DS cs.LG
  • Fecha de Publicación: 17 de marzo de 2023 (versión arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2108.04842

Resumen

Este artículo estudia el problema de aprender un hamiltoniano H a precisión ε a partir de copias del estado de Gibbs ρ=exp(-βH)/Tr(exp(-βH)) con temperatura inversa β conocida. En el régimen de alta temperatura (β bajo), los autores proponen un algoritmo de aprendizaje para la clase de hamiltonianos de baja intersección, logrando una complejidad de muestras S=O(logN/(βε)²) y complejidad temporal O(SN), y demuestran cotas inferiores coincidentes, lo que indica que el algoritmo es óptimo tanto en complejidad de muestras como de tiempo.

Antecedentes y Motivación de la Investigación

Definición del Problema

El problema de aprendizaje de hamiltonianos es una cuestión importante en la intersección de la física cuántica de muchos cuerpos y el aprendizaje automático. Dado múltiples copias del estado de equilibrio térmico (estado de Gibbs) de un hamiltoniano desconocido H, el objetivo es aprender los coeficientes del hamiltoniano. Este problema tiene motivación directa desde la física: el hamiltoniano describe las interacciones y la evolución temporal de un sistema cuántico, mientras que el estado de Gibbs es el estado en el que el sistema alcanza equilibrio térmico con el entorno a una temperatura dada.

Significado de la Investigación

  1. Significado Físico: Comprender las propiedades fundamentales de sistemas cuánticos y predecir su comportamiento
  2. Significado Computacional: Esta es la generalización cuántica del problema clásico de aprendizaje de campos aleatorios de Markov
  3. Significado Teórico: Conecta la teoría de información cuántica con la teoría del aprendizaje estadístico

Limitaciones de Métodos Existentes

  • El trabajo de Anshu et al. (AAKS21) para hamiltonianos geométricamente locales tiene complejidad de muestras O(2^{poly(β)}N²logN/(β^c ε²)), que no es óptima en su dependencia de β y N
  • Falta análisis y optimización explícita de la complejidad temporal
  • Solo es aplicable a la clase de hamiltonianos geométricamente locales

Contribuciones Principales

  1. Algoritmo Óptimo: Propone un algoritmo óptimo para aprender hamiltonianos de baja intersección en el régimen de alta temperatura, con complejidad de muestras O(logN/(βε)²) y complejidad temporal O(N logN/(βε)²)
  2. Cota Inferior Coincidente: Demuestra una cota inferior coincidente para la complejidad de muestras Ω(exp(β)logN/(β²ε²)), alcanzando optimalidad en el régimen de alta temperatura
  3. Clase de Hamiltonianos Más General: Extiende a hamiltonianos de baja intersección, que son más generales que los hamiltonianos geométricamente locales
  4. Análisis Teórico: Mejora el análisis de convexidad fuerte de la función de partición logarítmica, mejorando el parámetro de convexidad fuerte a β²/2
  5. Extensión a Evolución en Tiempo Real: Demuestra que el mismo algoritmo puede usarse para aprender hamiltonianos a partir de operadores unitarios de evolución en tiempo real e^{-itH}

Explicación Detallada de Métodos

Definición de la Tarea

Considere un hamiltoniano de un sistema de N qubits H = Σ_^M λ_a E_a, donde:

  • E_a son operadores de Pauli distintos y no identidad conocidos
  • λ_a ∈ -1,1 son los coeficientes a aprender
  • El hamiltoniano tiene baja intersección: cada operador actúa sobre un número constante de qubits, y cada operador tiene intersecciones no triviales de soporte con solo un número constante de otros operadores

Objetivo: Aprender los coeficientes {λ_a} a partir de copias del estado de Gibbs ρ = exp(-βH)/Tr(exp(-βH)) hasta error aditivo ε.

Marco Técnico Principal

1. Expansión de Conglomerados (Cluster Expansion)

Utiliza la técnica de expansión de conglomerados de la mecánica estadística para expandir el valor esperado ⟨E_a⟩ como serie de Taylor en β:

⟨E_a⟩(x) = β p₁^{(a)}(x) + β² p₂^{(a)}(x) + β³ p₃^{(a)}(x) + ...

donde p_m^{(a)} es un polinomio homogéneo de grado m, y p₁^{(a)}(x) = -x_a.

2. Flujo del Algoritmo

Paso 1: Estimación de Valores Esperados

  • Para cada operador de Pauli E_a, estima ⟨E_a⟩ a precisión βε
  • Utiliza coloración del grafo de interacción dual y mide operadores no superpuestos en paralelo
  • Complejidad de muestras: O(d/(β²ε²)log(M/δ))

Paso 2: Método de Newton-Raphson Define la función F_a(x) = Σ_^m β^k p_k^{(a)}(x) - Ê_a, con el objetivo de encontrar x donde F(x) es suficientemente pequeño.

Utiliza iteración de Newton-Raphson modificada:

x^{(t+1)} = Proj_{[-1,1]^M}[x^{(t)} + β^{-1} Σ_{k=0}^{K-1} (I + β^{-1}J(x^{(t)}))^k F(x^{(t)})]

3. Innovaciones Técnicas Clave

Cálculo de Derivadas de Conglomerados:

  • Diseña un algoritmo para calcular exactamente las derivadas de conglomerados D_W L
  • Complejidad temporal: (8m + L)poly(m)
  • Aprovecha las propiedades de integridad de las matrices de Pauli para aritmética exacta

Análisis de Matriz Jacobiana:

  • Demuestra que la matriz jacobiana J posee una propiedad de "banda diagonal"
  • Si b y a están a distancia k, entonces J_ tiene magnitud O(β^{k+1})
  • Esto hace que J esté cerca de -βI, facilitando la aproximación de J^{-1}

Análisis de Convergencia

Condición de Temperatura Crítica

El algoritmo funciona cuando β < β_c, donde β_c = (25e^6(d+1)^{10})^{-1} depende solo del grado d del grafo de interacción dual.

Propagación de Errores

Analiza la propagación de errores mediante el teorema del valor medio multivariado:

|x_a - λ_a| ≤ ||J^{-1}||_{∞→∞}(||F(x)||_∞ + ||F(λ)||_∞) ≤ 4ε

Configuración Experimental

Verificación Teórica

El artículo es principalmente un trabajo teórico, verificando la corrección y optimalidad del algoritmo mediante pruebas matemáticas, en lugar de experimentos empíricos.

Análisis de Complejidad

  • Complejidad de Muestras: O(logN/(βε)²) (error ℓ_∞), O(N/(βε)²) (error ℓ_2)
  • Complejidad Temporal: O(N logN/(βε)²) (ℓ_∞), O(N²/(βε)²) (ℓ_2)
  • Tiempo de Preprocesamiento: O(LMd log d) para construir el grafo de interacción dual

Resultados Experimentales

Resultados Teóricos Principales

Teorema de Cota Superior (Teorema 1.1)

Para hamiltonianos de baja intersección, bajo la condición β < β_c:

  • Error ℓ_∞ ε: complejidad de muestras O(1/(β²ε²) log(N/δ))
  • Error ℓ_2 ε: complejidad de muestras O(N/(β²ε²) log(N/δ))
  • La complejidad temporal es la complejidad de muestras multiplicada por N

Teorema de Cota Inferior (Teorema 1.2)

Existen hamiltonianos 2-locales tales que:

  • Error ℓ_∞: complejidad de muestras Ω(exp(β)/(β²ε²) log(N/δ))
  • Error ℓ_2: complejidad de muestras Ω(exp(β)N/(β²ε²))

Comparación con Trabajos Anteriores

MétodoComplejidad de MuestrasComplejidad TemporalRango de Aplicación
AAKS21O(N²logN/(β^c ε²))O(N³logN/(β^c ε²))Geométricamente local
Este trabajoO(logN/(β²ε²))O(N logN/(β²ε²))Baja intersección
Caso clásicoO(logN/(β²ε²))O(N logN/(β²ε²))-

Mejora de Convexidad Fuerte

Mejora el parámetro de convexidad fuerte de la función de partición logarítmica de Ω(β^c/N) a Ω(β²), lo que corresponde a una mejora en la cota inferior de la varianza de observables macroscópicos.

Trabajo Relacionado

Aprendizaje de Hamiltonianos Cuánticos

  • Bairey et al. (2019): Propone por primera vez aprender hamiltonianos a partir de estados estacionarios, pero carece de análisis de caso peor
  • AAKS21: Establece cotas superiores rigurosas de complejidad de muestras, pero no es óptima en múltiples parámetros
  • Caso Clásico: El aprendizaje de parámetros de campos aleatorios de Markov ya tiene algoritmos casi óptimos

Conexiones Técnicas

  • Expansión de Conglomerados: Toma prestada la técnica de expansión a alta temperatura de la mecánica estadística
  • Método de Newton: Aplicación de métodos clásicos de optimización en configuración cuántica
  • Cotas Inferiores de Teoría de Información: Utiliza el lema de Fano para establecer cotas inferiores de teoría de información

Conclusiones y Discusión

Conclusiones Principales

  1. En el régimen de alta temperatura, el aprendizaje de hamiltonianos cuánticos puede alcanzar la misma complejidad óptima que en el caso clásico
  2. El algoritmo propuesto es óptimo tanto en complejidad de muestras como de tiempo
  3. La clase de hamiltonianos de baja intersección es más general que la geométricamente local, pero aún puede aprenderse eficientemente

Limitaciones

  1. Restricción de Temperatura: El algoritmo solo funciona en el régimen de alta temperatura, con temperatura crítica dependiente del grado del grafo dual
  2. Dependencia del Grado: Aunque es óptimo para grado fijo, la temperatura crítica disminuye rápidamente con el grado
  3. Región de Baja Temperatura: El problema de aprendizaje en la región de baja temperatura permanece abierto

Direcciones Futuras

  1. Ampliación del Rango de Temperatura: Buscar algoritmos que funcionen en un rango de temperatura más amplio
  2. Hamiltonianos Locales Generales: Extender a casos donde el grado no es constante
  3. Algoritmos de Baja Temperatura: Desarrollar algoritmos de aprendizaje efectivos para la región de baja temperatura
  4. Verificación Experimental: Verificar el desempeño del algoritmo en sistemas cuánticos reales

Evaluación Profunda

Fortalezas

  1. Completitud Teórica: Proporciona análisis completo de cotas superiores e inferiores coincidentes
  2. Innovación Técnica: Combina ingeniosamente expansión de conglomerados y método de Newton
  3. Optimalidad: Alcanza optimalidad simultáneamente en múltiples parámetros
  4. Generalidad: Extiende a una clase de hamiltonianos más amplia que trabajos anteriores
  5. Practicidad del Algoritmo: Proporciona algoritmo concreto implementable y análisis de complejidad

Deficiencias

  1. Limitación del Rango de Aplicación: Solo es aplicable en el régimen de alta temperatura
  2. Sensibilidad al Grado: La temperatura crítica tiene fuerte dependencia del grado
  3. Falta de Experimentos: Trabajo puramente teórico, carece de verificación numérica
  4. Ventaja Cuántica No Evidente: En la configuración estudiada, la complejidad del caso cuántico es la misma que en el caso clásico

Impacto

  1. Contribución Teórica: Establece un punto de referencia para el aprendizaje de hamiltonianos cuánticos
  2. Valor Metodológico: Demuestra la aplicación efectiva de técnicas clásicas en configuración cuántica
  3. Investigación Posterior: Sienta las bases para investigación en regiones de baja temperatura y configuraciones más generales
  4. Potencial Práctico: Proporciona orientación teórica para la caracterización experimental de sistemas cuánticos

Escenarios de Aplicación

  1. Simulación Cuántica: Verificar la precisión de simuladores cuánticos
  2. Ciencia de Materiales: Aprender hamiltonianos efectivos de sistemas de materia condensada
  3. Computación Cuántica: Calibración y verificación de procesadores cuánticos
  4. Investigación Fundamental: Comprender las propiedades de sistemas cuánticos de muchos cuerpos

Referencias

  1. Anshu, A., Arunachalam, S., Kuwahara, T., & Soleimanifar, M. (2021). Sample-efficient learning of interacting quantum systems. Nature Physics.
  2. Kuwahara, T., Kato, K., & Brandão, F. G. (2020). Clustering of conditional mutual information for quantum Gibbs states above a threshold temperature. Physical Review Letters.
  3. Bresler, G. (2015). Efficiently learning Ising models on arbitrary graphs. STOC.
  4. Klivans, A., & Meka, R. (2017). Learning graphical models using multiplicative weights. FOCS.