Optimal learning of quantum Hamiltonians from high-temperature Gibbs states
Haah, Kothari, Tang
We study the problem of learning a Hamiltonian $H$ to precision $\varepsilon$, supposing we are given copies of its Gibbs state $Ï=\exp(-βH)/\operatorname{Tr}(\exp(-βH))$ at a known inverse temperature $β$. Anshu, Arunachalam, Kuwahara, and Soleimanifar (Nature Physics, 2021, arXiv:2004.07266) recently studied the sample complexity (number of copies of $Ï$ needed) of this problem for geometrically local $N$-qubit Hamiltonians. In the high-temperature (low $β$) regime, their algorithm has sample complexity poly$(N, 1/β,1/\varepsilon)$ and can be implemented with polynomial, but suboptimal, time complexity.
In this paper, we study the same question for a more general class of Hamiltonians. We show how to learn the coefficients of a Hamiltonian to error $\varepsilon$ with sample complexity $S = O(\log N/(β\varepsilon)^{2})$ and time complexity linear in the sample size, $O(S N)$. Furthermore, we prove a matching lower bound showing that our algorithm's sample complexity is optimal, and hence our time complexity is also optimal.
In the appendix, we show that virtually the same algorithm can be used to learn $H$ from a real-time evolution unitary $e^{-it H}$ in a small $t$ regime with similar sample and time complexity.
academic
Aprendizaje óptimo de hamiltonianos cuánticos a partir de estados de Gibbs a alta temperatura
Este artículo estudia el problema de aprender un hamiltoniano H a precisión ε a partir de copias del estado de Gibbs ρ=exp(-βH)/Tr(exp(-βH)) con temperatura inversa β conocida. En el régimen de alta temperatura (β bajo), los autores proponen un algoritmo de aprendizaje para la clase de hamiltonianos de baja intersección, logrando una complejidad de muestras S=O(logN/(βε)²) y complejidad temporal O(SN), y demuestran cotas inferiores coincidentes, lo que indica que el algoritmo es óptimo tanto en complejidad de muestras como de tiempo.
El problema de aprendizaje de hamiltonianos es una cuestión importante en la intersección de la física cuántica de muchos cuerpos y el aprendizaje automático. Dado múltiples copias del estado de equilibrio térmico (estado de Gibbs) de un hamiltoniano desconocido H, el objetivo es aprender los coeficientes del hamiltoniano. Este problema tiene motivación directa desde la física: el hamiltoniano describe las interacciones y la evolución temporal de un sistema cuántico, mientras que el estado de Gibbs es el estado en el que el sistema alcanza equilibrio térmico con el entorno a una temperatura dada.
El trabajo de Anshu et al. (AAKS21) para hamiltonianos geométricamente locales tiene complejidad de muestras O(2^{poly(β)}N²logN/(β^c ε²)), que no es óptima en su dependencia de β y N
Falta análisis y optimización explícita de la complejidad temporal
Solo es aplicable a la clase de hamiltonianos geométricamente locales
Algoritmo Óptimo: Propone un algoritmo óptimo para aprender hamiltonianos de baja intersección en el régimen de alta temperatura, con complejidad de muestras O(logN/(βε)²) y complejidad temporal O(N logN/(βε)²)
Cota Inferior Coincidente: Demuestra una cota inferior coincidente para la complejidad de muestras Ω(exp(β)logN/(β²ε²)), alcanzando optimalidad en el régimen de alta temperatura
Clase de Hamiltonianos Más General: Extiende a hamiltonianos de baja intersección, que son más generales que los hamiltonianos geométricamente locales
Análisis Teórico: Mejora el análisis de convexidad fuerte de la función de partición logarítmica, mejorando el parámetro de convexidad fuerte a β²/2
Extensión a Evolución en Tiempo Real: Demuestra que el mismo algoritmo puede usarse para aprender hamiltonianos a partir de operadores unitarios de evolución en tiempo real e^{-itH}
Considere un hamiltoniano de un sistema de N qubits H = Σ_^M λ_a E_a, donde:
E_a son operadores de Pauli distintos y no identidad conocidos
λ_a ∈ -1,1 son los coeficientes a aprender
El hamiltoniano tiene baja intersección: cada operador actúa sobre un número constante de qubits, y cada operador tiene intersecciones no triviales de soporte con solo un número constante de otros operadores
Objetivo: Aprender los coeficientes {λ_a} a partir de copias del estado de Gibbs ρ = exp(-βH)/Tr(exp(-βH)) hasta error aditivo ε.
Para cada operador de Pauli E_a, estima ⟨E_a⟩ a precisión βε
Utiliza coloración del grafo de interacción dual y mide operadores no superpuestos en paralelo
Complejidad de muestras: O(d/(β²ε²)log(M/δ))
Paso 2: Método de Newton-Raphson
Define la función F_a(x) = Σ_^m β^k p_k^{(a)}(x) - Ê_a, con el objetivo de encontrar x donde F(x) es suficientemente pequeño.
Utiliza iteración de Newton-Raphson modificada:
x^{(t+1)} = Proj_{[-1,1]^M}[x^{(t)} + β^{-1} Σ_{k=0}^{K-1} (I + β^{-1}J(x^{(t)}))^k F(x^{(t)})]
El artículo es principalmente un trabajo teórico, verificando la corrección y optimalidad del algoritmo mediante pruebas matemáticas, en lugar de experimentos empíricos.
Mejora el parámetro de convexidad fuerte de la función de partición logarítmica de Ω(β^c/N) a Ω(β²), lo que corresponde a una mejora en la cota inferior de la varianza de observables macroscópicos.
Anshu, A., Arunachalam, S., Kuwahara, T., & Soleimanifar, M. (2021). Sample-efficient learning of interacting quantum systems. Nature Physics.
Kuwahara, T., Kato, K., & Brandão, F. G. (2020). Clustering of conditional mutual information for quantum Gibbs states above a threshold temperature. Physical Review Letters.
Bresler, G. (2015). Efficiently learning Ising models on arbitrary graphs. STOC.
Klivans, A., & Meka, R. (2017). Learning graphical models using multiplicative weights. FOCS.