Optimal learning of quantum Hamiltonians from high-temperature Gibbs states
Haah, Kothari, Tang
We study the problem of learning a Hamiltonian $H$ to precision $\varepsilon$, supposing we are given copies of its Gibbs state $Ï=\exp(-βH)/\operatorname{Tr}(\exp(-βH))$ at a known inverse temperature $β$. Anshu, Arunachalam, Kuwahara, and Soleimanifar (Nature Physics, 2021, arXiv:2004.07266) recently studied the sample complexity (number of copies of $Ï$ needed) of this problem for geometrically local $N$-qubit Hamiltonians. In the high-temperature (low $β$) regime, their algorithm has sample complexity poly$(N, 1/β,1/\varepsilon)$ and can be implemented with polynomial, but suboptimal, time complexity.
In this paper, we study the same question for a more general class of Hamiltonians. We show how to learn the coefficients of a Hamiltonian to error $\varepsilon$ with sample complexity $S = O(\log N/(β\varepsilon)^{2})$ and time complexity linear in the sample size, $O(S N)$. Furthermore, we prove a matching lower bound showing that our algorithm's sample complexity is optimal, and hence our time complexity is also optimal.
In the appendix, we show that virtually the same algorithm can be used to learn $H$ from a real-time evolution unitary $e^{-it H}$ in a small $t$ regime with similar sample and time complexity.
academic
Apprentissage optimal des hamiltoniens quantiques à partir d'états de Gibbs à haute température
Cet article étudie le problème d'apprentissage de l'hamiltonien H à partir de copies de l'état de Gibbs ρ=exp(-βH)/Tr(exp(-βH)) avec une température inverse β connue, jusqu'à une précision ε. Dans le régime haute température (β faible), les auteurs proposent un algorithme d'apprentissage pour la classe des hamiltoniens à faible intersection, réalisant une complexité d'échantillonnage S=O(logN/(βε)²) et une complexité temporelle O(SN), et prouvent des bornes inférieures correspondantes, démontrant que l'algorithme est optimal en complexité d'échantillonnage et temporelle.
Le problème d'apprentissage de l'hamiltonien est une question importante à l'intersection de la physique quantique multi-corps et de l'apprentissage automatique. Étant donné plusieurs copies de l'état d'équilibre thermique (état de Gibbs) d'un hamiltonien inconnu H, l'objectif est d'apprendre les coefficients de l'hamiltonien. Ce problème possède une motivation directe en physique : l'hamiltonien décrit les interactions et l'évolution temporelle d'un système quantique, tandis que l'état de Gibbs est l'état du système en équilibre thermique avec son environnement à une température donnée.
Le travail d'Anshu et al. (AAKS21) sur les hamiltoniens géométriquement locaux présente une complexité d'échantillonnage O(2^{poly(β)}N²logN/(β^c ε²)), qui n'est pas optimale dans sa dépendance en β et N
L'analyse et l'optimisation de la complexité temporelle manquent de clarté
S'applique uniquement à la classe des hamiltoniens géométriquement locaux
Algorithme optimal : Propose un algorithme optimal pour l'apprentissage des hamiltoniens à faible intersection dans le régime haute température, avec complexité d'échantillonnage O(logN/(βε)²) et complexité temporelle O(N logN/(βε)²)
Borne inférieure correspondante : Prouve une borne inférieure correspondante pour la complexité d'échantillonnage Ω(exp(β)logN/(β²ε²)), atteignant l'optimalité dans le régime haute température
Classe d'hamiltoniens plus générale : Étend à des hamiltoniens à faible intersection, qui sont plus généraux que les hamiltoniens géométriquement locaux
Analyse théorique : Améliore l'analyse de la forte convexité de la fonction de partition logarithmique, raffinant le paramètre de forte convexité à β²/2
Extension à l'évolution en temps réel : Démontre que le même algorithme peut être utilisé pour apprendre l'hamiltonien à partir d'opérateurs unitaires d'évolution en temps réel e^{-itH}
Considérons l'hamiltonien d'un système de N qubits H = Σ_^M λ_a E_a, où :
E_a sont des opérateurs de Pauli non-identité distincts et connus
λ_a ∈ -1,1 sont les coefficients à apprendre
L'hamiltonien est à faible intersection : chaque opérateur agit sur un nombre constant de qubits, et chaque opérateur n'a que des intersections non-triviales avec un nombre constant d'autres opérateurs
Objectif : Apprendre les coefficients {λ_a} à partir de copies de l'état de Gibbs ρ = exp(-βH)/Tr(exp(-βH)) jusqu'à une erreur additive ε.
Étape 2 : Méthode de Newton-Raphson
Définir la fonction F_a(x) = Σ_^m β^k p_k^{(a)}(x) - Ê_a, l'objectif étant de trouver x tel que F(x) soit suffisamment petit.
Utiliser l'itération de Newton-Raphson modifiée :
x^{(t+1)} = Proj_{[-1,1]^M}[x^{(t)} + β^{-1} Σ_{k=0}^{K-1} (I + β^{-1}J(x^{(t)}))^k F(x^{(t)})]
L'article est principalement un travail théorique, vérifiant la correction et l'optimalité de l'algorithme par des preuves mathématiques plutôt que par des expériences empiriques.
Améliore le paramètre de forte convexité de la fonction de partition logarithmique de Ω(β^c/N) à Ω(β²), ce qui correspond à une amélioration de la borne inférieure de la variance des observables macroscopiques.
Dans le régime haute température, l'apprentissage des hamiltoniens quantiques peut atteindre la même complexité optimale que le cas classique
L'algorithme proposé est optimal en complexité d'échantillonnage et temporelle
La classe des hamiltoniens à faible intersection est plus générale que celle des hamiltoniens géométriquement locaux, mais reste efficacement apprenable
Restriction de température : L'algorithme ne fonctionne que dans le régime haute température, la température critique dépendant du degré du graphe dual
Dépendance au degré : Bien qu'optimal pour un degré fixe, la température critique décroît rapidement avec le degré
Région basse température : Le problème d'apprentissage en région basse température reste ouvert
Anshu, A., Arunachalam, S., Kuwahara, T., & Soleimanifar, M. (2021). Sample-efficient learning of interacting quantum systems. Nature Physics.
Kuwahara, T., Kato, K., & Brandão, F. G. (2020). Clustering of conditional mutual information for quantum Gibbs states above a threshold temperature. Physical Review Letters.
Bresler, G. (2015). Efficiently learning Ising models on arbitrary graphs. STOC.
Klivans, A., & Meka, R. (2017). Learning graphical models using multiplicative weights. FOCS.