Optimal learning of quantum Hamiltonians from high-temperature Gibbs states
Haah, Kothari, Tang
We study the problem of learning a Hamiltonian $H$ to precision $\varepsilon$, supposing we are given copies of its Gibbs state $Ï=\exp(-βH)/\operatorname{Tr}(\exp(-βH))$ at a known inverse temperature $β$. Anshu, Arunachalam, Kuwahara, and Soleimanifar (Nature Physics, 2021, arXiv:2004.07266) recently studied the sample complexity (number of copies of $Ï$ needed) of this problem for geometrically local $N$-qubit Hamiltonians. In the high-temperature (low $β$) regime, their algorithm has sample complexity poly$(N, 1/β,1/\varepsilon)$ and can be implemented with polynomial, but suboptimal, time complexity.
In this paper, we study the same question for a more general class of Hamiltonians. We show how to learn the coefficients of a Hamiltonian to error $\varepsilon$ with sample complexity $S = O(\log N/(β\varepsilon)^{2})$ and time complexity linear in the sample size, $O(S N)$. Furthermore, we prove a matching lower bound showing that our algorithm's sample complexity is optimal, and hence our time complexity is also optimal.
In the appendix, we show that virtually the same algorithm can be used to learn $H$ from a real-time evolution unitary $e^{-it H}$ in a small $t$ regime with similar sample and time complexity.
academic
Optimales Lernen von Quanten-Hamiltonoperatoren aus Hochtemperatur-Gibbs-Zuständen
Dieses Paper untersucht das Problem des Lernens eines Hamiltonoperators H aus Kopien des Gibbs-Zustands ρ=exp(-βH)/Tr(exp(-βH)) mit bekannter inverser Temperatur β bis zur Genauigkeit ε. Im Hochtemperaturbereich (niedriges β) präsentieren die Autoren einen Lernalgorithmus für die Klasse der niedrig-wechselwirkenden Hamiltonoperatoren mit Stichprobenkomplexität S=O(logN/(βε)²) und Zeitkomplexität O(SN). Sie beweisen zudem eine übereinstimmende untere Schranke, die zeigt, dass der Algorithmus sowohl in Stichproben- als auch in Zeitkomplexität optimal ist.
Das Hamiltonoperator-Lernproblem ist ein wichtiges Problem im Schnittbereich der Quantenmehrköpersysteme und des maschinellen Lernens. Gegeben seien mehrere Kopien eines thermischen Gleichgewichtszustands (Gibbs-Zustand) eines unbekannten Hamiltonoperators H. Das Ziel besteht darin, die Koeffizienten des Hamiltonoperators zu lernen. Dieses Problem hat direkte physikalische Motivation: Der Hamiltonoperator beschreibt die Wechselwirkungen und die Zeitentwicklung eines Quantensystems, während der Gibbs-Zustand der Zustand des Systems bei thermischem Gleichgewicht mit der Umgebung bei einer gegebenen Temperatur ist.
Die Arbeit von Anshu et al. (AAKS21) für geometrisch lokale Hamiltonoperatoren hat Stichprobenkomplexität O(2^{poly(β)}N²logN/(β^c ε²)), was in der Abhängigkeit von β und N nicht optimal ist
Zeitkomplexität wird nicht explizit analysiert und optimiert
Anwendbar nur auf geometrisch lokale Hamiltonoperatoren
Optimaler Algorithmus: Präsentation eines optimalen Algorithmus zum Lernen von niedrig-wechselwirkenden Hamiltonoperatoren im Hochtemperaturbereich mit Stichprobenkomplexität O(logN/(βε)²) und Zeitkomplexität O(N logN/(βε)²)
Übereinstimmende untere Schranke: Beweis einer übereinstimmenden unteren Schranke Ω(exp(β)logN/(β²ε²)) für die Stichprobenkomplexität, die im Hochtemperaturbereich optimal ist
Breitere Hamiltonoperator-Klasse: Erweiterung auf niedrig-wechselwirkende Hamiltonoperatoren, die allgemeiner als geometrisch lokale Hamiltonoperatoren sind
Theoretische Analyse: Verbesserung der Analyse der starken Konvexität der logarithmischen Partitionsfunktion, wobei der starke Konvexitätsparameter auf β²/2 verbessert wird
Erweiterung auf Echtzeit-Evolution: Beweis, dass derselbe Algorithmus zum Lernen von Hamiltonoperatoren aus Echtzeit-Evolutionsunitären Operatoren e^{-itH} verwendet werden kann
Betrachten Sie einen N-Qubit-Hamiltonoperator H = Σ_^M λ_a E_a, wobei:
E_a bekannte, unterschiedliche, nicht-identische Pauli-Operatoren sind
λ_a ∈ -1,1 die zu lernenden Koeffizienten sind
Der Hamiltonoperator niedrig-wechselwirkend ist: Jeder Operator wirkt auf eine konstante Anzahl von Qubits, und jeder Operator hat nur mit einer konstanten Anzahl anderer Operatoren nicht-triviale Träger-Überschneidungen
Ziel: Lernen Sie die Koeffizienten {λ_a} aus Kopien des Gibbs-Zustands ρ = exp(-βH)/Tr(exp(-βH)) bis zum additiven Fehler ε.
Schätzung von ⟨E_a⟩ für jeden Pauli-Operator E_a bis zur Genauigkeit βε
Verwendung der Färbung des dualen Wechselwirkungsgraphen zur parallelen Messung nicht-überlappender Operatoren
Stichprobenkomplexität: O(d/(β²ε²)log(M/δ))
Schritt 2: Newton-Raphson-Methode
Definieren Sie die Funktion F_a(x) = Σ_^m β^k p_k^{(a)}(x) - Ê_a mit dem Ziel, x zu finden, so dass F(x) ausreichend klein ist.
Verwendung der modifizierten Newton-Raphson-Iteration:
x^{(t+1)} = Proj_{[-1,1]^M}[x^{(t)} + β^{-1} Σ_{k=0}^{K-1} (I + β^{-1}J(x^{(t)}))^k F(x^{(t)})]
Das Paper ist hauptsächlich eine theoretische Arbeit, die die Korrektheit und Optimalität des Algorithmus durch mathematische Beweise verifiziert, anstatt durch empirische Experimente.
Verbesserung des starken Konvexitätsparameters der logarithmischen Partitionsfunktion von Ω(β^c/N) auf Ω(β²), was einer Verbesserung der unteren Schranke der Varianz makroskopischer Observablen entspricht.
Anshu, A., Arunachalam, S., Kuwahara, T., & Soleimanifar, M. (2021). Sample-efficient learning of interacting quantum systems. Nature Physics.
Kuwahara, T., Kato, K., & Brandão, F. G. (2020). Clustering of conditional mutual information for quantum Gibbs states above a threshold temperature. Physical Review Letters.
Bresler, G. (2015). Efficiently learning Ising models on arbitrary graphs. STOC.
Klivans, A., & Meka, R. (2017). Learning graphical models using multiplicative weights. FOCS.