2025-11-18T06:07:11.995553

Optimal learning of quantum Hamiltonians from high-temperature Gibbs states

Haah, Kothari, Tang
We study the problem of learning a Hamiltonian $H$ to precision $\varepsilon$, supposing we are given copies of its Gibbs state $ρ=\exp(-βH)/\operatorname{Tr}(\exp(-βH))$ at a known inverse temperature $β$. Anshu, Arunachalam, Kuwahara, and Soleimanifar (Nature Physics, 2021, arXiv:2004.07266) recently studied the sample complexity (number of copies of $ρ$ needed) of this problem for geometrically local $N$-qubit Hamiltonians. In the high-temperature (low $β$) regime, their algorithm has sample complexity poly$(N, 1/β,1/\varepsilon)$ and can be implemented with polynomial, but suboptimal, time complexity. In this paper, we study the same question for a more general class of Hamiltonians. We show how to learn the coefficients of a Hamiltonian to error $\varepsilon$ with sample complexity $S = O(\log N/(β\varepsilon)^{2})$ and time complexity linear in the sample size, $O(S N)$. Furthermore, we prove a matching lower bound showing that our algorithm's sample complexity is optimal, and hence our time complexity is also optimal. In the appendix, we show that virtually the same algorithm can be used to learn $H$ from a real-time evolution unitary $e^{-it H}$ in a small $t$ regime with similar sample and time complexity.
academic

Optimales Lernen von Quanten-Hamiltonoperatoren aus Hochtemperatur-Gibbs-Zuständen

Grundlegende Informationen

  • Paper-ID: 2108.04842
  • Titel: Optimal learning of quantum Hamiltonians from high-temperature Gibbs states
  • Autoren: Jeongwan Haah (Microsoft Quantum), Robin Kothari (Microsoft Quantum), Ewin Tang (University of Washington)
  • Klassifizierung: quant-ph cs.DS cs.LG
  • Veröffentlichungsdatum: 17. März 2023 (arXiv-Version)
  • Paper-Link: https://arxiv.org/abs/2108.04842

Zusammenfassung

Dieses Paper untersucht das Problem des Lernens eines Hamiltonoperators H aus Kopien des Gibbs-Zustands ρ=exp(-βH)/Tr(exp(-βH)) mit bekannter inverser Temperatur β bis zur Genauigkeit ε. Im Hochtemperaturbereich (niedriges β) präsentieren die Autoren einen Lernalgorithmus für die Klasse der niedrig-wechselwirkenden Hamiltonoperatoren mit Stichprobenkomplexität S=O(logN/(βε)²) und Zeitkomplexität O(SN). Sie beweisen zudem eine übereinstimmende untere Schranke, die zeigt, dass der Algorithmus sowohl in Stichproben- als auch in Zeitkomplexität optimal ist.

Forschungshintergrund und Motivation

Problemdefinition

Das Hamiltonoperator-Lernproblem ist ein wichtiges Problem im Schnittbereich der Quantenmehrköpersysteme und des maschinellen Lernens. Gegeben seien mehrere Kopien eines thermischen Gleichgewichtszustands (Gibbs-Zustand) eines unbekannten Hamiltonoperators H. Das Ziel besteht darin, die Koeffizienten des Hamiltonoperators zu lernen. Dieses Problem hat direkte physikalische Motivation: Der Hamiltonoperator beschreibt die Wechselwirkungen und die Zeitentwicklung eines Quantensystems, während der Gibbs-Zustand der Zustand des Systems bei thermischem Gleichgewicht mit der Umgebung bei einer gegebenen Temperatur ist.

Forschungsbedeutung

  1. Physikalische Bedeutung: Verständnis der grundlegenden Eigenschaften von Quantensystemen und Vorhersage ihres Verhaltens
  2. Rechnerische Bedeutung: Dies ist eine Quantenverallgemeinerung des klassischen Markov-Zufallsfeld-Lernproblems
  3. Theoretische Bedeutung: Verbindung zwischen Quanteninformationstheorie und statistischer Lerntheorie

Einschränkungen bestehender Methoden

  • Die Arbeit von Anshu et al. (AAKS21) für geometrisch lokale Hamiltonoperatoren hat Stichprobenkomplexität O(2^{poly(β)}N²logN/(β^c ε²)), was in der Abhängigkeit von β und N nicht optimal ist
  • Zeitkomplexität wird nicht explizit analysiert und optimiert
  • Anwendbar nur auf geometrisch lokale Hamiltonoperatoren

Kernbeiträge

  1. Optimaler Algorithmus: Präsentation eines optimalen Algorithmus zum Lernen von niedrig-wechselwirkenden Hamiltonoperatoren im Hochtemperaturbereich mit Stichprobenkomplexität O(logN/(βε)²) und Zeitkomplexität O(N logN/(βε)²)
  2. Übereinstimmende untere Schranke: Beweis einer übereinstimmenden unteren Schranke Ω(exp(β)logN/(β²ε²)) für die Stichprobenkomplexität, die im Hochtemperaturbereich optimal ist
  3. Breitere Hamiltonoperator-Klasse: Erweiterung auf niedrig-wechselwirkende Hamiltonoperatoren, die allgemeiner als geometrisch lokale Hamiltonoperatoren sind
  4. Theoretische Analyse: Verbesserung der Analyse der starken Konvexität der logarithmischen Partitionsfunktion, wobei der starke Konvexitätsparameter auf β²/2 verbessert wird
  5. Erweiterung auf Echtzeit-Evolution: Beweis, dass derselbe Algorithmus zum Lernen von Hamiltonoperatoren aus Echtzeit-Evolutionsunitären Operatoren e^{-itH} verwendet werden kann

Methodische Details

Aufgabendefinition

Betrachten Sie einen N-Qubit-Hamiltonoperator H = Σ_^M λ_a E_a, wobei:

  • E_a bekannte, unterschiedliche, nicht-identische Pauli-Operatoren sind
  • λ_a ∈ -1,1 die zu lernenden Koeffizienten sind
  • Der Hamiltonoperator niedrig-wechselwirkend ist: Jeder Operator wirkt auf eine konstante Anzahl von Qubits, und jeder Operator hat nur mit einer konstanten Anzahl anderer Operatoren nicht-triviale Träger-Überschneidungen

Ziel: Lernen Sie die Koeffizienten {λ_a} aus Kopien des Gibbs-Zustands ρ = exp(-βH)/Tr(exp(-βH)) bis zum additiven Fehler ε.

Technisches Kerngerüst

1. Cluster-Expansion

Verwendung der Cluster-Expansionstechnik aus der statistischen Mechanik, um Erwartungswerte ⟨E_a⟩ in eine Taylor-Reihe in β zu entwickeln:

⟨E_a⟩(x) = β p₁^{(a)}(x) + β² p₂^{(a)}(x) + β³ p₃^{(a)}(x) + ...

wobei p_m^{(a)} ein m-homogenes Polynom ist und p₁^{(a)}(x) = -x_a.

2. Algorithmus-Ablauf

Schritt 1: Schätzung der Erwartungswerte

  • Schätzung von ⟨E_a⟩ für jeden Pauli-Operator E_a bis zur Genauigkeit βε
  • Verwendung der Färbung des dualen Wechselwirkungsgraphen zur parallelen Messung nicht-überlappender Operatoren
  • Stichprobenkomplexität: O(d/(β²ε²)log(M/δ))

Schritt 2: Newton-Raphson-Methode Definieren Sie die Funktion F_a(x) = Σ_^m β^k p_k^{(a)}(x) - Ê_a mit dem Ziel, x zu finden, so dass F(x) ausreichend klein ist.

Verwendung der modifizierten Newton-Raphson-Iteration:

x^{(t+1)} = Proj_{[-1,1]^M}[x^{(t)} + β^{-1} Σ_{k=0}^{K-1} (I + β^{-1}J(x^{(t)}))^k F(x^{(t)})]

3. Wichtigste technische Innovationen

Cluster-Ableitungsberechnung:

  • Entwurf eines Algorithmus zur exakten Berechnung von Cluster-Ableitungen D_W L
  • Zeitkomplexität: (8m + L)poly(m)
  • Nutzung der Ganzzahligkeit von Pauli-Matrizen für exakte Arithmetik

Jacobi-Matrix-Analyse:

  • Beweis, dass die Jacobi-Matrix J eine "Band-Diagonal"-Eigenschaft besitzt
  • Wenn b und a einen Abstand k haben, ist die Größenordnung von J_ gleich β^{k+1}
  • Dies macht J nahe bei -βI, wodurch J^{-1} leicht zu approximieren ist

Konvergenzanalyse

Kritische Temperaturbedingung

Der Algorithmus funktioniert für β < β_c, wobei β_c = (25e^6(d+1)^{10})^{-1} nur vom Grad d des dualen Wechselwirkungsgraphen abhängt.

Fehlerfortpflanzung

Analyse der Fehlerfortpflanzung durch den multivariaten Mittelwertsatz:

|x_a - λ_a| ≤ ||J^{-1}||_{∞→∞}(||F(x)||_∞ + ||F(λ)||_∞) ≤ 4ε

Experimentelle Einrichtung

Theoretische Verifikation

Das Paper ist hauptsächlich eine theoretische Arbeit, die die Korrektheit und Optimalität des Algorithmus durch mathematische Beweise verifiziert, anstatt durch empirische Experimente.

Komplexitätsanalyse

  • Stichprobenkomplexität: O(logN/(βε)²) (ℓ_∞-Fehler), O(N/(βε)²) (ℓ_2-Fehler)
  • Zeitkomplexität: O(N logN/(βε)²) (ℓ_∞), O(N²/(βε)²) (ℓ_2)
  • Vorverarbeitungszeit: O(LMd log d) zur Konstruktion des dualen Wechselwirkungsgraphen

Experimentelle Ergebnisse

Haupttheoretische Ergebnisse

Obere-Schranken-Theorem (Theorem 1.1)

Für niedrig-wechselwirkende Hamiltonoperatoren unter der Bedingung β < β_c:

  • ℓ_∞-Fehler ε: Stichprobenkomplexität O(1/(β²ε²) log(N/δ))
  • ℓ_2-Fehler ε: Stichprobenkomplexität O(N/(β²ε²) log(N/δ))
  • Zeitkomplexität ist in beiden Fällen die Stichprobenkomplexität multipliziert mit N

Untere-Schranken-Theorem (Theorem 1.2)

Es existieren 2-lokale Hamiltonoperatoren, so dass:

  • ℓ_∞-Fehler: Stichprobenkomplexität Ω(exp(β)/(β²ε²) log(N/δ))
  • ℓ_2-Fehler: Stichprobenkomplexität Ω(exp(β)N/(β²ε²))

Vergleich mit früheren Arbeiten

MethodeStichprobenkomplexitätZeitkomplexitätAnwendungsbereich
AAKS21O(N²logN/(β^c ε²))O(N³logN/(β^c ε²))Geometrisch lokal
Dieses PaperO(logN/(β²ε²))O(N logN/(β²ε²))Niedrig-wechselwirkend
Klassischer FallO(logN/(β²ε²))O(N logN/(β²ε²))-

Verbesserung der starken Konvexität

Verbesserung des starken Konvexitätsparameters der logarithmischen Partitionsfunktion von Ω(β^c/N) auf Ω(β²), was einer Verbesserung der unteren Schranke der Varianz makroskopischer Observablen entspricht.

Verwandte Arbeiten

Quantales Hamiltonoperator-Lernen

  • Bairey et al. (2019): Erste Vorschlag zum Lernen von Hamiltonoperatoren aus stationären Zuständen, aber ohne Worst-Case-Analyse
  • AAKS21: Etablierung strenger Stichprobenkomplexitäts-Obergrenzen, aber nicht optimal in mehreren Parametern
  • Klassischer Fall: Parameterlernen von Markov-Zufallsfeldern hat bereits nahezu optimale Algorithmen

Technische Verbindungen

  • Cluster-Expansion: Entlehnung der Hochtemperatur-Expansionstechnik aus der statistischen Mechanik
  • Newton-Methode: Anwendung klassischer Optimierungsmethoden in Quanteneinstellungen
  • Informationstheoretische untere Schranken: Verwendung des Fano-Lemmas zur Etablierung informationstheoretischer unterer Schranken

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Im Hochtemperaturbereich kann das Quantales Hamiltonoperator-Lernen die gleiche optimale Komplexität wie im klassischen Fall erreichen
  2. Der vorgeschlagene Algorithmus ist sowohl in Stichproben- als auch in Zeitkomplexität optimal
  3. Die Klasse der niedrig-wechselwirkenden Hamiltonoperatoren ist allgemeiner als geometrisch lokale, kann aber dennoch effizient gelernt werden

Einschränkungen

  1. Temperaturbeschränkung: Der Algorithmus funktioniert nur im Hochtemperaturbereich, die kritische Temperatur hängt vom Grad des dualen Graphen ab
  2. Gradabhängigkeit: Obwohl optimal für festen Grad, sinkt die kritische Temperatur schnell mit dem Grad
  3. Niedrigtemperaturbereich: Das Lernproblem im Niedrigtemperaturbereich bleibt offen

Zukünftige Richtungen

  1. Erweiterung des Temperaturbereichs: Suche nach Algorithmen, die in einem breiteren Temperaturbereich funktionieren
  2. Allgemeine lokale Hamiltonoperatoren: Erweiterung auf Fälle mit nicht-konstanten Graden
  3. Niedrigtemperatur-Algorithmen: Entwicklung effektiver Lernalgorithmen für den Niedrigtemperaturbereich
  4. Experimentelle Verifikation: Verifikation der Algorithmusleistung in realen Quantensystemen

Tiefgreifende Bewertung

Stärken

  1. Theoretische Vollständigkeit: Bereitstellung einer vollständigen Analyse von Obergrenzen und übereinstimmenden unteren Schranken
  2. Technische Innovation: Geschickte Kombination von Cluster-Expansion und Newton-Methode
  3. Optimalität: Gleichzeitige Erreichung der Optimalität in mehreren Parametern
  4. Allgemeinheit: Erweiterung auf breitere Hamiltonoperator-Klassen als frühere Arbeiten
  5. Algorithmus-Praktikabilität: Bereitstellung konkreter implementierbarer Algorithmen und Komplexitätsanalyse

Schwächen

  1. Anwendungsbereichsbeschränkung: Anwendbar nur im Hochtemperaturbereich
  2. Gradempfindlichkeit: Starke Abhängigkeit der kritischen Temperatur vom Grad
  3. Fehlende Experimente: Rein theoretische Arbeit ohne numerische Verifikation
  4. Nicht offensichtlicher Quantenvorteil: In der untersuchten Einstellung ist die Komplexität im Quantenfall gleich wie im klassischen Fall

Einfluss

  1. Theoretischer Beitrag: Etablierung von Benchmarks für das Quantale Hamiltonoperator-Lernen
  2. Methodologischer Wert: Demonstration der effektiven Anwendung klassischer Techniken in Quanteneinstellungen
  3. Nachfolgeforschung: Grundlegung für Forschung im Niedrigtemperaturbereich und allgemeineren Einstellungen
  4. Praktisches Potenzial: Bereitstellung theoretischer Anleitung für experimentelle Charakterisierung von Quantensystemen

Anwendungsszenarien

  1. Quantensimulation: Verifikation der Genauigkeit von Quantensimulatoren
  2. Materialwissenschaft: Lernen effektiver Hamiltonoperatoren von Kondensatmaterie-Systemen
  3. Quantencomputing: Kalibrierung und Verifikation von Quantenprozessoren
  4. Grundlagenforschung: Verständnis der Eigenschaften von Quantenmehrköpersystemen

Referenzen

  1. Anshu, A., Arunachalam, S., Kuwahara, T., & Soleimanifar, M. (2021). Sample-efficient learning of interacting quantum systems. Nature Physics.
  2. Kuwahara, T., Kato, K., & Brandão, F. G. (2020). Clustering of conditional mutual information for quantum Gibbs states above a threshold temperature. Physical Review Letters.
  3. Bresler, G. (2015). Efficiently learning Ising models on arbitrary graphs. STOC.
  4. Klivans, A., & Meka, R. (2017). Learning graphical models using multiplicative weights. FOCS.