Estimating properties of quantum states, such as fidelities, molecular energies, and correlation functions, is a fundamental task in quantum information science. Due to the limitation of practical quantum devices, including limited circuit depth and connectivity, estimating even linear properties encounters high sample complexity. To address this inefficiency, we propose a framework that optimizes sample complexity for estimating the expectation value of any observable using a shallow parameterized quantum circuit. Within this framework, we introduce two decomposition algorithms, a tensor network approach and a greedy projection approach that decompose the target observable into a linear combination of multiple observables, each of which can be diagonalized with the shallow circuit. Using this decomposition, we then apply an importance sampling algorithm to estimate the expectation value of the target observable. We numerically demonstrate the performance of our algorithm by estimating the expectation values of some specific Hamiltonians and inner product of a Slater determinant with a pure state, highlighting advantages compared to some conventional methods. Additionally, we derive the fundamental lower bound for the sample complexity required to estimate a target observable using a given shallow quantum circuit, thereby enhancing our understanding of the capabilities of shallow circuits in quantum learning tasks.
- Papier-ID: 2407.19499
- Titel: Expectation value estimation with parametrized quantum circuits
- Autoren: Bujiao Wu, Lingyu Kong, Yuxuan Yan, Fuchuan Wei, Zhenhuan Liu
- Klassifizierung: quant-ph (Quantenphysik)
- Veröffentlichungsdatum: Juli 2024 (arXiv-Preprint, v2-Version aktualisiert am 16. Oktober 2025)
- Papierlink: https://arxiv.org/abs/2407.19499
Die Schätzung von Quantenzustandseigenschaften (wie Wiedergabetreue, Molekülenergie und Korrelationsfunktionen) ist eine grundlegende Aufgabe in der Quanteninformationswissenschaft. Aufgrund von Einschränkungen praktischer Quantengeräte, einschließlich begrenzter Schaltkreistiefe und Konnektivität, treten auch bei der Schätzung linearer Eigenschaften Probleme mit hoher Stichprobenkomplexität auf. Um diese Ineffizienz zu beheben, wird in diesem Artikel ein Rahmen vorgeschlagen, der flache parametrisierte Quantenschaltkreise verwendet, um die Stichprobenkomplexität der Erwartungswertschätzung für beliebige Observable zu optimieren. Innerhalb dieses Rahmens werden zwei Zerlegungsalgorithmen eingeführt: die Tensornetzwerk-Methode und die Greedy-Projektions-Methode, die die Ziel-Observable in eine Linearkombination mehrerer Observabler zerlegen, von denen jede mit flachen Schaltkreisen diagonalisiert werden kann. Basierend auf dieser Zerlegung wird ein Wichtigkeitsstichproben-Algorithmus angewendet, um den Erwartungswert der Ziel-Observable zu schätzen.
Die Schätzung linearer Quantenzustandseigenschaften Tr(ρH) ist eine Kernaufgabe der Quanteninformationswissenschaft, wobei ρ ein Quantenzustand und H eine Observable ist. Diese Problemklasse kommt weit verbreitet vor in:
- Quantenchemie: Berechnung der Grundzustandsenergie von Molekülen
- Vielkörperphysik: Messung von Korrelationsfunktionen
- Quanteninformation: Bewertung der Zustandswiedergabetreue
- Classical Shadow (Klassischer Schatten) Protokoll:
- Lokales CS-Protokoll hat Stichprobenkomplexität O(4^k) für k-lokale Observable
- Globales CS-Protokoll kann O(1)-Komplexität erreichen, benötigt aber logarithmische Tiefenschaltkreise
- Beide sind "messungsunabhängig" und nutzen Vorwissen über die Ziel-Observable nicht
- Pauli-Zerlegungsmethode:
- Beschränkt auf Clifford-Schaltkreisimplementierung
- Zerlegung nur auf Pauli-Observable begrenzt
- Kann tiefe Schaltkreise oder hohe Stichprobenkomplexität erfordern
Bestehende Methoden sehen sich auf modernen Quantengeräten folgenden Herausforderungen gegenüber:
- Begrenzte Schaltkreistiefe
- Konnektivitätsbeschränkungen
- Rauscheinfluss
- Unzureichende Nutzung von Observable-Informationen
- Einheitlicher Rahmen: Vorschlag eines allgemeinen Rahmens zur Schätzung linearer Eigenschaften mit parametrisierten Quantenschaltkreisen, der bestehende Pauli-Zerlegungsprotokolle vereinheitlicht
- Zwei Zerlegungsalgorithmen:
- Greedy-Projektions-Zerlegung (GPD): Anwendbar auf allgemeine Hamiltonoperatoren
- Tensornetzwerk-Zerlegung (TND): Anwendbar auf Hamiltonoperatoren mit kompakter Tensornetzwerk-Darstellung
- Theoretische Untergrenzen: Ableitung fundamentaler Untergrenzen für die Stichprobenkomplexität, die zur Schätzung der Ziel-Observable mit gegebenen flachen Quantenschaltkreisen erforderlich ist
- Numerische Verifikation: Validierung der Algorithmusvorteile bei dünn besetzten/dicht besetzten Hamiltonoperatoren und Slater-Determinanten-Innenprodukten
Gegeben:
- Unbekannter Quantenzustand ρ
- Ziel-Observable H
- L-Schichten-tiefe parametrisierte Quantenschaltkreis U_L(θ)
- Genauigkeitsanforderung ε und Erfolgswahrscheinlichkeit 1-δ
Ziel: Schätzung von Tr(ρH) mit minimierter Stichprobenkomplexität
Der Rahmen besteht aus klassischen und quantenmechanischen Phasen:
Klassische Phase: Zerlegung der Ziel-Observable in
H≈∑k=1KUL(θ(k))†ΛkUL(θ(k))
wobei Λ_k reelle Diagonalmatrizen sind
Quantenphase: Schätzung des Erwartungswerts mit Wichtigkeitsstichproben
- Stichprobenterm k mit Wahrscheinlichkeit p_k ∝ ||Λ_k||_2
- Ausführung von U_L(θ^{(k)}) und Messung auf Rechenbasis
- Anwendung der Median-Mittelwert-Methode zur Erlangung der endgültigen Schätzung
Kernidee: Iterative Suche nach dem besten Näherungsterm U_L(θ)†ΛU_L(θ)
Algorithmusablauf:
- Initialisierung H^{(0)} = H, k = 0
- Solange ||H^{(k)}||_2 ≥ ε:
- Lösen des Optimierungsproblems: θ^{(k)} = argmin_θ ||U_L(θ)H^{(k)}U_L†(θ) - diagU_L(θ)H^{(k)}U_L†(θ)||_F
- Setzen von Λ_k = diagU_L(θ^{(k)})H^{(k)}U_L†(θ^{(k)})
- Aktualisierung H^{(k+1)} = H^{(k)} - U_L†(θ^{(k)})Λ_k U_L(θ^{(k)})
- k = k + 1
Komplexitätsanalyse: Klassische Verarbeitungszeit ist O(poly(n)·2^{ωn}), wobei ω ≈ 2,37 der Matrizenmultiplikationsexponent ist
Anwendungsbereich: Ziel-Hamiltonoperator hat effiziente Matrix-Produkt-Operator (MPO)-Darstellung
Optimierungsziel: Minimierung der Verlustfunktion
L=∣∣H−∑kUL(θk)†ΛkUL(θk)∣∣F2
Schlüsseltechniken:
- Darstellung von U_L(θ_k) als unitäres Tensornetzwerk der Tiefe L
- Darstellung von Λ_k in MPO-Form
- Verwendung von Tensornetzwerk-Kontraktion zur Berechnung der Verlustfunktion
- Gradientenabstieg zur Optimierung der Parameter {θ^{(k)}, Λ_k}
Obergrenze: Algorithmus 1 benötigt T = O(||Λ||_1^2 log(1/δ)/ε_2^2) Stichproben, wobei ||Λ||_1 die Summe aller ||Λ_k||_2 ist
Untergrenze: Jede adaptive Strategie mit einzelner Kopie unter Verwendung parametrisierter Schaltkreise U_L(θ) benötigt
T=Ω(ε2δ(H0)4nTr(H02)2)
wobei H_0 der spurlose Teil von H ist und δ(H_0) das Quadrat des maximalen Erwartungswerts von H_0 auf der Menge erreichbarer Zustände ist
- Grundzustandsenergieschätzung für dünn besetzte Hamiltonoperatoren: 8-Qubit-System mit 64 Nicht-Null-Elementen
- Erwartungswertschätzung für dicht besetzte Hamiltonoperatoren: 4-Qubit-zufällige hermitesche Matrix
- Slater-Determinanten-Innenprodukschätzung: 3-Qubit-System, τ-Slater-Determinante und Innenproduktwert mit reinem Zustand
- Classical Shadow Protokoll: Globales CS und lokales CS
- Pauli-Zerlegungsmethode: Derandomized, C-LBCS, SG, Adaptive, OGM usw.
- Spezialisierte Methoden: Fermionischer klassischer Schatten (FCS)
- Parametrisierte Gatter: iSWAP-Gatter + Tensorprodukt von zwei beliebigen Einzel-Qubit-Gattern
- GPD-Algorithmus: L=4 Schichten, K=20 oder 80 Zerlegungsterme
- TND-Algorithmus: L=1 Schicht, K=3 Zerlegungsterme
Dünn besetzte Hamiltonoperatoren (8 Qubits):
- Bei 25.848 Stichproben beträgt der GPD-Fehler 0,030, deutlich besser als die beste Vergleichsmethode OGM mit 0,097
- Mit zunehmender Stichprobenzahl behält GPD konsistent den niedrigsten Fehler bei
Dicht besetzte Hamiltonoperatoren (4 Qubits):
- Bei 25.848 Stichproben beträgt der GPD-Fehler 0,046, besser als die beste Vergleichsmethode OGM mit 0,053
- Der Vorteil ist bei weniger Stichproben deutlicher
Slater-Determinanten-Innenproduktwert (3 Qubits):
- GPD erreicht bei allen Stichprobenzahlen den niedrigsten Fehler
- Fehler von 0,009 bei 25.848 Stichproben, beste Vergleichsmethode 0,012
Numerische Ergebnisse zeigen:
- Bei fester Anzahl von Zerlegungstermen K nimmt die Frobenius-Distanz mit zunehmender Schaltkreistiefe L ab
- Bei fester Schaltkreistiefe nimmt die Frobenius-Distanz exponentiell mit der Anzahl der Zerlegungsterme K ab
Für Hamiltonoperatoren mit niedriger Bindungsdimension:
- TND-Methode verwendet nur 3 Zerlegungsterme und 1 Schicht Schaltkreistiefe
- Fehler von 0,050 bei 18.000 Schritten, besser als traditionelle Methoden
- Quantentomographie: Vollständige Rekonstruktion des Quantenzustands, exponentielle Komplexität
- Schatten-Tomographie: Bereitstellung einer klassischen Beschreibung des Zustands, Unterstützung für mehrere Eigenschaftsschätzungen
- Lokale Messungen: Einzel-Qubit-Clifford-Gruppe, geeignet für lokale Observable
- Globale Messungen: Globale Clifford-Gruppe, benötigt tiefe Schaltkreise
- Flache Schaltkreise: Kompromisslösung, nutzt aber Observable-Informationen immer noch nicht vollständig
- Basierend auf Pauli-Expansion der Observable
- Implementierung durch Clifford-Schaltkreise und Rechenbasis-Messungen
- Dieser Rahmen vereinheitlicht diese Methoden
- Der vorgeschlagene Rahmen vereinheitlicht erfolgreich bestehende Messprotokolle und erweitert sie auf allgemeine parametrisierte Schaltkreise
- GPD- und TND-Algorithmen übertreffen bestehende Methoden in verschiedenen Szenarien erheblich
- Die etablierte theoretische Untergrenze offenbart fundamentale Einschränkungen flacher Quantenschaltkreise bei Quantenlernaufgaben
- GPD-Algorithmus:
- Klassische Optimierungskomplexität bleibt relativ hoch
- Greedy-Strategie garantiert keine globale Optimalität
- Theoretische Analyse der Zerlegungstermanzahl K ist schwierig
- TND-Algorithmus:
- Nur anwendbar auf Hamiltonoperatoren mit effizienter MPO-Darstellung
- Benötigt zusätzliche Tensornetzwerk-Optimierungstechniken
- Theoretische Untergrenze:
- Möglicherweise nicht ausreichend eng für niederrangige Observable (wie Wiedergabetreue)
- Abhängig von genauen Schätzungen des Schaltkreisfähigkeitsparameters δ(H_0)
- Algorithmusoptimierung:
- Entwicklung effizienterer Zerlegungsalgorithmen basierend auf maschinellem Lernen
- Erforschung nicht-greediger globaler Optimierungsstrategien
- Theoretische Verbesserung:
- Etablierung engerer Stichprobenkomplexitäts-Untergrenzen
- Analyse der Beziehung zwischen Zerlegungstermanzahl K und Schaltkreisfähigkeit
- Anwendungserweiterung:
- Erweiterung auf nichtlineare Eigenschaftsschätzung
- Protokolldesign unter Kombination mit Quantenspeicher
- Reduzierung der Anzahl von Hardwarekonfigurationswechseln
- Theoretische Beiträge:
- Bereitstellung eines einheitlichen Rahmens, der mehrere bestehende Methoden integriert
- Etablierung wichtiger theoretischer Untergrenzen, die das Verständnis der Fähigkeiten flacher Schaltkreise verbessert
- Methodische Innovation:
- GPD-Algorithmus ist auf allgemeine Hamiltonoperatoren anwendbar mit starker Praktikabilität
- TND-Algorithmus ist für spezifische Strukturen optimiert mit hoher Effizienz
- Vollständige Nutzung von Observable-Vorwissen
- Umfangreiche Experimente:
- Abdeckung mehrerer Anwendungsszenarien (dünn/dicht besetzte Hamiltonoperatoren, Innenprodukschätzung)
- Vergleich mit mehreren Mainstream-Methoden, überzeugende Ergebnisse
- Bereitstellung von Konvergenz- und Durchschnittsleistungsanalyse
- Skalierungsprobleme:
- Klassische Optimierungskomplexität von GPD wächst exponentiell mit der Qubit-Anzahl
- Praktikabilität für große Systeme bleibt zu überprüfen
- Experimentelle Einschränkungen:
- Numerische Experimentskala ist relativ klein (maximal 8 Qubits)
- Fehlende Validierung auf tatsächlichen Quantengeräten
- Rauscheinfluss auf Algorithmusleistung nicht berücksichtigt
- Theoretische Lücke:
- Erhebliche Lücke zwischen Ober- und Untergrenze
- Konvergenzgeschwindigkeit der Zerlegungstermanzahl K mangelt es an strikter theoretischer Garantie
- Akademischer Wert:
- Bereitstellung eines neuen theoretischen Rahmens für Quantenzustandslernen
- Förderung des Verständnisses der Fähigkeiten flacher Quantenschaltkreise
- Bereitstellung praktischer Werkzeuge für NISQ-Anwendungen
- Praktischer Wert:
- Algorithmisches Designkonzept geeignet für NISQ-Geräte
- Potenzielle Anwendungen in Quantenchemie und Vielkörperphysik
- Bereitstellung von Benchmark-Werkzeugen zur Quantenvorteilsverifikation
- Quantenchemie: Berechnung von Molekülgrundzustandsenergie und Eigenschaften
- Quantensimulation: Messung von Korrelationsfunktionen in Vielkörpersystemen
- Quantenmaschinelles Lernen: Feature-Mapping und Kernel-Methoden
- Quantenoptimierung: Schätzung von Erwartungswerten der Zielfunktion
- Quantenfehlerkorrektur: Bewertung der Codeword-Wiedergabetreue und Fehlerkorrekturleistung
Das Papier zitiert 66 verwandte Referenzen, die wichtige Arbeiten in Kernbereichen wie Quantenzustandslernen, zufällige Messungen, klassische Schatten und Pauli-Zerlegung abdecken und eine solide theoretische Grundlage für die Forschung bieten.