2025-11-13T00:22:10.836390

Expectation value estimation with parametrized quantum circuits

Wu, Kong, Yan et al.

Estimating properties of quantum states, such as fidelities, molecular energies, and correlation functions, is a fundamental task in quantum information science. Due to the limitation of practical quantum devices, including limited circuit depth and connectivity, estimating even linear properties encounters high sample complexity. To address this inefficiency, we propose a framework that optimizes sample complexity for estimating the expectation value of any observable using a shallow parameterized quantum circuit. Within this framework, we introduce two decomposition algorithms, a tensor network approach and a greedy projection approach that decompose the target observable into a linear combination of multiple observables, each of which can be diagonalized with the shallow circuit. Using this decomposition, we then apply an importance sampling algorithm to estimate the expectation value of the target observable. We numerically demonstrate the performance of our algorithm by estimating the expectation values of some specific Hamiltonians and inner product of a Slater determinant with a pure state, highlighting advantages compared to some conventional methods. Additionally, we derive the fundamental lower bound for the sample complexity required to estimate a target observable using a given shallow quantum circuit, thereby enhancing our understanding of the capabilities of shallow circuits in quantum learning tasks.

academic

Erwartungswertschätzung mit parametrisierten Quantenschaltkreisen

Grundinformationen

Papier-ID: 2407.19499
Titel: Expectation value estimation with parametrized quantum circuits
Autoren: Bujiao Wu, Lingyu Kong, Yuxuan Yan, Fuchuan Wei, Zhenhuan Liu
Klassifizierung: quant-ph (Quantenphysik)
Veröffentlichungsdatum: Juli 2024 (arXiv-Preprint, v2-Version aktualisiert am 16. Oktober 2025)
Papierlink: https://arxiv.org/abs/2407.19499

Zusammenfassung

Die Schätzung von Quantenzustandseigenschaften (wie Wiedergabetreue, Molekülenergie und Korrelationsfunktionen) ist eine grundlegende Aufgabe in der Quanteninformationswissenschaft. Aufgrund von Einschränkungen praktischer Quantengeräte, einschließlich begrenzter Schaltkreistiefe und Konnektivität, treten auch bei der Schätzung linearer Eigenschaften Probleme mit hoher Stichprobenkomplexität auf. Um diese Ineffizienz zu beheben, wird in diesem Artikel ein Rahmen vorgeschlagen, der flache parametrisierte Quantenschaltkreise verwendet, um die Stichprobenkomplexität der Erwartungswertschätzung für beliebige Observable zu optimieren. Innerhalb dieses Rahmens werden zwei Zerlegungsalgorithmen eingeführt: die Tensornetzwerk-Methode und die Greedy-Projektions-Methode, die die Ziel-Observable in eine Linearkombination mehrerer Observabler zerlegen, von denen jede mit flachen Schaltkreisen diagonalisiert werden kann. Basierend auf dieser Zerlegung wird ein Wichtigkeitsstichproben-Algorithmus angewendet, um den Erwartungswert der Ziel-Observable zu schätzen.

Forschungshintergrund und Motivation

Problemdefinition

Die Schätzung linearer Quantenzustandseigenschaften Tr(ρH) ist eine Kernaufgabe der Quanteninformationswissenschaft, wobei ρ ein Quantenzustand und H eine Observable ist. Diese Problemklasse kommt weit verbreitet vor in:

Quantenchemie: Berechnung der Grundzustandsenergie von Molekülen
Vielkörperphysik: Messung von Korrelationsfunktionen
Quanteninformation: Bewertung der Zustandswiedergabetreue

Einschränkungen bestehender Methoden

Classical Shadow (Klassischer Schatten) Protokoll:
- Lokales CS-Protokoll hat Stichprobenkomplexität O(4^k) für k-lokale Observable
- Globales CS-Protokoll kann O(1)-Komplexität erreichen, benötigt aber logarithmische Tiefenschaltkreise
- Beide sind "messungsunabhängig" und nutzen Vorwissen über die Ziel-Observable nicht
Pauli-Zerlegungsmethode:
- Beschränkt auf Clifford-Schaltkreisimplementierung
- Zerlegung nur auf Pauli-Observable begrenzt
- Kann tiefe Schaltkreise oder hohe Stichprobenkomplexität erfordern

Forschungsmotivation

Bestehende Methoden sehen sich auf modernen Quantengeräten folgenden Herausforderungen gegenüber:

Begrenzte Schaltkreistiefe
Konnektivitätsbeschränkungen
Rauscheinfluss
Unzureichende Nutzung von Observable-Informationen

Kernbeiträge

Einheitlicher Rahmen: Vorschlag eines allgemeinen Rahmens zur Schätzung linearer Eigenschaften mit parametrisierten Quantenschaltkreisen, der bestehende Pauli-Zerlegungsprotokolle vereinheitlicht
Zwei Zerlegungsalgorithmen:
- Greedy-Projektions-Zerlegung (GPD): Anwendbar auf allgemeine Hamiltonoperatoren
- Tensornetzwerk-Zerlegung (TND): Anwendbar auf Hamiltonoperatoren mit kompakter Tensornetzwerk-Darstellung
Theoretische Untergrenzen: Ableitung fundamentaler Untergrenzen für die Stichprobenkomplexität, die zur Schätzung der Ziel-Observable mit gegebenen flachen Quantenschaltkreisen erforderlich ist
Numerische Verifikation: Validierung der Algorithmusvorteile bei dünn besetzten/dicht besetzten Hamiltonoperatoren und Slater-Determinanten-Innenprodukten

Methodische Details

Aufgabendefinition

Gegeben:

Unbekannter Quantenzustand ρ
Ziel-Observable H
L-Schichten-tiefe parametrisierte Quantenschaltkreis U_L(θ)
Genauigkeitsanforderung ε und Erfolgswahrscheinlichkeit 1-δ

Ziel: Schätzung von Tr(ρH) mit minimierter Stichprobenkomplexität

Gesamtrahmen

Der Rahmen besteht aus klassischen und quantenmechanischen Phasen:

Klassische Phase: Zerlegung der Ziel-Observable in $H \approx \sum_{k=1}^K U_L(\theta^{(k)})^\dagger \Lambda_k U_L(\theta^{(k)})$ wobei Λ_k reelle Diagonalmatrizen sind

Quantenphase: Schätzung des Erwartungswerts mit Wichtigkeitsstichproben

Stichprobenterm k mit Wahrscheinlichkeit p_k ∝ ||Λ_k||_2
Ausführung von U_L(θ^{(k)}) und Messung auf Rechenbasis
Anwendung der Median-Mittelwert-Methode zur Erlangung der endgültigen Schätzung

Greedy-Projektions-Zerlegungsalgorithmus (GPD)

Kernidee: Iterative Suche nach dem besten Näherungsterm U_L(θ)†ΛU_L(θ)

Algorithmusablauf:

Initialisierung H^{(0)} = H, k = 0
Solange ||H^{(k)}||_2 ≥ ε:
- Lösen des Optimierungsproblems: θ^{(k)} = argmin_θ ||U_L(θ)H^{(k)}U_L†(θ) - diagU_L(θ)H^{(k)}U_L†(θ)||_F
- Setzen von Λ_k = diagU_L(θ^{(k)})H^{(k)}U_L†(θ^{(k)})
- Aktualisierung H^{(k+1)} = H^{(k)} - U_L†(θ^{(k)})Λ_k U_L(θ^{(k)})
- k = k + 1

Komplexitätsanalyse: Klassische Verarbeitungszeit ist O(poly(n)·2^{ωn}), wobei ω ≈ 2,37 der Matrizenmultiplikationsexponent ist

Tensornetzwerk-Zerlegungsalgorithmus (TND)

Anwendungsbereich: Ziel-Hamiltonoperator hat effiziente Matrix-Produkt-Operator (MPO)-Darstellung

Optimierungsziel: Minimierung der Verlustfunktion $L = ||H - \sum_k U_L(\theta_k)^\dagger \Lambda_k U_L(\theta_k)||_F^2$

Schlüsseltechniken:

Darstellung von U_L(θ_k) als unitäres Tensornetzwerk der Tiefe L
Darstellung von Λ_k in MPO-Form
Verwendung von Tensornetzwerk-Kontraktion zur Berechnung der Verlustfunktion
Gradientenabstieg zur Optimierung der Parameter {θ^{(k)}, Λ_k}

Stichprobenkomplexitätsanalyse

Obergrenze: Algorithmus 1 benötigt T = O(||Λ||_1^2 log(1/δ)/ε_2^2) Stichproben, wobei ||Λ||_1 die Summe aller ||Λ_k||_2 ist

Untergrenze: Jede adaptive Strategie mit einzelner Kopie unter Verwendung parametrisierter Schaltkreise U_L(θ) benötigt $T = Ω\left(\frac{\text{Tr}(H_0^2)^2}{\varepsilon^2 \delta(H_0) 4^n}\right)$ wobei H_0 der spurlose Teil von H ist und δ(H_0) das Quadrat des maximalen Erwartungswerts von H_0 auf der Menge erreichbarer Zustände ist

Experimentelle Einrichtung

Experimentelle Szenarien

Grundzustandsenergieschätzung für dünn besetzte Hamiltonoperatoren: 8-Qubit-System mit 64 Nicht-Null-Elementen
Erwartungswertschätzung für dicht besetzte Hamiltonoperatoren: 4-Qubit-zufällige hermitesche Matrix
Slater-Determinanten-Innenprodukschätzung: 3-Qubit-System, τ-Slater-Determinante und Innenproduktwert mit reinem Zustand

Vergleichsmethoden

Classical Shadow Protokoll: Globales CS und lokales CS
Pauli-Zerlegungsmethode: Derandomized, C-LBCS, SG, Adaptive, OGM usw.
Spezialisierte Methoden: Fermionischer klassischer Schatten (FCS)

Implementierungsdetails

Parametrisierte Gatter: iSWAP-Gatter + Tensorprodukt von zwei beliebigen Einzel-Qubit-Gattern
GPD-Algorithmus: L=4 Schichten, K=20 oder 80 Zerlegungsterme
TND-Algorithmus: L=1 Schicht, K=3 Zerlegungsterme

Experimentelle Ergebnisse

Hauptergebnisse

Dünn besetzte Hamiltonoperatoren (8 Qubits):

Bei 25.848 Stichproben beträgt der GPD-Fehler 0,030, deutlich besser als die beste Vergleichsmethode OGM mit 0,097
Mit zunehmender Stichprobenzahl behält GPD konsistent den niedrigsten Fehler bei

Dicht besetzte Hamiltonoperatoren (4 Qubits):

Bei 25.848 Stichproben beträgt der GPD-Fehler 0,046, besser als die beste Vergleichsmethode OGM mit 0,053
Der Vorteil ist bei weniger Stichproben deutlicher

Slater-Determinanten-Innenproduktwert (3 Qubits):

GPD erreicht bei allen Stichprobenzahlen den niedrigsten Fehler
Fehler von 0,009 bei 25.848 Stichproben, beste Vergleichsmethode 0,012

Konvergenzanalyse

Numerische Ergebnisse zeigen:

Bei fester Anzahl von Zerlegungstermen K nimmt die Frobenius-Distanz mit zunehmender Schaltkreistiefe L ab
Bei fester Schaltkreistiefe nimmt die Frobenius-Distanz exponentiell mit der Anzahl der Zerlegungsterme K ab

Tensornetzwerk-Methodenleistung

Für Hamiltonoperatoren mit niedriger Bindungsdimension:

TND-Methode verwendet nur 3 Zerlegungsterme und 1 Schicht Schaltkreistiefe
Fehler von 0,050 bei 18.000 Schritten, besser als traditionelle Methoden

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Der vorgeschlagene Rahmen vereinheitlicht erfolgreich bestehende Messprotokolle und erweitert sie auf allgemeine parametrisierte Schaltkreise
GPD- und TND-Algorithmen übertreffen bestehende Methoden in verschiedenen Szenarien erheblich
Die etablierte theoretische Untergrenze offenbart fundamentale Einschränkungen flacher Quantenschaltkreise bei Quantenlernaufgaben

Einschränkungen

GPD-Algorithmus:
- Klassische Optimierungskomplexität bleibt relativ hoch
- Greedy-Strategie garantiert keine globale Optimalität
- Theoretische Analyse der Zerlegungstermanzahl K ist schwierig
TND-Algorithmus:
- Nur anwendbar auf Hamiltonoperatoren mit effizienter MPO-Darstellung
- Benötigt zusätzliche Tensornetzwerk-Optimierungstechniken
Theoretische Untergrenze:
- Möglicherweise nicht ausreichend eng für niederrangige Observable (wie Wiedergabetreue)
- Abhängig von genauen Schätzungen des Schaltkreisfähigkeitsparameters δ(H_0)

Zukünftige Richtungen

Algorithmusoptimierung:
- Entwicklung effizienterer Zerlegungsalgorithmen basierend auf maschinellem Lernen
- Erforschung nicht-greediger globaler Optimierungsstrategien
Theoretische Verbesserung:
- Etablierung engerer Stichprobenkomplexitäts-Untergrenzen
- Analyse der Beziehung zwischen Zerlegungstermanzahl K und Schaltkreisfähigkeit
Anwendungserweiterung:
- Erweiterung auf nichtlineare Eigenschaftsschätzung
- Protokolldesign unter Kombination mit Quantenspeicher
- Reduzierung der Anzahl von Hardwarekonfigurationswechseln

Tiefgehende Bewertung

Stärken

Theoretische Beiträge:
- Bereitstellung eines einheitlichen Rahmens, der mehrere bestehende Methoden integriert
- Etablierung wichtiger theoretischer Untergrenzen, die das Verständnis der Fähigkeiten flacher Schaltkreise verbessert
Methodische Innovation:
- GPD-Algorithmus ist auf allgemeine Hamiltonoperatoren anwendbar mit starker Praktikabilität
- TND-Algorithmus ist für spezifische Strukturen optimiert mit hoher Effizienz
- Vollständige Nutzung von Observable-Vorwissen
Umfangreiche Experimente:
- Abdeckung mehrerer Anwendungsszenarien (dünn/dicht besetzte Hamiltonoperatoren, Innenprodukschätzung)
- Vergleich mit mehreren Mainstream-Methoden, überzeugende Ergebnisse
- Bereitstellung von Konvergenz- und Durchschnittsleistungsanalyse

Mängel

Skalierungsprobleme:
- Klassische Optimierungskomplexität von GPD wächst exponentiell mit der Qubit-Anzahl
- Praktikabilität für große Systeme bleibt zu überprüfen
Experimentelle Einschränkungen:
- Numerische Experimentskala ist relativ klein (maximal 8 Qubits)
- Fehlende Validierung auf tatsächlichen Quantengeräten
- Rauscheinfluss auf Algorithmusleistung nicht berücksichtigt
Theoretische Lücke:
- Erhebliche Lücke zwischen Ober- und Untergrenze
- Konvergenzgeschwindigkeit der Zerlegungstermanzahl K mangelt es an strikter theoretischer Garantie

Einflussfähigkeit

Akademischer Wert:
- Bereitstellung eines neuen theoretischen Rahmens für Quantenzustandslernen
- Förderung des Verständnisses der Fähigkeiten flacher Quantenschaltkreise
- Bereitstellung praktischer Werkzeuge für NISQ-Anwendungen
Praktischer Wert:
- Algorithmisches Designkonzept geeignet für NISQ-Geräte
- Potenzielle Anwendungen in Quantenchemie und Vielkörperphysik
- Bereitstellung von Benchmark-Werkzeugen zur Quantenvorteilsverifikation

Anwendungsszenarien

Quantenchemie: Berechnung von Molekülgrundzustandsenergie und Eigenschaften
Quantensimulation: Messung von Korrelationsfunktionen in Vielkörpersystemen
Quantenmaschinelles Lernen: Feature-Mapping und Kernel-Methoden
Quantenoptimierung: Schätzung von Erwartungswerten der Zielfunktion
Quantenfehlerkorrektur: Bewertung der Codeword-Wiedergabetreue und Fehlerkorrekturleistung

Literaturverzeichnis

Das Papier zitiert 66 verwandte Referenzen, die wichtige Arbeiten in Kernbereichen wie Quantenzustandslernen, zufällige Messungen, klassische Schatten und Pauli-Zerlegung abdecken und eine solide theoretische Grundlage für die Forschung bieten.