2025-11-13T00:22:10.836390

Expectation value estimation with parametrized quantum circuits

Wu, Kong, Yan et al.
Estimating properties of quantum states, such as fidelities, molecular energies, and correlation functions, is a fundamental task in quantum information science. Due to the limitation of practical quantum devices, including limited circuit depth and connectivity, estimating even linear properties encounters high sample complexity. To address this inefficiency, we propose a framework that optimizes sample complexity for estimating the expectation value of any observable using a shallow parameterized quantum circuit. Within this framework, we introduce two decomposition algorithms, a tensor network approach and a greedy projection approach that decompose the target observable into a linear combination of multiple observables, each of which can be diagonalized with the shallow circuit. Using this decomposition, we then apply an importance sampling algorithm to estimate the expectation value of the target observable. We numerically demonstrate the performance of our algorithm by estimating the expectation values of some specific Hamiltonians and inner product of a Slater determinant with a pure state, highlighting advantages compared to some conventional methods. Additionally, we derive the fundamental lower bound for the sample complexity required to estimate a target observable using a given shallow quantum circuit, thereby enhancing our understanding of the capabilities of shallow circuits in quantum learning tasks.
academic

Erwartungswertschätzung mit parametrisierten Quantenschaltkreisen

Grundinformationen

  • Papier-ID: 2407.19499
  • Titel: Expectation value estimation with parametrized quantum circuits
  • Autoren: Bujiao Wu, Lingyu Kong, Yuxuan Yan, Fuchuan Wei, Zhenhuan Liu
  • Klassifizierung: quant-ph (Quantenphysik)
  • Veröffentlichungsdatum: Juli 2024 (arXiv-Preprint, v2-Version aktualisiert am 16. Oktober 2025)
  • Papierlink: https://arxiv.org/abs/2407.19499

Zusammenfassung

Die Schätzung von Quantenzustandseigenschaften (wie Wiedergabetreue, Molekülenergie und Korrelationsfunktionen) ist eine grundlegende Aufgabe in der Quanteninformationswissenschaft. Aufgrund von Einschränkungen praktischer Quantengeräte, einschließlich begrenzter Schaltkreistiefe und Konnektivität, treten auch bei der Schätzung linearer Eigenschaften Probleme mit hoher Stichprobenkomplexität auf. Um diese Ineffizienz zu beheben, wird in diesem Artikel ein Rahmen vorgeschlagen, der flache parametrisierte Quantenschaltkreise verwendet, um die Stichprobenkomplexität der Erwartungswertschätzung für beliebige Observable zu optimieren. Innerhalb dieses Rahmens werden zwei Zerlegungsalgorithmen eingeführt: die Tensornetzwerk-Methode und die Greedy-Projektions-Methode, die die Ziel-Observable in eine Linearkombination mehrerer Observabler zerlegen, von denen jede mit flachen Schaltkreisen diagonalisiert werden kann. Basierend auf dieser Zerlegung wird ein Wichtigkeitsstichproben-Algorithmus angewendet, um den Erwartungswert der Ziel-Observable zu schätzen.

Forschungshintergrund und Motivation

Problemdefinition

Die Schätzung linearer Quantenzustandseigenschaften Tr(ρH) ist eine Kernaufgabe der Quanteninformationswissenschaft, wobei ρ ein Quantenzustand und H eine Observable ist. Diese Problemklasse kommt weit verbreitet vor in:

  1. Quantenchemie: Berechnung der Grundzustandsenergie von Molekülen
  2. Vielkörperphysik: Messung von Korrelationsfunktionen
  3. Quanteninformation: Bewertung der Zustandswiedergabetreue

Einschränkungen bestehender Methoden

  1. Classical Shadow (Klassischer Schatten) Protokoll:
    • Lokales CS-Protokoll hat Stichprobenkomplexität O(4^k) für k-lokale Observable
    • Globales CS-Protokoll kann O(1)-Komplexität erreichen, benötigt aber logarithmische Tiefenschaltkreise
    • Beide sind "messungsunabhängig" und nutzen Vorwissen über die Ziel-Observable nicht
  2. Pauli-Zerlegungsmethode:
    • Beschränkt auf Clifford-Schaltkreisimplementierung
    • Zerlegung nur auf Pauli-Observable begrenzt
    • Kann tiefe Schaltkreise oder hohe Stichprobenkomplexität erfordern

Forschungsmotivation

Bestehende Methoden sehen sich auf modernen Quantengeräten folgenden Herausforderungen gegenüber:

  • Begrenzte Schaltkreistiefe
  • Konnektivitätsbeschränkungen
  • Rauscheinfluss
  • Unzureichende Nutzung von Observable-Informationen

Kernbeiträge

  1. Einheitlicher Rahmen: Vorschlag eines allgemeinen Rahmens zur Schätzung linearer Eigenschaften mit parametrisierten Quantenschaltkreisen, der bestehende Pauli-Zerlegungsprotokolle vereinheitlicht
  2. Zwei Zerlegungsalgorithmen:
    • Greedy-Projektions-Zerlegung (GPD): Anwendbar auf allgemeine Hamiltonoperatoren
    • Tensornetzwerk-Zerlegung (TND): Anwendbar auf Hamiltonoperatoren mit kompakter Tensornetzwerk-Darstellung
  3. Theoretische Untergrenzen: Ableitung fundamentaler Untergrenzen für die Stichprobenkomplexität, die zur Schätzung der Ziel-Observable mit gegebenen flachen Quantenschaltkreisen erforderlich ist
  4. Numerische Verifikation: Validierung der Algorithmusvorteile bei dünn besetzten/dicht besetzten Hamiltonoperatoren und Slater-Determinanten-Innenprodukten

Methodische Details

Aufgabendefinition

Gegeben:

  • Unbekannter Quantenzustand ρ
  • Ziel-Observable H
  • L-Schichten-tiefe parametrisierte Quantenschaltkreis U_L(θ)
  • Genauigkeitsanforderung ε und Erfolgswahrscheinlichkeit 1-δ

Ziel: Schätzung von Tr(ρH) mit minimierter Stichprobenkomplexität

Gesamtrahmen

Der Rahmen besteht aus klassischen und quantenmechanischen Phasen:

Klassische Phase: Zerlegung der Ziel-Observable in Hk=1KUL(θ(k))ΛkUL(θ(k))H \approx \sum_{k=1}^K U_L(\theta^{(k)})^\dagger \Lambda_k U_L(\theta^{(k)}) wobei Λ_k reelle Diagonalmatrizen sind

Quantenphase: Schätzung des Erwartungswerts mit Wichtigkeitsstichproben

  • Stichprobenterm k mit Wahrscheinlichkeit p_k ∝ ||Λ_k||_2
  • Ausführung von U_L(θ^{(k)}) und Messung auf Rechenbasis
  • Anwendung der Median-Mittelwert-Methode zur Erlangung der endgültigen Schätzung

Greedy-Projektions-Zerlegungsalgorithmus (GPD)

Kernidee: Iterative Suche nach dem besten Näherungsterm U_L(θ)†ΛU_L(θ)

Algorithmusablauf:

  1. Initialisierung H^{(0)} = H, k = 0
  2. Solange ||H^{(k)}||_2 ≥ ε:
    • Lösen des Optimierungsproblems: θ^{(k)} = argmin_θ ||U_L(θ)H^{(k)}U_L†(θ) - diagU_L(θ)H^{(k)}U_L†(θ)||_F
    • Setzen von Λ_k = diagU_L(θ^{(k)})H^{(k)}U_L†(θ^{(k)})
    • Aktualisierung H^{(k+1)} = H^{(k)} - U_L†(θ^{(k)})Λ_k U_L(θ^{(k)})
    • k = k + 1

Komplexitätsanalyse: Klassische Verarbeitungszeit ist O(poly(n)·2^{ωn}), wobei ω ≈ 2,37 der Matrizenmultiplikationsexponent ist

Tensornetzwerk-Zerlegungsalgorithmus (TND)

Anwendungsbereich: Ziel-Hamiltonoperator hat effiziente Matrix-Produkt-Operator (MPO)-Darstellung

Optimierungsziel: Minimierung der Verlustfunktion L=HkUL(θk)ΛkUL(θk)F2L = ||H - \sum_k U_L(\theta_k)^\dagger \Lambda_k U_L(\theta_k)||_F^2

Schlüsseltechniken:

  • Darstellung von U_L(θ_k) als unitäres Tensornetzwerk der Tiefe L
  • Darstellung von Λ_k in MPO-Form
  • Verwendung von Tensornetzwerk-Kontraktion zur Berechnung der Verlustfunktion
  • Gradientenabstieg zur Optimierung der Parameter {θ^{(k)}, Λ_k}

Stichprobenkomplexitätsanalyse

Obergrenze: Algorithmus 1 benötigt T = O(||Λ||_1^2 log(1/δ)/ε_2^2) Stichproben, wobei ||Λ||_1 die Summe aller ||Λ_k||_2 ist

Untergrenze: Jede adaptive Strategie mit einzelner Kopie unter Verwendung parametrisierter Schaltkreise U_L(θ) benötigt T=Ω(Tr(H02)2ε2δ(H0)4n)T = Ω\left(\frac{\text{Tr}(H_0^2)^2}{\varepsilon^2 \delta(H_0) 4^n}\right) wobei H_0 der spurlose Teil von H ist und δ(H_0) das Quadrat des maximalen Erwartungswerts von H_0 auf der Menge erreichbarer Zustände ist

Experimentelle Einrichtung

Experimentelle Szenarien

  1. Grundzustandsenergieschätzung für dünn besetzte Hamiltonoperatoren: 8-Qubit-System mit 64 Nicht-Null-Elementen
  2. Erwartungswertschätzung für dicht besetzte Hamiltonoperatoren: 4-Qubit-zufällige hermitesche Matrix
  3. Slater-Determinanten-Innenprodukschätzung: 3-Qubit-System, τ-Slater-Determinante und Innenproduktwert mit reinem Zustand

Vergleichsmethoden

  • Classical Shadow Protokoll: Globales CS und lokales CS
  • Pauli-Zerlegungsmethode: Derandomized, C-LBCS, SG, Adaptive, OGM usw.
  • Spezialisierte Methoden: Fermionischer klassischer Schatten (FCS)

Implementierungsdetails

  • Parametrisierte Gatter: iSWAP-Gatter + Tensorprodukt von zwei beliebigen Einzel-Qubit-Gattern
  • GPD-Algorithmus: L=4 Schichten, K=20 oder 80 Zerlegungsterme
  • TND-Algorithmus: L=1 Schicht, K=3 Zerlegungsterme

Experimentelle Ergebnisse

Hauptergebnisse

Dünn besetzte Hamiltonoperatoren (8 Qubits):

  • Bei 25.848 Stichproben beträgt der GPD-Fehler 0,030, deutlich besser als die beste Vergleichsmethode OGM mit 0,097
  • Mit zunehmender Stichprobenzahl behält GPD konsistent den niedrigsten Fehler bei

Dicht besetzte Hamiltonoperatoren (4 Qubits):

  • Bei 25.848 Stichproben beträgt der GPD-Fehler 0,046, besser als die beste Vergleichsmethode OGM mit 0,053
  • Der Vorteil ist bei weniger Stichproben deutlicher

Slater-Determinanten-Innenproduktwert (3 Qubits):

  • GPD erreicht bei allen Stichprobenzahlen den niedrigsten Fehler
  • Fehler von 0,009 bei 25.848 Stichproben, beste Vergleichsmethode 0,012

Konvergenzanalyse

Numerische Ergebnisse zeigen:

  1. Bei fester Anzahl von Zerlegungstermen K nimmt die Frobenius-Distanz mit zunehmender Schaltkreistiefe L ab
  2. Bei fester Schaltkreistiefe nimmt die Frobenius-Distanz exponentiell mit der Anzahl der Zerlegungsterme K ab

Tensornetzwerk-Methodenleistung

Für Hamiltonoperatoren mit niedriger Bindungsdimension:

  • TND-Methode verwendet nur 3 Zerlegungsterme und 1 Schicht Schaltkreistiefe
  • Fehler von 0,050 bei 18.000 Schritten, besser als traditionelle Methoden

Verwandte Arbeiten

Quantenzustandslernen

  • Quantentomographie: Vollständige Rekonstruktion des Quantenzustands, exponentielle Komplexität
  • Schatten-Tomographie: Bereitstellung einer klassischen Beschreibung des Zustands, Unterstützung für mehrere Eigenschaftsschätzungen

Zufällige Messprotokolle

  • Lokale Messungen: Einzel-Qubit-Clifford-Gruppe, geeignet für lokale Observable
  • Globale Messungen: Globale Clifford-Gruppe, benötigt tiefe Schaltkreise
  • Flache Schaltkreise: Kompromisslösung, nutzt aber Observable-Informationen immer noch nicht vollständig

Pauli-Zerlegungsmethoden

  • Basierend auf Pauli-Expansion der Observable
  • Implementierung durch Clifford-Schaltkreise und Rechenbasis-Messungen
  • Dieser Rahmen vereinheitlicht diese Methoden

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Der vorgeschlagene Rahmen vereinheitlicht erfolgreich bestehende Messprotokolle und erweitert sie auf allgemeine parametrisierte Schaltkreise
  2. GPD- und TND-Algorithmen übertreffen bestehende Methoden in verschiedenen Szenarien erheblich
  3. Die etablierte theoretische Untergrenze offenbart fundamentale Einschränkungen flacher Quantenschaltkreise bei Quantenlernaufgaben

Einschränkungen

  1. GPD-Algorithmus:
    • Klassische Optimierungskomplexität bleibt relativ hoch
    • Greedy-Strategie garantiert keine globale Optimalität
    • Theoretische Analyse der Zerlegungstermanzahl K ist schwierig
  2. TND-Algorithmus:
    • Nur anwendbar auf Hamiltonoperatoren mit effizienter MPO-Darstellung
    • Benötigt zusätzliche Tensornetzwerk-Optimierungstechniken
  3. Theoretische Untergrenze:
    • Möglicherweise nicht ausreichend eng für niederrangige Observable (wie Wiedergabetreue)
    • Abhängig von genauen Schätzungen des Schaltkreisfähigkeitsparameters δ(H_0)

Zukünftige Richtungen

  1. Algorithmusoptimierung:
    • Entwicklung effizienterer Zerlegungsalgorithmen basierend auf maschinellem Lernen
    • Erforschung nicht-greediger globaler Optimierungsstrategien
  2. Theoretische Verbesserung:
    • Etablierung engerer Stichprobenkomplexitäts-Untergrenzen
    • Analyse der Beziehung zwischen Zerlegungstermanzahl K und Schaltkreisfähigkeit
  3. Anwendungserweiterung:
    • Erweiterung auf nichtlineare Eigenschaftsschätzung
    • Protokolldesign unter Kombination mit Quantenspeicher
    • Reduzierung der Anzahl von Hardwarekonfigurationswechseln

Tiefgehende Bewertung

Stärken

  1. Theoretische Beiträge:
    • Bereitstellung eines einheitlichen Rahmens, der mehrere bestehende Methoden integriert
    • Etablierung wichtiger theoretischer Untergrenzen, die das Verständnis der Fähigkeiten flacher Schaltkreise verbessert
  2. Methodische Innovation:
    • GPD-Algorithmus ist auf allgemeine Hamiltonoperatoren anwendbar mit starker Praktikabilität
    • TND-Algorithmus ist für spezifische Strukturen optimiert mit hoher Effizienz
    • Vollständige Nutzung von Observable-Vorwissen
  3. Umfangreiche Experimente:
    • Abdeckung mehrerer Anwendungsszenarien (dünn/dicht besetzte Hamiltonoperatoren, Innenprodukschätzung)
    • Vergleich mit mehreren Mainstream-Methoden, überzeugende Ergebnisse
    • Bereitstellung von Konvergenz- und Durchschnittsleistungsanalyse

Mängel

  1. Skalierungsprobleme:
    • Klassische Optimierungskomplexität von GPD wächst exponentiell mit der Qubit-Anzahl
    • Praktikabilität für große Systeme bleibt zu überprüfen
  2. Experimentelle Einschränkungen:
    • Numerische Experimentskala ist relativ klein (maximal 8 Qubits)
    • Fehlende Validierung auf tatsächlichen Quantengeräten
    • Rauscheinfluss auf Algorithmusleistung nicht berücksichtigt
  3. Theoretische Lücke:
    • Erhebliche Lücke zwischen Ober- und Untergrenze
    • Konvergenzgeschwindigkeit der Zerlegungstermanzahl K mangelt es an strikter theoretischer Garantie

Einflussfähigkeit

  1. Akademischer Wert:
    • Bereitstellung eines neuen theoretischen Rahmens für Quantenzustandslernen
    • Förderung des Verständnisses der Fähigkeiten flacher Quantenschaltkreise
    • Bereitstellung praktischer Werkzeuge für NISQ-Anwendungen
  2. Praktischer Wert:
    • Algorithmisches Designkonzept geeignet für NISQ-Geräte
    • Potenzielle Anwendungen in Quantenchemie und Vielkörperphysik
    • Bereitstellung von Benchmark-Werkzeugen zur Quantenvorteilsverifikation

Anwendungsszenarien

  1. Quantenchemie: Berechnung von Molekülgrundzustandsenergie und Eigenschaften
  2. Quantensimulation: Messung von Korrelationsfunktionen in Vielkörpersystemen
  3. Quantenmaschinelles Lernen: Feature-Mapping und Kernel-Methoden
  4. Quantenoptimierung: Schätzung von Erwartungswerten der Zielfunktion
  5. Quantenfehlerkorrektur: Bewertung der Codeword-Wiedergabetreue und Fehlerkorrekturleistung

Literaturverzeichnis

Das Papier zitiert 66 verwandte Referenzen, die wichtige Arbeiten in Kernbereichen wie Quantenzustandslernen, zufällige Messungen, klassische Schatten und Pauli-Zerlegung abdecken und eine solide theoretische Grundlage für die Forschung bieten.