2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.
Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic

Quantenbewusste klassisch trainierte Einbettungen durch projektives metrisches Lernen

Grundlegende Informationen

  • Papier-ID: 2312.01655
  • Titel: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
  • Autoren: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
  • Institutionen: ¹Arizona State University, ²National Institute of Technology, Rourkela
  • Klassifizierung: quant-ph cs.AI
  • Veröffentlichungsdatum: arXiv:2312.01655v4 quant-ph 16 Okt 2025
  • Papierlink: https://arxiv.org/abs/2312.01655

Zusammenfassung

Quantenmaschinelles Lernen (QML) verspricht durch die Nutzung einzigartiger Eigenschaften des Quantencomputers reichhaltigere Darstellungen und verbesserte Lernfähigkeiten. Ein notwendiger erster Schritt bei der Verwendung von QML ist die Kodierung klassischer Daten in Quantenzustände. Statische Kodierungsmechanismen haben begrenzte Ausdruckskraft, während das Quantentraining durch barren plateaus geplagt wird, was die Optimierung instabil und ineffizient macht. Dieses Papier stellt Quantum Projective Metric Learning (QPMeL) vor – eine quantenbewusste, klassisch trainierte Methode zum Erlernen dichter und hochwertiger Quantenkodierungen. QPMeL erreicht dies durch die Abbildung klassischer Daten auf unabhängige Einheitssphären in R³, die sich natürlicherweise an Zustände mehrerer nicht verschränkter Qubits ausrichten. QPMeL führt auch eine neuartige projektive Metrikfunktion (PMeF) ein, um die Ähnlichkeit im Hilbert-Raum zu approximieren, während Gradientenstabilisierungstechniken die Trainingseffizienz weiter verbessern.

Forschungshintergrund und Motivation

Kernprobleme

  1. Herausforderungen bei der Quantendatenkodierung: Die effektive Kodierung klassischer Daten in Quantenzustände ist ein Schlüsselengpass des QML, wobei die Kodierungsqualität die Leistung nachgelagerter Quantenmodelle direkt bestimmt
  2. NISQ-Gerätebeschränkungen: Aktuelle Noisy Intermediate-Scale Quantum (NISQ)-Geräte verfügen über eine begrenzte Qubit-Anzahl, kurze Kohärenzzeiten und fehlende robuste Fehlerkorrektur
  3. Trainingsstabilitätsprobleme: Trainierbare Quantenkodierungen sind von barren plateaus betroffen, was zu verschwindenden Gradienten, Trainingsinstabilität und hohem Ressourcenverbrauch führt

Einschränkungen bestehender Methoden

  1. Statische Kodierungsmethoden: Methoden wie Amplitudenkodierung und Winkelkodierung haben begrenzte Ausdruckskraft und können normalerweise nur auf kleine Teilräume des Hilbert-Raums zugreifen
  2. Trainierbare Quantenkodierungen: Obwohl sie aufgabenoptimierte Kodierungen erlernen können, sind sie von barren plateaus betroffen, was das Training schwierig und zeitaufwändig macht
  3. Hybride Trainingsmethoden: Bei der gemeinsamen Optimierung klassischer und quantischer Komponenten werden sie immer noch stark durch barren plateaus beeinträchtigt

Forschungsmotivation

Im NISQ-Zeitalter besteht ein dringender Bedarf an einer Methode, die sowohl Quantenvorteile nutzt als auch Quantentrainungsprobleme vermeidet. QPMeL entstand mit dem Ziel, quantenbewusste Kodierungen durch rein klassisches Training zu erlernen.

Kernbeiträge

  1. Einheitlicher Merkmalsraum: Vorschlag eines einheitlichen Merkmalsraums, der aus unabhängigen Kugeloberflächen besteht und klassische und Quantenbereiche verbindet, wobei der klassische Encoder Winkelkodierungen (θ, γ) ausgibt
  2. Projektive Metrikfunktion (PMeF): Innovative Verwendung von R³-Koordinaten zur Berechnung der Ähnlichkeit zwischen Punkten im Quantenstatusraum ohne tatsächliche Quantenschaltkreise
  3. Gradientenstabilisierungstechniken: Für PMeF entwickelte Gradiententechniken, die die Trainingsstabilität und Konvergenz erheblich verbessern
  4. NISQ-freundliche Inferenz: Bei der Inferenz werden pro Qubit nur 2 Gatter (RY und RZ) benötigt, mit extrem flacher Schaltkreistiefe
  5. Multimodale Unterstützung: Erste QML-Methode, die multimodales (Bild-Text-)Lernen unterstützt, mit über 90% Genauigkeit bei 15-Wege-1-Shot-Lernen

Methodische Details

Aufgabendefinition

QPMeL zielt darauf ab, einen klassischen Encoder zu erlernen, der Eingabedaten x auf Winkelkoordinaten (θ⃗, γ⃗) abbildet, die direkt zur Parametrisierung von Quantengittern verwendet werden können und Quantenzustände mit guter Trennbarkeit im Hilbert-Raum erzeugen.

Modellarchitektur

1. QPMeL-Encoder

  • Struktur: Standard-Metrik-Encoder + dichter Block + Winkelprojektion-Schicht
  • Ausgabe: Zwei unabhängige Vektoren θ⃗ ∈ 0,π^Q und γ⃗ ∈ -π,π^Q
  • Winkelprojektion: Realisiert durch zwei parallele dichte Schichten, deren Ausgaben auf die gewünschten Bereiche skaliert werden

2. Quantenstatuserzeugung

Der erzeugte Q-Qubit-nicht-verschränkte Zustand ist:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Projektive Metrikfunktion (PMeF)

PMeF berechnet die Quantenzustands-Treue durch zwei Schlüsselschritte:

Schritt 1: Umwandlung von Polarkoordinaten in kartesische Koordinaten

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Schritt 2: Komplexe Kernfunktion (CKF) Für zwei Quantenzustände |ψ⟩ und |ϕ⟩ kann ihre Treue ausgedrückt werden als:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

wobei:

  • λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
  • λ^c_q = x_q y'_q - y_q x'_q

Technische Innovationen

1. Einheitliche Merkmalsraum-Gestaltung

  • Geschickte Nutzung unabhängiger Einheitssphären als Brücke zwischen klassischem und Quantenbereich
  • Natürliche Entsprechung zur Bloch-Kugel-Geometrie mehrerer nicht verschränkter Qubits

2. Quantenbewusstes klassisches Training

  • Vermeidung von barren plateaus bei Quantenschaltkreis-Training
  • Direkte Optimierung der Ähnlichkeit im Quantenraum im klassischen Bereich durch PMeF

3. Gradientenstabilisierung

Während des Trainings wird eine additive Form verwendet, um Gradientenschwund zu vermeiden:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Experimentelle Einrichtung

Datensätze

  1. Standardklassifizierung: MNIST, Fashion-MNIST
  2. Few-Shot-Lernen: Omniglot, MS-COCO Captions
  3. Multimodales Lernen: MS-COCO Bild-Text-Paare

Bewertungsmetriken

  • Klassifizierungsgenauigkeit
  • N-Wege-K-Shot-Genauigkeit beim Few-Shot-Lernen
  • Genauigkeit beim modaliätsübergreifenden Abruf bei multimodalen Aufgaben

Vergleichsmethoden

  • Hur, Araujo, and Park (2023)
  • Hou et al. (2023)
  • Huang, Shi, and Li (2025)
  • Wang et al. (2024)
  • Liu et al. (2022)

Implementierungsdetails

  • Jedes Experiment wurde 150-mal wiederholt, um 95%-Konfidenzintervalle zu berechnen
  • Verwendung von Prototyp-Verlustfunktion für metrisches Lernen
  • Multimodale Experimente verwenden CLIP-Architektur (BERT+Xception)

Experimentelle Ergebnisse

Hauptergebnisse

1. Leistung bei Standardklassifizierung

MNIST-Datensatz:

  • Binärklassifizierung: 99,8% ± 0,1% (0,1), 98,2% ± 0,4% (3,5)
  • Dreiwegsklassifizierung: 99,1% ± 0,5% (0,1,2), 98,9% ± 0,4% (3,5,6)
  • Zehnwegsklassifizierung: 96,3% ± 0,3%

Fashion-MNIST-Datensatz:

  • Binärklassifizierung: 98,0% ± 0,6% (0,1)
  • Dreiwegsklassifizierung: 95,6% ± 0,5% (0,1,2)
  • Zehnwegsklassifizierung: 85,0% ± 0,3%

2. Few-Shot-Lernleistung

Omniglot-Datensatz (N-Wege-5-Shot):

  • 2-Wege: 98,13% ± 0,49%
  • 5-Wege: 96,0% ± 0,5%
  • 10-Wege: 90,02% ± 0,42%

3. Multimodale Lernleistung

MS-COCO-Datensatz (15-Wege-1-Shot):

  • Bildunterstützung-Textabfrage: 94,71% ± 0,98% (klassisch), 95,87% ± 0,88% (Quanten)
  • Textunterstützung-Bildabfrage: 93,60% ± 1,87% (klassisch), 93,07% ± 1,71% (Quanten)

Ablationsstudien

  1. Qubit-Effizienz: Im Vergleich zu Liu et al., die 64 Qubits verwenden, benötigt QPMeL nur 11-20 Qubits, um vergleichbare Leistung zu erreichen
  2. Schaltkreistiefe: Pro Qubit werden nur 2 Gatter benötigt, was die Schaltkreiskomplexität erheblich reduziert
  3. Effekt der Gradientenstabilisierung: Die additive Form von PMeF verbessert die Trainingsstabilität erheblich

Experimentelle Erkenntnisse

  1. Skalierungsvorteil: QPMeL ist die einzige Methode des Quantenmetrik-Lernens, die auf 10-Klassen-Klassifizierung skaliert werden kann
  2. Multimodaler Durchbruch: Erste Methode zur Realisierung von multimodalem Quantenmaschinellem Lernen
  3. Ressourceneffizienz: Erreicht bessere oder vergleichbare Leistung mit deutlich weniger Qubits

Verwandte Arbeiten

Quantendaten-Kodierungsmethoden

  1. Statische Kodierung: Frühe Methoden wie Winkelkodierung, Amplitudenkodierung
  2. Trainierbare Kodierung: QMeL und seine Varianten
  3. Hybrides Training: Klassisch-quantale gemeinsame Optimierungsmethoden

Quantenmetrisches Lernen

  • Lloyd et al. (2020): Erste Einführung des Konzepts des Quantenmetrik-Lernens
  • Nachfolgende Arbeiten konzentrieren sich hauptsächlich auf die Verbesserung der Trainingsstabilität und Skalierbarkeit

Vorteile dieses Papiers

  • Vollständige Vermeidung von Instabilität beim Quantentraining
  • Erste Realisierung von multimodalem Quantenmaschinellem Lernen
  • Erhebliche Verbesserung der Ressourcennutzungseffizienz

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. QPMeL löst erfolgreich das Trainingsstabilitätsproblem beim Quantenmetrischen Lernen
  2. Realisierung des Erlernens quantenbewusster Kodierungen durch rein klassisches Training
  3. Erreichen von SOTA-Leistung bei mehreren Aufgaben bei gleichzeitiger Verwendung weniger Quantenressourcen
  4. Erste Realisierung von multimodalem Quantenmaschinellem Lernen

Einschränkungen

  1. Nicht-Verschränkungs-Einschränkung: QPMeL kann nur nicht-verschränkte Quantenzustände erlernen, was möglicherweise die Nutzung bestimmter Quantenvorteile einschränkt
  2. Unzureichende theoretische Analyse: Mangel an tiefgehender Analyse der theoretischen Vorteile der Methode
  3. Validierung auf echten Quantenhardware: Experimente werden hauptsächlich auf Simulatoren durchgeführt, es fehlt die Validierung auf echten Quantengeräten

Zukünftige Richtungen

  1. Erweiterung auf das Erlernen verschränkter Zustände
  2. Theoretische Analyse der Quellen von Quantenvorteilen
  3. Experimentelle Validierung auf echten NISQ-Geräten
  4. Erkundung weiterer Anwendungsszenarien des Quantenmaschinellen Lernens

Tiefgreifende Bewertung

Stärken

  1. Starke Innovativität: Vorschlag eines völlig neuen Paradigmas des quantenbewussten klassischen Trainings, das das barren-plateau-Problem effektiv vermeidet
  2. Hoher praktischer Wert: Die Methode ist einfach und effizient und lässt sich leicht auf NISQ-Geräten implementieren
  3. Umfassende Experimente: Von Binärklassifizierung bis multimodalem Lernen mit breiter Versuchsabdeckung und überzeugenden Ergebnissen
  4. Technische Strenge: Die mathematische Ableitung von PMeF ist rigoros und die Gradientenstabilisierungstechniken haben theoretische Unterstützung
  5. Durchbruchergebnis: Die erste Realisierung von multimodalem Quantenmaschinellem Lernen ist von großer Bedeutung

Mängel

  1. Theoretische Tiefe: Mangel an tiefgehender theoretischer Analyse, warum nicht-verschränkte Zustände ausreichend sind
  2. Fairness des Vergleichs: Da der Code der Baseline-Methoden nicht verfügbar ist, gibt es Bedenken hinsichtlich der Fairness der Vergleichsergebnisse
  3. Unklar definierter Quantenvorteil: Keine klare Darlegung der Quellen von Quantenvorteilen gegenüber rein klassischen Methoden
  4. Fehlende Hardwarevalidierung: Mangel an experimenteller Validierung auf echten Quantengeräten

Einfluss

  1. Akademischer Beitrag: Bietet ein neues Forschungsparadigma für Quantenmaschinelles Lernen, das nachfolgende Arbeiten inspirieren könnte
  2. Praktischer Wert: Die NISQ-Freundlichkeit der Methode macht sie für die nahe Zukunft praktisch anwendbar
  3. Fortschritt des Feldes: Die erste Realisierung von multimodalem Quantenmaschinellem Lernen ist bahnbrechend

Anwendungsszenarien

  1. NISQ-Zeitalter-Anwendungen: Besonders geeignet für Anwendungen unter aktuellen Quantenhardware-Einschränkungen
  2. Metrisches Lernens-Aufgaben: Zeigt Vorteile bei Aufgaben, die das Erlernen von Ähnlichkeitsmetriken erfordern
  3. Multimodale Anwendungen: Eröffnet neue Wege für Quantenmultimodales Lernen
  4. Konzeptvalidierung: Geeignet als Grundlagenmethode für Konzeptvalidierung im Quantenmaschinellen Lernen

Literaturverzeichnis

Das Papier zitiert wichtige Arbeiten in verwandten Bereichen des Quantenmaschinellen Lernens und metrischen Lernens, einschließlich:

  • Havlíček et al. (2019): Überwachtes Lernen mit Quantenmerkmalsräumen
  • McClean et al. (2018): Barren plateaus in Quantenneuronalen Netzen
  • Lloyd et al. (2020): Quanteneinbettungen für Maschinelles Lernen
  • Snell et al. (2017): Prototypische Netze für Few-Shot-Lernen

Gesamtbewertung: Dies ist ein hochqualitatives Papier zum Quantenmaschinellen Lernen, das eine innovative Lösung für Schlüsselherausforderungen bietet, denen sich QML derzeit gegenübersieht. Obwohl es einige Mängel in der theoretischen Analyse gibt, machen sein praktischer Wert und seine Innovativität es zu einem wichtigen Beitrag auf diesem Gebiet. Insbesondere die erste Realisierung von multimodalem Quantenmaschinellem Lernen eröffnet neue Richtungen für zukünftige Forschung.