2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.

Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(Î¸)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.

academic

Quantenbewusste klassisch trainierte Einbettungen durch projektives metrisches Lernen

Grundlegende Informationen

Papier-ID: 2312.01655
Titel: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
Autoren: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
Institutionen: ¹Arizona State University, ²National Institute of Technology, Rourkela
Klassifizierung: quant-ph cs.AI
Veröffentlichungsdatum: arXiv:2312.01655v4 quant-ph 16 Okt 2025
Papierlink: https://arxiv.org/abs/2312.01655

Zusammenfassung

Quantenmaschinelles Lernen (QML) verspricht durch die Nutzung einzigartiger Eigenschaften des Quantencomputers reichhaltigere Darstellungen und verbesserte Lernfähigkeiten. Ein notwendiger erster Schritt bei der Verwendung von QML ist die Kodierung klassischer Daten in Quantenzustände. Statische Kodierungsmechanismen haben begrenzte Ausdruckskraft, während das Quantentraining durch barren plateaus geplagt wird, was die Optimierung instabil und ineffizient macht. Dieses Papier stellt Quantum Projective Metric Learning (QPMeL) vor – eine quantenbewusste, klassisch trainierte Methode zum Erlernen dichter und hochwertiger Quantenkodierungen. QPMeL erreicht dies durch die Abbildung klassischer Daten auf unabhängige Einheitssphären in R³, die sich natürlicherweise an Zustände mehrerer nicht verschränkter Qubits ausrichten. QPMeL führt auch eine neuartige projektive Metrikfunktion (PMeF) ein, um die Ähnlichkeit im Hilbert-Raum zu approximieren, während Gradientenstabilisierungstechniken die Trainingseffizienz weiter verbessern.

Forschungshintergrund und Motivation

Kernprobleme

Herausforderungen bei der Quantendatenkodierung: Die effektive Kodierung klassischer Daten in Quantenzustände ist ein Schlüsselengpass des QML, wobei die Kodierungsqualität die Leistung nachgelagerter Quantenmodelle direkt bestimmt
NISQ-Gerätebeschränkungen: Aktuelle Noisy Intermediate-Scale Quantum (NISQ)-Geräte verfügen über eine begrenzte Qubit-Anzahl, kurze Kohärenzzeiten und fehlende robuste Fehlerkorrektur
Trainingsstabilitätsprobleme: Trainierbare Quantenkodierungen sind von barren plateaus betroffen, was zu verschwindenden Gradienten, Trainingsinstabilität und hohem Ressourcenverbrauch führt

Einschränkungen bestehender Methoden

Statische Kodierungsmethoden: Methoden wie Amplitudenkodierung und Winkelkodierung haben begrenzte Ausdruckskraft und können normalerweise nur auf kleine Teilräume des Hilbert-Raums zugreifen
Trainierbare Quantenkodierungen: Obwohl sie aufgabenoptimierte Kodierungen erlernen können, sind sie von barren plateaus betroffen, was das Training schwierig und zeitaufwändig macht
Hybride Trainingsmethoden: Bei der gemeinsamen Optimierung klassischer und quantischer Komponenten werden sie immer noch stark durch barren plateaus beeinträchtigt

Forschungsmotivation

Im NISQ-Zeitalter besteht ein dringender Bedarf an einer Methode, die sowohl Quantenvorteile nutzt als auch Quantentrainungsprobleme vermeidet. QPMeL entstand mit dem Ziel, quantenbewusste Kodierungen durch rein klassisches Training zu erlernen.

Kernbeiträge

Einheitlicher Merkmalsraum: Vorschlag eines einheitlichen Merkmalsraums, der aus unabhängigen Kugeloberflächen besteht und klassische und Quantenbereiche verbindet, wobei der klassische Encoder Winkelkodierungen (θ, γ) ausgibt
Projektive Metrikfunktion (PMeF): Innovative Verwendung von R³-Koordinaten zur Berechnung der Ähnlichkeit zwischen Punkten im Quantenstatusraum ohne tatsächliche Quantenschaltkreise
Gradientenstabilisierungstechniken: Für PMeF entwickelte Gradiententechniken, die die Trainingsstabilität und Konvergenz erheblich verbessern
NISQ-freundliche Inferenz: Bei der Inferenz werden pro Qubit nur 2 Gatter (RY und RZ) benötigt, mit extrem flacher Schaltkreistiefe
Multimodale Unterstützung: Erste QML-Methode, die multimodales (Bild-Text-)Lernen unterstützt, mit über 90% Genauigkeit bei 15-Wege-1-Shot-Lernen

Methodische Details

Aufgabendefinition

QPMeL zielt darauf ab, einen klassischen Encoder zu erlernen, der Eingabedaten x auf Winkelkoordinaten (θ⃗, γ⃗) abbildet, die direkt zur Parametrisierung von Quantengittern verwendet werden können und Quantenzustände mit guter Trennbarkeit im Hilbert-Raum erzeugen.

Modellarchitektur

1. QPMeL-Encoder

Struktur: Standard-Metrik-Encoder + dichter Block + Winkelprojektion-Schicht
Ausgabe: Zwei unabhängige Vektoren θ⃗ ∈ 0,π^Q und γ⃗ ∈ -π,π^Q
Winkelprojektion: Realisiert durch zwei parallele dichte Schichten, deren Ausgaben auf die gewünschten Bereiche skaliert werden

2. Quantenstatuserzeugung

Der erzeugte Q-Qubit-nicht-verschränkte Zustand ist:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Projektive Metrikfunktion (PMeF)

PMeF berechnet die Quantenzustands-Treue durch zwei Schlüsselschritte:

Schritt 1: Umwandlung von Polarkoordinaten in kartesische Koordinaten

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Schritt 2: Komplexe Kernfunktion (CKF) Für zwei Quantenzustände |ψ⟩ und |ϕ⟩ kann ihre Treue ausgedrückt werden als:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

wobei:

λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
λ^c_q = x_q y'_q - y_q x'_q

Technische Innovationen

1. Einheitliche Merkmalsraum-Gestaltung

Geschickte Nutzung unabhängiger Einheitssphären als Brücke zwischen klassischem und Quantenbereich
Natürliche Entsprechung zur Bloch-Kugel-Geometrie mehrerer nicht verschränkter Qubits

2. Quantenbewusstes klassisches Training

Vermeidung von barren plateaus bei Quantenschaltkreis-Training
Direkte Optimierung der Ähnlichkeit im Quantenraum im klassischen Bereich durch PMeF

3. Gradientenstabilisierung

Während des Trainings wird eine additive Form verwendet, um Gradientenschwund zu vermeiden:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Experimentelle Einrichtung

Datensätze

Standardklassifizierung: MNIST, Fashion-MNIST
Few-Shot-Lernen: Omniglot, MS-COCO Captions
Multimodales Lernen: MS-COCO Bild-Text-Paare

Bewertungsmetriken

Klassifizierungsgenauigkeit
N-Wege-K-Shot-Genauigkeit beim Few-Shot-Lernen
Genauigkeit beim modaliätsübergreifenden Abruf bei multimodalen Aufgaben

Vergleichsmethoden

Hur, Araujo, and Park (2023)
Hou et al. (2023)
Huang, Shi, and Li (2025)
Wang et al. (2024)
Liu et al. (2022)

Implementierungsdetails

Jedes Experiment wurde 150-mal wiederholt, um 95%-Konfidenzintervalle zu berechnen
Verwendung von Prototyp-Verlustfunktion für metrisches Lernen
Multimodale Experimente verwenden CLIP-Architektur (BERT+Xception)

Experimentelle Ergebnisse

Hauptergebnisse

1. Leistung bei Standardklassifizierung

MNIST-Datensatz:

Binärklassifizierung: 99,8% ± 0,1% (0,1), 98,2% ± 0,4% (3,5)
Dreiwegsklassifizierung: 99,1% ± 0,5% (0,1,2), 98,9% ± 0,4% (3,5,6)
Zehnwegsklassifizierung: 96,3% ± 0,3%

Fashion-MNIST-Datensatz:

Binärklassifizierung: 98,0% ± 0,6% (0,1)
Dreiwegsklassifizierung: 95,6% ± 0,5% (0,1,2)
Zehnwegsklassifizierung: 85,0% ± 0,3%

2. Few-Shot-Lernleistung

Omniglot-Datensatz (N-Wege-5-Shot):

2-Wege: 98,13% ± 0,49%
5-Wege: 96,0% ± 0,5%
10-Wege: 90,02% ± 0,42%

3. Multimodale Lernleistung

MS-COCO-Datensatz (15-Wege-1-Shot):

Bildunterstützung-Textabfrage: 94,71% ± 0,98% (klassisch), 95,87% ± 0,88% (Quanten)
Textunterstützung-Bildabfrage: 93,60% ± 1,87% (klassisch), 93,07% ± 1,71% (Quanten)

Ablationsstudien

Qubit-Effizienz: Im Vergleich zu Liu et al., die 64 Qubits verwenden, benötigt QPMeL nur 11-20 Qubits, um vergleichbare Leistung zu erreichen
Schaltkreistiefe: Pro Qubit werden nur 2 Gatter benötigt, was die Schaltkreiskomplexität erheblich reduziert
Effekt der Gradientenstabilisierung: Die additive Form von PMeF verbessert die Trainingsstabilität erheblich

Experimentelle Erkenntnisse

Skalierungsvorteil: QPMeL ist die einzige Methode des Quantenmetrik-Lernens, die auf 10-Klassen-Klassifizierung skaliert werden kann
Multimodaler Durchbruch: Erste Methode zur Realisierung von multimodalem Quantenmaschinellem Lernen
Ressourceneffizienz: Erreicht bessere oder vergleichbare Leistung mit deutlich weniger Qubits

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

QPMeL löst erfolgreich das Trainingsstabilitätsproblem beim Quantenmetrischen Lernen
Realisierung des Erlernens quantenbewusster Kodierungen durch rein klassisches Training
Erreichen von SOTA-Leistung bei mehreren Aufgaben bei gleichzeitiger Verwendung weniger Quantenressourcen
Erste Realisierung von multimodalem Quantenmaschinellem Lernen

Einschränkungen

Nicht-Verschränkungs-Einschränkung: QPMeL kann nur nicht-verschränkte Quantenzustände erlernen, was möglicherweise die Nutzung bestimmter Quantenvorteile einschränkt
Unzureichende theoretische Analyse: Mangel an tiefgehender Analyse der theoretischen Vorteile der Methode
Validierung auf echten Quantenhardware: Experimente werden hauptsächlich auf Simulatoren durchgeführt, es fehlt die Validierung auf echten Quantengeräten

Zukünftige Richtungen

Erweiterung auf das Erlernen verschränkter Zustände
Theoretische Analyse der Quellen von Quantenvorteilen
Experimentelle Validierung auf echten NISQ-Geräten
Erkundung weiterer Anwendungsszenarien des Quantenmaschinellen Lernens

Tiefgreifende Bewertung

Stärken

Starke Innovativität: Vorschlag eines völlig neuen Paradigmas des quantenbewussten klassischen Trainings, das das barren-plateau-Problem effektiv vermeidet
Hoher praktischer Wert: Die Methode ist einfach und effizient und lässt sich leicht auf NISQ-Geräten implementieren
Umfassende Experimente: Von Binärklassifizierung bis multimodalem Lernen mit breiter Versuchsabdeckung und überzeugenden Ergebnissen
Technische Strenge: Die mathematische Ableitung von PMeF ist rigoros und die Gradientenstabilisierungstechniken haben theoretische Unterstützung
Durchbruchergebnis: Die erste Realisierung von multimodalem Quantenmaschinellem Lernen ist von großer Bedeutung

Mängel

Theoretische Tiefe: Mangel an tiefgehender theoretischer Analyse, warum nicht-verschränkte Zustände ausreichend sind
Fairness des Vergleichs: Da der Code der Baseline-Methoden nicht verfügbar ist, gibt es Bedenken hinsichtlich der Fairness der Vergleichsergebnisse
Unklar definierter Quantenvorteil: Keine klare Darlegung der Quellen von Quantenvorteilen gegenüber rein klassischen Methoden
Fehlende Hardwarevalidierung: Mangel an experimenteller Validierung auf echten Quantengeräten

Einfluss

Akademischer Beitrag: Bietet ein neues Forschungsparadigma für Quantenmaschinelles Lernen, das nachfolgende Arbeiten inspirieren könnte
Praktischer Wert: Die NISQ-Freundlichkeit der Methode macht sie für die nahe Zukunft praktisch anwendbar
Fortschritt des Feldes: Die erste Realisierung von multimodalem Quantenmaschinellem Lernen ist bahnbrechend

Anwendungsszenarien

NISQ-Zeitalter-Anwendungen: Besonders geeignet für Anwendungen unter aktuellen Quantenhardware-Einschränkungen
Metrisches Lernens-Aufgaben: Zeigt Vorteile bei Aufgaben, die das Erlernen von Ähnlichkeitsmetriken erfordern
Multimodale Anwendungen: Eröffnet neue Wege für Quantenmultimodales Lernen
Konzeptvalidierung: Geeignet als Grundlagenmethode für Konzeptvalidierung im Quantenmaschinellen Lernen

Literaturverzeichnis

Das Papier zitiert wichtige Arbeiten in verwandten Bereichen des Quantenmaschinellen Lernens und metrischen Lernens, einschließlich:

Havlíček et al. (2019): Überwachtes Lernen mit Quantenmerkmalsräumen
McClean et al. (2018): Barren plateaus in Quantenneuronalen Netzen
Lloyd et al. (2020): Quanteneinbettungen für Maschinelles Lernen
Snell et al. (2017): Prototypische Netze für Few-Shot-Lernen

Gesamtbewertung: Dies ist ein hochqualitatives Papier zum Quantenmaschinellen Lernen, das eine innovative Lösung für Schlüsselherausforderungen bietet, denen sich QML derzeit gegenübersieht. Obwohl es einige Mängel in der theoretischen Analyse gibt, machen sein praktischer Wert und seine Innovativität es zu einem wichtigen Beitrag auf diesem Gebiet. Insbesondere die erste Realisierung von multimodalem Quantenmaschinellem Lernen eröffnet neue Richtungen für zukünftige Forschung.