Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic
Quantenbewusste klassisch trainierte Einbettungen durch projektives metrisches Lernen
Quantenmaschinelles Lernen (QML) verspricht durch die Nutzung einzigartiger Eigenschaften des Quantencomputers reichhaltigere Darstellungen und verbesserte Lernfähigkeiten. Ein notwendiger erster Schritt bei der Verwendung von QML ist die Kodierung klassischer Daten in Quantenzustände. Statische Kodierungsmechanismen haben begrenzte Ausdruckskraft, während das Quantentraining durch barren plateaus geplagt wird, was die Optimierung instabil und ineffizient macht. Dieses Papier stellt Quantum Projective Metric Learning (QPMeL) vor – eine quantenbewusste, klassisch trainierte Methode zum Erlernen dichter und hochwertiger Quantenkodierungen. QPMeL erreicht dies durch die Abbildung klassischer Daten auf unabhängige Einheitssphären in R³, die sich natürlicherweise an Zustände mehrerer nicht verschränkter Qubits ausrichten. QPMeL führt auch eine neuartige projektive Metrikfunktion (PMeF) ein, um die Ähnlichkeit im Hilbert-Raum zu approximieren, während Gradientenstabilisierungstechniken die Trainingseffizienz weiter verbessern.
Herausforderungen bei der Quantendatenkodierung: Die effektive Kodierung klassischer Daten in Quantenzustände ist ein Schlüsselengpass des QML, wobei die Kodierungsqualität die Leistung nachgelagerter Quantenmodelle direkt bestimmt
NISQ-Gerätebeschränkungen: Aktuelle Noisy Intermediate-Scale Quantum (NISQ)-Geräte verfügen über eine begrenzte Qubit-Anzahl, kurze Kohärenzzeiten und fehlende robuste Fehlerkorrektur
Trainingsstabilitätsprobleme: Trainierbare Quantenkodierungen sind von barren plateaus betroffen, was zu verschwindenden Gradienten, Trainingsinstabilität und hohem Ressourcenverbrauch führt
Statische Kodierungsmethoden: Methoden wie Amplitudenkodierung und Winkelkodierung haben begrenzte Ausdruckskraft und können normalerweise nur auf kleine Teilräume des Hilbert-Raums zugreifen
Trainierbare Quantenkodierungen: Obwohl sie aufgabenoptimierte Kodierungen erlernen können, sind sie von barren plateaus betroffen, was das Training schwierig und zeitaufwändig macht
Hybride Trainingsmethoden: Bei der gemeinsamen Optimierung klassischer und quantischer Komponenten werden sie immer noch stark durch barren plateaus beeinträchtigt
Im NISQ-Zeitalter besteht ein dringender Bedarf an einer Methode, die sowohl Quantenvorteile nutzt als auch Quantentrainungsprobleme vermeidet. QPMeL entstand mit dem Ziel, quantenbewusste Kodierungen durch rein klassisches Training zu erlernen.
Einheitlicher Merkmalsraum: Vorschlag eines einheitlichen Merkmalsraums, der aus unabhängigen Kugeloberflächen besteht und klassische und Quantenbereiche verbindet, wobei der klassische Encoder Winkelkodierungen (θ, γ) ausgibt
Projektive Metrikfunktion (PMeF): Innovative Verwendung von R³-Koordinaten zur Berechnung der Ähnlichkeit zwischen Punkten im Quantenstatusraum ohne tatsächliche Quantenschaltkreise
Gradientenstabilisierungstechniken: Für PMeF entwickelte Gradiententechniken, die die Trainingsstabilität und Konvergenz erheblich verbessern
NISQ-freundliche Inferenz: Bei der Inferenz werden pro Qubit nur 2 Gatter (RY und RZ) benötigt, mit extrem flacher Schaltkreistiefe
Multimodale Unterstützung: Erste QML-Methode, die multimodales (Bild-Text-)Lernen unterstützt, mit über 90% Genauigkeit bei 15-Wege-1-Shot-Lernen
QPMeL zielt darauf ab, einen klassischen Encoder zu erlernen, der Eingabedaten x auf Winkelkoordinaten (θ⃗, γ⃗) abbildet, die direkt zur Parametrisierung von Quantengittern verwendet werden können und Quantenzustände mit guter Trennbarkeit im Hilbert-Raum erzeugen.
Nicht-Verschränkungs-Einschränkung: QPMeL kann nur nicht-verschränkte Quantenzustände erlernen, was möglicherweise die Nutzung bestimmter Quantenvorteile einschränkt
Unzureichende theoretische Analyse: Mangel an tiefgehender Analyse der theoretischen Vorteile der Methode
Validierung auf echten Quantenhardware: Experimente werden hauptsächlich auf Simulatoren durchgeführt, es fehlt die Validierung auf echten Quantengeräten
Starke Innovativität: Vorschlag eines völlig neuen Paradigmas des quantenbewussten klassischen Trainings, das das barren-plateau-Problem effektiv vermeidet
Hoher praktischer Wert: Die Methode ist einfach und effizient und lässt sich leicht auf NISQ-Geräten implementieren
Umfassende Experimente: Von Binärklassifizierung bis multimodalem Lernen mit breiter Versuchsabdeckung und überzeugenden Ergebnissen
Technische Strenge: Die mathematische Ableitung von PMeF ist rigoros und die Gradientenstabilisierungstechniken haben theoretische Unterstützung
Durchbruchergebnis: Die erste Realisierung von multimodalem Quantenmaschinellem Lernen ist von großer Bedeutung
Das Papier zitiert wichtige Arbeiten in verwandten Bereichen des Quantenmaschinellen Lernens und metrischen Lernens, einschließlich:
Havlíček et al. (2019): Überwachtes Lernen mit Quantenmerkmalsräumen
McClean et al. (2018): Barren plateaus in Quantenneuronalen Netzen
Lloyd et al. (2020): Quanteneinbettungen für Maschinelles Lernen
Snell et al. (2017): Prototypische Netze für Few-Shot-Lernen
Gesamtbewertung: Dies ist ein hochqualitatives Papier zum Quantenmaschinellen Lernen, das eine innovative Lösung für Schlüsselherausforderungen bietet, denen sich QML derzeit gegenübersieht. Obwohl es einige Mängel in der theoretischen Analyse gibt, machen sein praktischer Wert und seine Innovativität es zu einem wichtigen Beitrag auf diesem Gebiet. Insbesondere die erste Realisierung von multimodalem Quantenmaschinellem Lernen eröffnet neue Richtungen für zukünftige Forschung.