2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.

Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(Î¸)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.

academic

Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning

Informazioni Fondamentali

ID Articolo: 2312.01655
Titolo: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
Autori: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
Istituzioni: ¹Arizona State University, ²National Institute of Technology, Rourkela
Classificazione: quant-ph cs.AI
Data di Pubblicazione: arXiv:2312.01655v4 quant-ph 16 Ott 2025
Link Articolo: https://arxiv.org/abs/2312.01655

Riassunto

L'apprendimento automatico quantistico (QML) promette rappresentazioni più ricche e capacità di apprendimento migliorate sfruttando le proprietà uniche del calcolo quantistico. Il primo passo necessario nell'utilizzo di QML è la codifica dei dati classici in stati quantistici. I meccanismi di codifica statica hanno capacità espressiva limitata, mentre l'addestramento quantistico è afflitto da altipiani sterili (barren plateaus), rendendo l'ottimizzazione instabile e inefficiente. Questo articolo propone l'apprendimento metrico proiettivo quantistico (QPMeL)—un metodo quantistico-consapevole, addestrato classicamente, per imparare codifiche quantistiche dense e di alta qualità. QPMeL realizza ciò mappando i dati classici su sfere unitarie indipendenti in R³, che si allineano naturalmente con gli stati di più qubit non intrecciati. QPMeL introduce inoltre una nuova funzione metrica proiettiva (PMeF) per approssimare la similarità nello spazio di Hilbert, mentre tecniche di stabilizzazione del gradiente migliorano ulteriormente l'efficienza dell'addestramento.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

Sfide nella Codifica Dati Quantistici: La codifica efficace dei dati classici in stati quantistici è un collo di bottiglia critico di QML, con la qualità della codifica che determina direttamente le prestazioni dei modelli quantistici a valle
Limitazioni dei Dispositivi NISQ: I dispositivi quantistici attuali di scala intermedia rumorosa (NISQ) hanno un numero limitato di qubit, tempi di coerenza brevi e mancanza di correzione degli errori robusta
Problemi di Stabilità dell'Addestramento: Le codifiche quantistiche addestrabili sono afflitte dal fenomeno degli altipiani sterili, causando scomparsa dei gradienti, instabilità dell'addestramento e intensità di risorse

Limitazioni dei Metodi Esistenti

Metodi di Codifica Statica: Metodi come la codifica di ampiezza e la codifica angolare hanno capacità espressiva limitata, accedendo tipicamente solo a piccoli sottospazi dello spazio di Hilbert
Codifiche Quantistiche Addestrabili: Sebbene possano imparare codifiche ottimizzate per i compiti, soffrono degli altipiani sterili, rendendo l'addestramento difficile e dispendioso in termini di tempo
Metodi di Addestramento Ibrido: Quando si ottimizzano congiuntamente i componenti classici e quantistici, rimangono ancora gravemente afflitti dal problema degli altipiani sterili

Motivazione della Ricerca

Nell'era NISQ, c'è un'urgente necessità di un metodo che possa sia sfruttare i vantaggi quantistici che evitare i problemi dell'addestramento quantistico. QPMeL nasce con l'obiettivo di imparare codifiche quantistico-consapevoli attraverso addestramento puramente classico.

Contributi Fondamentali

Spazio di Caratteristiche Unificato: Propone uno spazio di caratteristiche unificato composto da superfici di sfere indipendenti, collegando i domini classico e quantistico, con l'encoder classico che produce codifiche angolari (θ, γ)
Funzione Metrica Proiettiva (PMeF): Utilizza innovativamente le coordinate in R³ per calcolare la similarità tra punti nello spazio degli stati quantistici, senza richiedere circuiti quantistici effettivi
Tecniche di Stabilizzazione del Gradiente: Tecniche di gradiente progettate specificamente per PMeF che migliorano significativamente la stabilità e la convergenza dell'addestramento
Inferenza Amichevole per NISQ: L'inferenza richiede solo 2 porte per qubit (RY e RZ), con profondità del circuito estremamente ridotta
Supporto Multimodale: Primo metodo QML a supportare l'apprendimento multimodale (immagine-testo), raggiungendo un'accuratezza superiore al 90% in apprendimento 15-way 1-shot

Spiegazione Dettagliata del Metodo

Definizione del Compito

QPMeL mira ad imparare un encoder classico che mappi i dati di input x alle coordinate angolari (θ⃗, γ⃗), che possono essere utilizzate direttamente per parametrizzare porte quantistiche, generando stati quantistici con buona separabilità nello spazio di Hilbert.

Architettura del Modello

1. Encoder QPMeL

Struttura: Encoder metrico standard + blocco denso + strato di proiezione angolare
Output: Due vettori indipendenti θ⃗ ∈ 0,π^Q e γ⃗ ∈ -π,π^Q
Proiezione Angolare: Realizzata attraverso due strati densi paralleli, con output scalati all'intervallo desiderato

2. Generazione di Stati Quantistici

Lo stato non intrecciato di Q qubit generato è:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Funzione Metrica Proiettiva (PMeF)

PMeF calcola la fedeltà dello stato quantistico attraverso due passaggi chiave:

Passaggio 1: Conversione da Coordinate Polari a Coordinate Cartesiane

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Passaggio 2: Funzione Kernel Complessa (CKF) Per due stati quantistici |ψ⟩ e |ϕ⟩, la loro fedeltà può essere espressa come:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

dove:

λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
λ^c_q = x_q y'_q - y_q x'_q

Punti di Innovazione Tecnica

1. Progettazione dello Spazio di Caratteristiche Unificato

Sfrutta abilmente le sfere unitarie indipendenti come ponte tra i domini classico e quantistico
Corrisponde naturalmente alla struttura geometrica della sfera di Bloch di più qubit non intrecciati

2. Addestramento Classico Quantistico-Consapevole

Evita il problema degli altipiani sterili nell'addestramento dei circuiti quantistici
Ottimizza direttamente la similarità nello spazio quantistico nel dominio classico attraverso PMeF

3. Stabilizzazione del Gradiente

Durante l'addestramento, viene utilizzata la forma additiva per evitare la scomparsa del gradiente:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Configurazione Sperimentale

Dataset

Classificazione Standard: MNIST, Fashion-MNIST
Apprendimento con Pochi Esempi: Omniglot, MS-COCO Captions
Apprendimento Multimodale: Coppie immagine-testo MS-COCO

Metriche di Valutazione

Accuratezza della classificazione
Accuratezza N-way K-shot nell'apprendimento con pochi esempi
Accuratezza del recupero cross-modale nei compiti multimodali

Metodi di Confronto

Hur, Araujo, and Park (2023)
Hou et al. (2023)
Huang, Shi, and Li (2025)
Wang et al. (2024)
Liu et al. (2022)

Dettagli di Implementazione

Ogni esperimento ripetuto 150 volte per calcolare intervalli di confidenza al 95%
Utilizzo della funzione di perdita prototipica per l'apprendimento metrico
Esperimenti multimodali che utilizzano l'architettura CLIP (BERT+Xception)

Risultati Sperimentali

Risultati Principali

1. Prestazioni di Classificazione Standard

Dataset MNIST:

Classificazione binaria: 99,8% ± 0,1% (0,1), 98,2% ± 0,4% (3,5)
Classificazione ternaria: 99,1% ± 0,5% (0,1,2), 98,9% ± 0,4% (3,5,6)
Classificazione a dieci classi: 96,3% ± 0,3%

Dataset Fashion-MNIST:

Classificazione binaria: 98,0% ± 0,6% (0,1)
Classificazione ternaria: 95,6% ± 0,5% (0,1,2)
Classificazione a dieci classi: 85,0% ± 0,3%

2. Prestazioni di Apprendimento con Pochi Esempi

Dataset Omniglot (N-Way-5-shot):

2-way: 98,13% ± 0,49%
5-way: 96,0% ± 0,5%
10-way: 90,02% ± 0,42%

3. Prestazioni di Apprendimento Multimodale

Dataset MS-COCO (15-Way-1-shot):

Supporto immagine - Query testo: 94,71% ± 0,98% (classico), 95,87% ± 0,88% (quantistico)
Supporto testo - Query immagine: 93,60% ± 1,87% (classico), 93,07% ± 1,71% (quantistico)

Esperimenti di Ablazione

Efficienza dei Qubit: Rispetto a Liu et al. che utilizza 64 qubit, QPMeL richiede solo 11-20 qubit per raggiungere prestazioni comparabili
Profondità del Circuito: Solo 2 porte per qubit, riducendo significativamente la complessità del circuito
Effetto della Stabilizzazione del Gradiente: La forma additiva di PMeF migliora significativamente la stabilità dell'addestramento

Scoperte Sperimentali

Vantaggi di Scalabilità: QPMeL è l'unico metodo di apprendimento metrico quantistico in grado di scalare a classificazione a 10 classi
Innovazione Multimodale: Primo metodo a realizzare l'apprendimento automatico quantistico multimodale
Efficienza delle Risorse: Raggiunge prestazioni migliori o comparabili utilizzando significativamente meno qubit

Lavori Correlati

Metodi di Codifica Dati Quantistici

Codifica Statica: Codifica angolare, codifica di ampiezza e altri metodi iniziali
Codifica Addestrabile: QMeL e sue varianti
Addestramento Ibrido: Metodi di ottimizzazione congiunta classico-quantistica

Apprendimento Metrico Quantistico

Lloyd et al. (2020): Primo a proporre il concetto di apprendimento metrico quantistico
Lavori successivi principalmente concentrati sul miglioramento della stabilità dell'addestramento e della scalabilità

Vantaggi di Questo Articolo

Evita completamente l'instabilità dell'addestramento quantistico
Primo a realizzare l'apprendimento automatico quantistico multimodale
Migliora significativamente l'efficienza dell'utilizzo delle risorse

Conclusioni e Discussione

Conclusioni Principali

QPMeL risolve con successo il problema dell'instabilità dell'addestramento nell'apprendimento metrico quantistico
Realizza l'apprendimento di codifiche quantistico-consapevoli attraverso addestramento puramente classico
Raggiunge prestazioni SOTA su più compiti, utilizzando contemporaneamente meno risorse quantistiche
Realizza per la prima volta l'apprendimento automatico quantistico multimodale

Limitazioni

Limitazione dei Non-Intrecciati: QPMeL può imparare solo stati quantistici non intrecciati, il che potrebbe limitare lo sfruttamento di alcuni vantaggi quantistici
Analisi Teorica Insufficiente: Manca un'analisi teorica approfondita dei vantaggi del metodo
Verifica su Hardware Quantistico Reale: Gli esperimenti sono principalmente condotti su simulatori, mancando la verifica su dispositivi quantistici reali

Direzioni Future

Estensione all'apprendimento di stati intrecciati
Analisi teorica delle fonti dei vantaggi quantistici
Verifica sperimentale su dispositivi NISQ reali
Esplorazione di più scenari di applicazione dell'apprendimento automatico quantistico

Valutazione Approfondita

Punti di Forza

Forte Innovatività: Propone un nuovo paradigma di addestramento classico quantistico-consapevole, evitando efficacemente il problema degli altipiani sterili
Alto Valore Pratico: Il metodo è semplice ed efficiente, facilmente implementabile su dispositivi NISQ
Esperimenti Completi: Dalla classificazione binaria all'apprendimento multimodale, la copertura sperimentale è ampia e i risultati convincenti
Rigore Tecnico: La derivazione matematica di PMeF è rigorosa, con tecniche di stabilizzazione del gradiente supportate teoricamente
Risultati Rivoluzionari: La prima realizzazione dell'apprendimento automatico quantistico multimodale ha un significato importante

Insufficienze

Profondità Teorica: Manca un'analisi teorica approfondita del perché gli stati non intrecciati siano sufficienti
Equità del Confronto: A causa dell'indisponibilità del codice dei metodi di base, l'equità dei risultati di confronto è discutibile
Vantaggio Quantistico Poco Chiaro: Non riesce a chiarire esplicitamente la fonte dei vantaggi quantistici rispetto ai metodi puramente classici
Verifica Hardware Mancante: Manca la verifica sperimentale su dispositivi quantistici reali

Impatto

Contributo Accademico: Fornisce un nuovo paradigma di ricerca per l'apprendimento automatico quantistico, potenzialmente ispirando lavori successivi
Valore Pratico: La natura NISQ-friendly del metodo gli conferisce potenziale di praticità a breve termine
Avanzamento del Campo: La prima realizzazione dell'apprendimento automatico quantistico multimodale ha significato pioneristico

Scenari Applicabili

Applicazioni nell'Era NISQ: Particolarmente adatto alle applicazioni con i vincoli dell'hardware quantistico attuale
Compiti di Apprendimento Metrico: Vantaggioso nei compiti che richiedono l'apprendimento di metriche di similarità
Applicazioni Multimodali: Apre nuovi percorsi per l'apprendimento automatico quantistico multimodale
Validazione Concettuale: Adatto come metodo fondamentale per la validazione concettuale dell'apprendimento automatico quantistico

Bibliografia

L'articolo cita importanti lavori nei campi correlati dell'apprendimento automatico quantistico e dell'apprendimento metrico, inclusi:

Havlíček et al. (2019): Apprendimento supervisionato nello spazio di caratteristiche quantistici
McClean et al. (2018): Altipiani sterili nelle reti neurali quantistiche
Lloyd et al. (2020): Embedding quantistici per l'apprendimento automatico
Snell et al. (2017): Reti prototipiche per l'apprendimento con pochi esempi

Valutazione Complessiva: Questo è un articolo di alta qualità nell'apprendimento automatico quantistico che propone soluzioni innovative per affrontare le sfide critiche affrontate attualmente da QML. Sebbene presenti alcune insufficienze nell'analisi teorica, il suo valore pratico e l'innovatività lo rendono un contributo importante nel campo. In particolare, la prima realizzazione dell'apprendimento automatico quantistico multimodale apre nuove direzioni per la ricerca futura.