2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.
Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic

Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning

Informazioni Fondamentali

  • ID Articolo: 2312.01655
  • Titolo: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
  • Autori: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
  • Istituzioni: ¹Arizona State University, ²National Institute of Technology, Rourkela
  • Classificazione: quant-ph cs.AI
  • Data di Pubblicazione: arXiv:2312.01655v4 quant-ph 16 Ott 2025
  • Link Articolo: https://arxiv.org/abs/2312.01655

Riassunto

L'apprendimento automatico quantistico (QML) promette rappresentazioni più ricche e capacità di apprendimento migliorate sfruttando le proprietà uniche del calcolo quantistico. Il primo passo necessario nell'utilizzo di QML è la codifica dei dati classici in stati quantistici. I meccanismi di codifica statica hanno capacità espressiva limitata, mentre l'addestramento quantistico è afflitto da altipiani sterili (barren plateaus), rendendo l'ottimizzazione instabile e inefficiente. Questo articolo propone l'apprendimento metrico proiettivo quantistico (QPMeL)—un metodo quantistico-consapevole, addestrato classicamente, per imparare codifiche quantistiche dense e di alta qualità. QPMeL realizza ciò mappando i dati classici su sfere unitarie indipendenti in R³, che si allineano naturalmente con gli stati di più qubit non intrecciati. QPMeL introduce inoltre una nuova funzione metrica proiettiva (PMeF) per approssimare la similarità nello spazio di Hilbert, mentre tecniche di stabilizzazione del gradiente migliorano ulteriormente l'efficienza dell'addestramento.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

  1. Sfide nella Codifica Dati Quantistici: La codifica efficace dei dati classici in stati quantistici è un collo di bottiglia critico di QML, con la qualità della codifica che determina direttamente le prestazioni dei modelli quantistici a valle
  2. Limitazioni dei Dispositivi NISQ: I dispositivi quantistici attuali di scala intermedia rumorosa (NISQ) hanno un numero limitato di qubit, tempi di coerenza brevi e mancanza di correzione degli errori robusta
  3. Problemi di Stabilità dell'Addestramento: Le codifiche quantistiche addestrabili sono afflitte dal fenomeno degli altipiani sterili, causando scomparsa dei gradienti, instabilità dell'addestramento e intensità di risorse

Limitazioni dei Metodi Esistenti

  1. Metodi di Codifica Statica: Metodi come la codifica di ampiezza e la codifica angolare hanno capacità espressiva limitata, accedendo tipicamente solo a piccoli sottospazi dello spazio di Hilbert
  2. Codifiche Quantistiche Addestrabili: Sebbene possano imparare codifiche ottimizzate per i compiti, soffrono degli altipiani sterili, rendendo l'addestramento difficile e dispendioso in termini di tempo
  3. Metodi di Addestramento Ibrido: Quando si ottimizzano congiuntamente i componenti classici e quantistici, rimangono ancora gravemente afflitti dal problema degli altipiani sterili

Motivazione della Ricerca

Nell'era NISQ, c'è un'urgente necessità di un metodo che possa sia sfruttare i vantaggi quantistici che evitare i problemi dell'addestramento quantistico. QPMeL nasce con l'obiettivo di imparare codifiche quantistico-consapevoli attraverso addestramento puramente classico.

Contributi Fondamentali

  1. Spazio di Caratteristiche Unificato: Propone uno spazio di caratteristiche unificato composto da superfici di sfere indipendenti, collegando i domini classico e quantistico, con l'encoder classico che produce codifiche angolari (θ, γ)
  2. Funzione Metrica Proiettiva (PMeF): Utilizza innovativamente le coordinate in R³ per calcolare la similarità tra punti nello spazio degli stati quantistici, senza richiedere circuiti quantistici effettivi
  3. Tecniche di Stabilizzazione del Gradiente: Tecniche di gradiente progettate specificamente per PMeF che migliorano significativamente la stabilità e la convergenza dell'addestramento
  4. Inferenza Amichevole per NISQ: L'inferenza richiede solo 2 porte per qubit (RY e RZ), con profondità del circuito estremamente ridotta
  5. Supporto Multimodale: Primo metodo QML a supportare l'apprendimento multimodale (immagine-testo), raggiungendo un'accuratezza superiore al 90% in apprendimento 15-way 1-shot

Spiegazione Dettagliata del Metodo

Definizione del Compito

QPMeL mira ad imparare un encoder classico che mappi i dati di input x alle coordinate angolari (θ⃗, γ⃗), che possono essere utilizzate direttamente per parametrizzare porte quantistiche, generando stati quantistici con buona separabilità nello spazio di Hilbert.

Architettura del Modello

1. Encoder QPMeL

  • Struttura: Encoder metrico standard + blocco denso + strato di proiezione angolare
  • Output: Due vettori indipendenti θ⃗ ∈ 0,π^Q e γ⃗ ∈ -π,π^Q
  • Proiezione Angolare: Realizzata attraverso due strati densi paralleli, con output scalati all'intervallo desiderato

2. Generazione di Stati Quantistici

Lo stato non intrecciato di Q qubit generato è:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Funzione Metrica Proiettiva (PMeF)

PMeF calcola la fedeltà dello stato quantistico attraverso due passaggi chiave:

Passaggio 1: Conversione da Coordinate Polari a Coordinate Cartesiane

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Passaggio 2: Funzione Kernel Complessa (CKF) Per due stati quantistici |ψ⟩ e |ϕ⟩, la loro fedeltà può essere espressa come:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

dove:

  • λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
  • λ^c_q = x_q y'_q - y_q x'_q

Punti di Innovazione Tecnica

1. Progettazione dello Spazio di Caratteristiche Unificato

  • Sfrutta abilmente le sfere unitarie indipendenti come ponte tra i domini classico e quantistico
  • Corrisponde naturalmente alla struttura geometrica della sfera di Bloch di più qubit non intrecciati

2. Addestramento Classico Quantistico-Consapevole

  • Evita il problema degli altipiani sterili nell'addestramento dei circuiti quantistici
  • Ottimizza direttamente la similarità nello spazio quantistico nel dominio classico attraverso PMeF

3. Stabilizzazione del Gradiente

Durante l'addestramento, viene utilizzata la forma additiva per evitare la scomparsa del gradiente:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Configurazione Sperimentale

Dataset

  1. Classificazione Standard: MNIST, Fashion-MNIST
  2. Apprendimento con Pochi Esempi: Omniglot, MS-COCO Captions
  3. Apprendimento Multimodale: Coppie immagine-testo MS-COCO

Metriche di Valutazione

  • Accuratezza della classificazione
  • Accuratezza N-way K-shot nell'apprendimento con pochi esempi
  • Accuratezza del recupero cross-modale nei compiti multimodali

Metodi di Confronto

  • Hur, Araujo, and Park (2023)
  • Hou et al. (2023)
  • Huang, Shi, and Li (2025)
  • Wang et al. (2024)
  • Liu et al. (2022)

Dettagli di Implementazione

  • Ogni esperimento ripetuto 150 volte per calcolare intervalli di confidenza al 95%
  • Utilizzo della funzione di perdita prototipica per l'apprendimento metrico
  • Esperimenti multimodali che utilizzano l'architettura CLIP (BERT+Xception)

Risultati Sperimentali

Risultati Principali

1. Prestazioni di Classificazione Standard

Dataset MNIST:

  • Classificazione binaria: 99,8% ± 0,1% (0,1), 98,2% ± 0,4% (3,5)
  • Classificazione ternaria: 99,1% ± 0,5% (0,1,2), 98,9% ± 0,4% (3,5,6)
  • Classificazione a dieci classi: 96,3% ± 0,3%

Dataset Fashion-MNIST:

  • Classificazione binaria: 98,0% ± 0,6% (0,1)
  • Classificazione ternaria: 95,6% ± 0,5% (0,1,2)
  • Classificazione a dieci classi: 85,0% ± 0,3%

2. Prestazioni di Apprendimento con Pochi Esempi

Dataset Omniglot (N-Way-5-shot):

  • 2-way: 98,13% ± 0,49%
  • 5-way: 96,0% ± 0,5%
  • 10-way: 90,02% ± 0,42%

3. Prestazioni di Apprendimento Multimodale

Dataset MS-COCO (15-Way-1-shot):

  • Supporto immagine - Query testo: 94,71% ± 0,98% (classico), 95,87% ± 0,88% (quantistico)
  • Supporto testo - Query immagine: 93,60% ± 1,87% (classico), 93,07% ± 1,71% (quantistico)

Esperimenti di Ablazione

  1. Efficienza dei Qubit: Rispetto a Liu et al. che utilizza 64 qubit, QPMeL richiede solo 11-20 qubit per raggiungere prestazioni comparabili
  2. Profondità del Circuito: Solo 2 porte per qubit, riducendo significativamente la complessità del circuito
  3. Effetto della Stabilizzazione del Gradiente: La forma additiva di PMeF migliora significativamente la stabilità dell'addestramento

Scoperte Sperimentali

  1. Vantaggi di Scalabilità: QPMeL è l'unico metodo di apprendimento metrico quantistico in grado di scalare a classificazione a 10 classi
  2. Innovazione Multimodale: Primo metodo a realizzare l'apprendimento automatico quantistico multimodale
  3. Efficienza delle Risorse: Raggiunge prestazioni migliori o comparabili utilizzando significativamente meno qubit

Lavori Correlati

Metodi di Codifica Dati Quantistici

  1. Codifica Statica: Codifica angolare, codifica di ampiezza e altri metodi iniziali
  2. Codifica Addestrabile: QMeL e sue varianti
  3. Addestramento Ibrido: Metodi di ottimizzazione congiunta classico-quantistica

Apprendimento Metrico Quantistico

  • Lloyd et al. (2020): Primo a proporre il concetto di apprendimento metrico quantistico
  • Lavori successivi principalmente concentrati sul miglioramento della stabilità dell'addestramento e della scalabilità

Vantaggi di Questo Articolo

  • Evita completamente l'instabilità dell'addestramento quantistico
  • Primo a realizzare l'apprendimento automatico quantistico multimodale
  • Migliora significativamente l'efficienza dell'utilizzo delle risorse

Conclusioni e Discussione

Conclusioni Principali

  1. QPMeL risolve con successo il problema dell'instabilità dell'addestramento nell'apprendimento metrico quantistico
  2. Realizza l'apprendimento di codifiche quantistico-consapevoli attraverso addestramento puramente classico
  3. Raggiunge prestazioni SOTA su più compiti, utilizzando contemporaneamente meno risorse quantistiche
  4. Realizza per la prima volta l'apprendimento automatico quantistico multimodale

Limitazioni

  1. Limitazione dei Non-Intrecciati: QPMeL può imparare solo stati quantistici non intrecciati, il che potrebbe limitare lo sfruttamento di alcuni vantaggi quantistici
  2. Analisi Teorica Insufficiente: Manca un'analisi teorica approfondita dei vantaggi del metodo
  3. Verifica su Hardware Quantistico Reale: Gli esperimenti sono principalmente condotti su simulatori, mancando la verifica su dispositivi quantistici reali

Direzioni Future

  1. Estensione all'apprendimento di stati intrecciati
  2. Analisi teorica delle fonti dei vantaggi quantistici
  3. Verifica sperimentale su dispositivi NISQ reali
  4. Esplorazione di più scenari di applicazione dell'apprendimento automatico quantistico

Valutazione Approfondita

Punti di Forza

  1. Forte Innovatività: Propone un nuovo paradigma di addestramento classico quantistico-consapevole, evitando efficacemente il problema degli altipiani sterili
  2. Alto Valore Pratico: Il metodo è semplice ed efficiente, facilmente implementabile su dispositivi NISQ
  3. Esperimenti Completi: Dalla classificazione binaria all'apprendimento multimodale, la copertura sperimentale è ampia e i risultati convincenti
  4. Rigore Tecnico: La derivazione matematica di PMeF è rigorosa, con tecniche di stabilizzazione del gradiente supportate teoricamente
  5. Risultati Rivoluzionari: La prima realizzazione dell'apprendimento automatico quantistico multimodale ha un significato importante

Insufficienze

  1. Profondità Teorica: Manca un'analisi teorica approfondita del perché gli stati non intrecciati siano sufficienti
  2. Equità del Confronto: A causa dell'indisponibilità del codice dei metodi di base, l'equità dei risultati di confronto è discutibile
  3. Vantaggio Quantistico Poco Chiaro: Non riesce a chiarire esplicitamente la fonte dei vantaggi quantistici rispetto ai metodi puramente classici
  4. Verifica Hardware Mancante: Manca la verifica sperimentale su dispositivi quantistici reali

Impatto

  1. Contributo Accademico: Fornisce un nuovo paradigma di ricerca per l'apprendimento automatico quantistico, potenzialmente ispirando lavori successivi
  2. Valore Pratico: La natura NISQ-friendly del metodo gli conferisce potenziale di praticità a breve termine
  3. Avanzamento del Campo: La prima realizzazione dell'apprendimento automatico quantistico multimodale ha significato pioneristico

Scenari Applicabili

  1. Applicazioni nell'Era NISQ: Particolarmente adatto alle applicazioni con i vincoli dell'hardware quantistico attuale
  2. Compiti di Apprendimento Metrico: Vantaggioso nei compiti che richiedono l'apprendimento di metriche di similarità
  3. Applicazioni Multimodali: Apre nuovi percorsi per l'apprendimento automatico quantistico multimodale
  4. Validazione Concettuale: Adatto come metodo fondamentale per la validazione concettuale dell'apprendimento automatico quantistico

Bibliografia

L'articolo cita importanti lavori nei campi correlati dell'apprendimento automatico quantistico e dell'apprendimento metrico, inclusi:

  • Havlíček et al. (2019): Apprendimento supervisionato nello spazio di caratteristiche quantistici
  • McClean et al. (2018): Altipiani sterili nelle reti neurali quantistiche
  • Lloyd et al. (2020): Embedding quantistici per l'apprendimento automatico
  • Snell et al. (2017): Reti prototipiche per l'apprendimento con pochi esempi

Valutazione Complessiva: Questo è un articolo di alta qualità nell'apprendimento automatico quantistico che propone soluzioni innovative per affrontare le sfide critiche affrontate attualmente da QML. Sebbene presenti alcune insufficienze nell'analisi teorica, il suo valore pratico e l'innovatività lo rendono un contributo importante nel campo. In particolare, la prima realizzazione dell'apprendimento automatico quantistico multimodale apre nuove direzioni per la ricerca futura.