2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.
Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic

Plongements Quantiques Conscients Entraînés Classiquement via l'Apprentissage Métrique Projectif

Informations Fondamentales

  • ID de l'article : 2312.01655
  • Titre : Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
  • Auteurs : Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
  • Institutions : ¹Arizona State University, ²National Institute of Technology, Rourkela
  • Classification : quant-ph cs.AI
  • Date de publication : arXiv:2312.01655v4 quant-ph 16 Oct 2025
  • Lien de l'article : https://arxiv.org/abs/2312.01655

Résumé

L'apprentissage automatique quantique (QML) promet de fournir des représentations plus riches et des capacités d'apprentissage améliorées en exploitant les propriétés uniques du calcul quantique. Une première étape nécessaire pour utiliser le QML consiste à encoder les données classiques en états quantiques. Les mécanismes d'encodage statiques présentent une expressivité limitée, tandis que l'entraînement quantique est entravé par les plateaux arides (barren plateaus), rendant l'optimisation instable et inefficace. Cet article propose l'apprentissage métrique projectif quantique (QPMeL) — une approche consciente des quantiques, entraînée classiquement, pour apprendre des encodages quantiques denses et de haute qualité. QPMeL réalise ceci en mappant les données classiques vers des sphères unitaires indépendantes dans ℝ³, ce qui s'aligne naturellement avec les états de plusieurs qubits non intriqués. QPMeL introduit également une nouvelle fonction métrique projectile (PMeF) pour approximer la similarité dans l'espace de Hilbert, tandis que des techniques de stabilisation du gradient améliorent davantage l'efficacité de l'entraînement.

Contexte de Recherche et Motivation

Problèmes Fondamentaux

  1. Défis de l'encodage de données quantiques : L'encodage efficace des données classiques en états quantiques constitue un goulot d'étranglement clé du QML, la qualité de l'encodage déterminant directement la performance des modèles quantiques en aval
  2. Limitations des dispositifs NISQ : Les dispositifs quantiques actuels de taille moyenne bruyante (NISQ) possèdent un nombre limité de qubits, un temps de cohérence court et l'absence de correction d'erreurs robuste
  3. Problèmes de stabilité d'entraînement : Les encodages quantiques entraînables sont affectés par le phénomène des plateaux arides, entraînant une disparition des gradients, une instabilité d'entraînement et une consommation intensive de ressources

Limitations des Méthodes Existantes

  1. Méthodes d'encodage statique : Comme l'encodage d'amplitude et l'encodage angulaire, présentant une expressivité limitée, accédant généralement qu'à un petit sous-espace de l'espace de Hilbert
  2. Encodages quantiques entraînables : Bien que capables d'apprendre des encodages optimisés pour les tâches, ils sont affectés par les plateaux arides, rendant l'entraînement difficile et chronophage
  3. Méthodes d'entraînement hybride : Lors de l'optimisation conjointe des composants classiques et quantiques, elles restent gravement affectées par le problème des plateaux arides

Motivation de la Recherche

À l'ère NISQ, il existe un besoin urgent d'une méthode qui exploite à la fois les avantages quantiques et évite les problèmes d'entraînement quantique. QPMeL émerge pour apprendre des encodages conscients des quantiques par entraînement purement classique.

Contributions Fondamentales

  1. Espace de caractéristiques unifié : Propose un espace de caractéristiques unifié composé de surfaces de sphères indépendantes, reliant les domaines classique et quantique, avec un encodeur classique produisant des encodages angulaires (θ, γ)
  2. Fonction Métrique Projectile (PMeF) : Utilise de manière innovante les coordonnées ℝ³ pour calculer la similarité entre les points dans l'espace des états quantiques, sans nécessiter de circuits quantiques réels
  3. Techniques de Stabilisation du Gradient : Techniques de gradient conçues pour PMeF, améliorant significativement la stabilité et la convergence de l'entraînement
  4. Inférence Conviviale pour NISQ : L'inférence ne nécessite que 2 portes par qubit (RY et RZ), avec une profondeur de circuit extrêmement faible
  5. Support Multimodal : Première méthode QML supportant l'apprentissage multimodal (image-texte), atteignant plus de 90% de précision en apprentissage 15-voies-1-coup

Détails de la Méthode

Définition de la Tâche

QPMeL vise à apprendre un encodeur classique qui mappe les données d'entrée x vers les coordonnées angulaires (θ⃗, γ⃗), qui peuvent être directement utilisées pour paramétrer les portes quantiques, générant des états quantiques avec une bonne séparation dans l'espace de Hilbert.

Architecture du Modèle

1. Encodeur QPMeL

  • Structure : Encodeur métrique standard + bloc dense + couche de projection angulaire
  • Sortie : Deux vecteurs indépendants θ⃗ ∈ 0,π^Q et γ⃗ ∈ -π,π^Q
  • Projection Angulaire : Réalisée via deux couches denses parallèles, les sorties étant mises à l'échelle vers les plages souhaitées

2. Génération d'États Quantiques

L'état non intriqué de Q qubits généré est :

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Fonction Métrique Projectile (PMeF)

PMeF calcule la fidélité des états quantiques via deux étapes clés :

Étape 1 : Conversion de Coordonnées Polaires en Coordonnées Cartésiennes

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Étape 2 : Fonction Noyau Complexe (CKF) Pour deux états quantiques |ψ⟩ et |ϕ⟩, leur fidélité peut s'exprimer comme :

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

où :

  • λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
  • λ^c_q = x_q y'_q - y_q x'_q

Points d'Innovation Technique

1. Conception de l'Espace de Caractéristiques Unifié

  • Exploite astucieusement les sphères unitaires indépendantes comme pont entre les domaines classique et quantique
  • Correspond naturellement à la structure géométrique de la sphère de Bloch de plusieurs qubits non intriqués

2. Entraînement Classique Conscient des Quantiques

  • Évite le problème des plateaux arides dans l'entraînement des circuits quantiques
  • Optimise directement la similarité de l'espace quantique dans le domaine classique via PMeF

3. Stabilisation du Gradient

Lors de l'entraînement, une forme additive est utilisée pour éviter la disparition des gradients :

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Configuration Expérimentale

Ensembles de Données

  1. Classification Standard : MNIST, Fashion-MNIST
  2. Apprentissage Peu Supervisé : Omniglot, MS-COCO Captions
  3. Apprentissage Multimodal : Paires image-texte MS-COCO

Métriques d'Évaluation

  • Précision de classification
  • Précision N-voies-K-coups dans l'apprentissage peu supervisé
  • Précision de récupération inter-modale dans les tâches multimodales

Méthodes de Comparaison

  • Hur, Araujo, and Park (2023)
  • Hou et al. (2023)
  • Huang, Shi, and Li (2025)
  • Wang et al. (2024)
  • Liu et al. (2022)

Détails d'Implémentation

  • Chaque expérience répétée 150 fois pour calculer les intervalles de confiance à 95%
  • Utilisation de la fonction de perte prototypique pour l'apprentissage métrique
  • Les expériences multimodales adoptent l'architecture CLIP (BERT+Xception)

Résultats Expérimentaux

Résultats Principaux

1. Performance de Classification Standard

Ensemble de Données MNIST :

  • Classification binaire : 99,8% ± 0,1% (0,1), 98,2% ± 0,4% (3,5)
  • Classification ternaire : 99,1% ± 0,5% (0,1,2), 98,9% ± 0,4% (3,5,6)
  • Classification décimale : 96,3% ± 0,3%

Ensemble de Données Fashion-MNIST :

  • Classification binaire : 98,0% ± 0,6% (0,1)
  • Classification ternaire : 95,6% ± 0,5% (0,1,2)
  • Classification décimale : 85,0% ± 0,3%

2. Performance d'Apprentissage Peu Supervisé

Ensemble de Données Omniglot (N-Voies-5-Coups) :

  • 2-voies : 98,13% ± 0,49%
  • 5-voies : 96,0% ± 0,5%
  • 10-voies : 90,02% ± 0,42%

3. Performance d'Apprentissage Multimodal

Ensemble de Données MS-COCO (15-Voies-1-Coup) :

  • Support image - Requête texte : 94,71% ± 0,98% (classique), 95,87% ± 0,88% (quantique)
  • Support texte - Requête image : 93,60% ± 1,87% (classique), 93,07% ± 1,71% (quantique)

Études d'Ablation

  1. Efficacité des Qubits : Comparé à Liu et al. utilisant 64 qubits, QPMeL ne nécessite que 11-20 qubits pour atteindre une performance comparable
  2. Profondeur du Circuit : Seulement 2 portes par qubit, réduisant significativement la complexité du circuit
  3. Effet de Stabilisation du Gradient : La forme additive de PMeF améliore considérablement la stabilité de l'entraînement

Découvertes Expérimentales

  1. Avantages d'Extensibilité : QPMeL est la seule méthode d'apprentissage métrique quantique capable de s'étendre à la classification à 10 classes
  2. Percée Multimodale : Première méthode réalisant l'apprentissage automatique quantique multimodal
  3. Efficacité des Ressources : Réalise une performance meilleure ou comparable en utilisant significativement moins de qubits

Travaux Connexes

Méthodes d'Encodage de Données Quantiques

  1. Encodage Statique : Encodage angulaire, encodage d'amplitude et autres méthodes précoces
  2. Encodage Entraînable : QMeL et ses variantes
  3. Entraînement Hybride : Méthodes d'optimisation conjointe classique-quantique

Apprentissage Métrique Quantique

  • Lloyd et al. (2020) : Première proposition du concept d'apprentissage métrique quantique
  • Les travaux ultérieurs se concentrent principalement sur l'amélioration de la stabilité d'entraînement et de l'extensibilité

Avantages de Cet Article

  • Évite complètement l'instabilité de l'entraînement quantique
  • Première réalisation de l'apprentissage automatique quantique multimodal
  • Amélioration significative de l'efficacité d'utilisation des ressources

Conclusion et Discussion

Conclusions Principales

  1. QPMeL résout avec succès le problème d'instabilité d'entraînement dans l'apprentissage métrique quantique
  2. Réalise l'apprentissage d'encodages conscients des quantiques par entraînement purement classique
  3. Atteint une performance SOTA sur plusieurs tâches tout en utilisant moins de ressources quantiques
  4. Première réalisation de l'apprentissage automatique quantique multimodal

Limitations

  1. Limitation de Non-Intrication : QPMeL ne peut apprendre que des états quantiques non intriqués, pouvant potentiellement limiter l'exploitation de certains avantages quantiques
  2. Analyse Théorique Insuffisante : Manque d'analyse théorique approfondie des avantages de la méthode
  3. Vérification sur Matériel Quantique Réel : Les expériences sont principalement menées sur simulateurs, manquant de vérification sur dispositifs quantiques réels

Directions Futures

  1. Extension à l'apprentissage d'états intriqués
  2. Analyse théorique des sources d'avantages quantiques
  3. Vérification expérimentale sur dispositifs NISQ réels
  4. Exploration de scénarios d'application supplémentaires en apprentissage automatique quantique

Évaluation Approfondie

Points Forts

  1. Innovation Forte : Propose un nouveau paradigme d'entraînement classique conscient des quantiques, évitant efficacement le problème des plateaux arides
  2. Valeur Pratique Élevée : La méthode est simple, efficace et facile à implémenter sur dispositifs NISQ
  3. Expériences Complètes : De la classification binaire à l'apprentissage multimodal, couverture expérimentale large avec résultats convaincants
  4. Rigueur Technique : La dérivation mathématique de PMeF est rigoureuse, les techniques de stabilisation du gradient sont théoriquement fondées
  5. Résultats Révolutionnaires : La première réalisation de l'apprentissage automatique quantique multimodal revêt une importance significative

Insuffisances

  1. Profondeur Théorique : Manque d'analyse théorique approfondie sur pourquoi les états non intriqués suffisent
  2. Équité de la Comparaison : En raison de l'indisponibilité du code des méthodes de base, l'équité des résultats de comparaison est discutable
  3. Avantage Quantique Peu Clair : N'articule pas clairement les sources d'avantages quantiques par rapport aux méthodes purement classiques
  4. Vérification Matérielle Manquante : Manque de vérification expérimentale sur dispositifs quantiques réels

Impact

  1. Contribution Académique : Fournit un nouveau paradigme de recherche pour l'apprentissage automatique quantique, pouvant inspirer les travaux ultérieurs
  2. Valeur Pratique : La convivialité NISQ de la méthode lui confère un potentiel de mise en œuvre pratique à court terme
  3. Avancement du Domaine : La première réalisation de l'apprentissage automatique quantique multimodal revêt une importance pionnière

Scénarios d'Application

  1. Applications à l'Ère NISQ : Particulièrement adaptée aux applications sous les contraintes du matériel quantique actuel
  2. Tâches d'Apprentissage Métrique : Présente des avantages dans les tâches nécessitant d'apprendre des mesures de similarité
  3. Applications Multimodales : Ouvre une nouvelle voie pour l'apprentissage automatique quantique multimodal
  4. Validation de Concepts : Appropriée comme méthode fondamentale pour la validation de concepts en apprentissage automatique quantique

Références

L'article cite des travaux importants dans les domaines connexes de l'apprentissage automatique quantique et de l'apprentissage métrique, notamment :

  • Havlíček et al. (2019) : Apprentissage supervisé dans les espaces de caractéristiques quantiques
  • McClean et al. (2018) : Plateaux arides dans les réseaux de neurones quantiques
  • Lloyd et al. (2020) : Plongements quantiques pour l'apprentissage automatique
  • Snell et al. (2017) : Réseaux prototypiques pour l'apprentissage peu supervisé

Évaluation Globale : Ceci est un article de haute qualité en apprentissage automatique quantique, proposant une solution innovante aux défis clés actuels du QML. Bien que présentant certaines insuffisances dans l'analyse théorique, sa valeur pratique et son innovation en font une contribution importante au domaine. En particulier, la première réalisation de l'apprentissage automatique quantique multimodal ouvre de nouvelles directions pour la recherche future.