2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.

Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(Î¸)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.

academic

Incrustaciones Cuánticas Conscientes Entrenadas Clásicamente mediante Aprendizaje de Métrica Proyectiva

Información Básica

ID del Artículo: 2312.01655
Título: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
Autores: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
Instituciones: ¹Arizona State University, ²National Institute of Technology, Rourkela
Clasificación: quant-ph cs.AI
Fecha de Publicación: arXiv:2312.01655v4 quant-ph 16 Oct 2025
Enlace del Artículo: https://arxiv.org/abs/2312.01655

Resumen

El aprendizaje automático cuántico (QML) promete proporcionar representaciones más ricas y capacidades de aprendizaje mejoradas al aprovechar las propiedades únicas de la computación cuántica. Un primer paso necesario para utilizar QML es codificar datos clásicos en estados cuánticos. Los mecanismos de codificación estática tienen capacidad expresiva limitada, mientras que el entrenamiento cuántico se ve afectado por mesetas áridas (barren plateaus), lo que hace que la optimización sea inestable e ineficiente. Este artículo propone el Aprendizaje de Métrica Proyectiva Cuántica (QPMeL), un método consciente de lo cuántico y entrenado clásicamente para aprender incrustaciones cuánticas densas y de alta calidad. QPMeL logra esto mapeando datos clásicos a esferas unitarias independientes en ℝ³, que se alinean naturalmente con los estados de múltiples qubits no entrelazados. QPMeL también introduce una novedosa función de métrica proyectiva (PMeF) para aproximar la similitud en el espacio de Hilbert, y técnicas de estabilización de gradientes mejoran aún más la eficiencia del entrenamiento.

Antecedentes de Investigación y Motivación

Problemas Centrales

Desafíos en la Codificación de Datos Cuánticos: La codificación efectiva de datos clásicos en estados cuánticos es un cuello de botella crítico en QML, y la calidad de la codificación determina directamente el rendimiento de los modelos cuánticos posteriores
Limitaciones de Dispositivos NISQ: Los dispositivos cuánticos de escala intermedia ruidosa (NISQ) actuales tienen un número limitado de qubits, tiempos de coherencia cortos y carecen de corrección de errores robusta
Problemas de Estabilidad del Entrenamiento: Las codificaciones cuánticas entrenables se ven afectadas por el fenómeno de mesetas áridas, lo que resulta en desvanecimiento de gradientes, entrenamiento inestable y consumo intensivo de recursos

Limitaciones de Métodos Existentes

Métodos de Codificación Estática: Como la codificación de amplitud y codificación angular tienen capacidad expresiva limitada, típicamente solo accediendo a pequeños subespacios del espacio de Hilbert
Codificaciones Cuánticas Entrenables: Aunque pueden aprender codificaciones optimizadas para tareas, se ven afectadas por mesetas áridas, lo que dificulta y consume tiempo el entrenamiento
Métodos de Entrenamiento Híbrido: Al optimizar conjuntamente componentes clásicos y cuánticos, aún se ven gravemente afectados por el problema de mesetas áridas

Motivación de la Investigación

En la era NISQ, existe una necesidad urgente de un método que pueda aprovechar las ventajas cuánticas mientras evita los problemas del entrenamiento cuántico. QPMeL surge con el objetivo de aprender codificaciones conscientes de lo cuántico mediante entrenamiento puramente clásico.

Contribuciones Principales

Espacio de Características Unificado: Propone un espacio de características unificado compuesto por superficies de esferas independientes, conectando los dominios clásico y cuántico, con salida de codificador clásico de ángulos (θ, γ)
Función de Métrica Proyectiva (PMeF): Utiliza innovadoramente coordenadas en ℝ³ para calcular la similitud entre puntos en el espacio de estados cuánticos, sin necesidad de circuitos cuánticos reales
Técnicas de Estabilización de Gradientes: Técnicas de gradientes diseñadas específicamente para PMeF que mejoran significativamente la estabilidad del entrenamiento y la convergencia
Inferencia Amigable con NISQ: La inferencia requiere solo 2 puertas por qubit (RY y RZ), con profundidad de circuito extremadamente superficial
Soporte Multimodal: Primer método QML que admite aprendizaje multimodal (imagen-texto), logrando más del 90% de precisión en aprendizaje de 15 vías 1 disparo

Explicación Detallada del Método

Definición de la Tarea

QPMeL tiene como objetivo aprender un codificador clásico que mapee datos de entrada x a coordenadas angulares (θ⃗, γ⃗), que pueden usarse directamente para parametrizar puertas cuánticas, generando estados cuánticos con buena separabilidad en el espacio de Hilbert.

Arquitectura del Modelo

1. Codificador QPMeL

Estructura: Codificador de métrica estándar + bloque denso + capa de proyección angular
Salida: Dos vectores independientes θ⃗ ∈ 0,π^Q y γ⃗ ∈ -π,π^Q
Proyección Angular: Implementada mediante dos capas densas paralelas, con salidas escaladas al rango deseado

2. Generación de Estados Cuánticos

El estado de Q qubits no entrelazados generado es:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Función de Métrica Proyectiva (PMeF)

PMeF calcula la fidelidad de estados cuánticos mediante dos pasos clave:

Paso 1: Conversión de Coordenadas Polares a Cartesianas

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Paso 2: Función Núcleo Compleja (CKF) Para dos estados cuánticos |ψ⟩ y |ϕ⟩, su fidelidad puede expresarse como:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

donde:

λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
λ^c_q = x_q y'_q - y_q x'_q

Puntos de Innovación Técnica

1. Diseño del Espacio de Características Unificado

Aprovecha ingeniosamente esferas unitarias independientes como puente entre los dominios clásico y cuántico
Corresponde naturalmente a la estructura geométrica de la esfera de Bloch de múltiples qubits no entrelazados

2. Entrenamiento Clásico Consciente de lo Cuántico

Evita el problema de mesetas áridas en el entrenamiento de circuitos cuánticos
Optimiza directamente la similitud en el espacio cuántico en el dominio clásico mediante PMeF

3. Estabilización de Gradientes

Durante el entrenamiento se utiliza la forma aditiva para evitar desvanecimiento de gradientes:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Configuración Experimental

Conjuntos de Datos

Clasificación Estándar: MNIST, Fashion-MNIST
Aprendizaje Pocos Disparos: Omniglot, MS-COCO Captions
Aprendizaje Multimodal: Pares imagen-texto MS-COCO

Métricas de Evaluación

Precisión de clasificación
Precisión de N vías K disparos en aprendizaje pocos disparos
Precisión de recuperación entre modalidades en tareas multimodales

Métodos de Comparación

Hur, Araujo, and Park (2023)
Hou et al. (2023)
Huang, Shi, and Li (2025)
Wang et al. (2024)
Liu et al. (2022)

Detalles de Implementación

Cada experimento se repite 150 veces para calcular intervalos de confianza del 95%
Se utiliza función de pérdida prototípica para aprendizaje de métrica
Experimentos multimodales utilizan arquitectura CLIP (BERT+Xception)

Resultados Experimentales

Resultados Principales

1. Rendimiento de Clasificación Estándar

Conjunto de Datos MNIST:

Clasificación binaria: 99.8% ± 0.1% (0,1), 98.2% ± 0.4% (3,5)
Clasificación ternaria: 99.1% ± 0.5% (0,1,2), 98.9% ± 0.4% (3,5,6)
Clasificación de diez clases: 96.3% ± 0.3%

Conjunto de Datos Fashion-MNIST:

Clasificación binaria: 98.0% ± 0.6% (0,1)
Clasificación ternaria: 95.6% ± 0.5% (0,1,2)
Clasificación de diez clases: 85.0% ± 0.3%

2. Rendimiento de Aprendizaje Pocos Disparos

Conjunto de Datos Omniglot (N-Vías-5-Disparos):

2 vías: 98.13% ± 0.49%
5 vías: 96.0% ± 0.5%
10 vías: 90.02% ± 0.42%

3. Rendimiento de Aprendizaje Multimodal

Conjunto de Datos MS-COCO (15-Vías-1-Disparo):

Soporte de imagen-consulta de texto: 94.71% ± 0.98% (clásico), 95.87% ± 0.88% (cuántico)
Soporte de texto-consulta de imagen: 93.60% ± 1.87% (clásico), 93.07% ± 1.71% (cuántico)

Experimentos de Ablación

Eficiencia de Qubits: En comparación con Liu et al. que utiliza 64 qubits, QPMeL requiere solo 11-20 qubits para lograr rendimiento comparable
Profundidad del Circuito: Solo 2 puertas por qubit, reduciendo significativamente la complejidad del circuito
Efecto de Estabilización de Gradientes: La forma aditiva de PMeF mejora significativamente la estabilidad del entrenamiento

Hallazgos Experimentales

Ventaja de Escalabilidad: QPMeL es el único método de aprendizaje de métrica cuántica que puede escalar a clasificación de 10 clases
Avance Multimodal: Primer método que implementa aprendizaje automático cuántico multimodal
Eficiencia de Recursos: Logra rendimiento mejor o comparable utilizando significativamente menos qubits

Trabajo Relacionado

Métodos de Codificación de Datos Cuánticos

Codificación Estática: Métodos tempranos como codificación angular y codificación de amplitud
Codificación Entrenable: QMeL y sus variantes
Entrenamiento Híbrido: Métodos de optimización conjunta clásico-cuántica

Aprendizaje de Métrica Cuántica

Lloyd et al. (2020): Primer concepto de aprendizaje de métrica cuántica
Trabajos posteriores enfocados principalmente en mejorar la estabilidad del entrenamiento y la escalabilidad

Ventajas de Este Artículo

Evita completamente la inestabilidad del entrenamiento cuántico
Primera implementación de aprendizaje automático cuántico multimodal
Mejora significativa en la eficiencia de utilización de recursos

Conclusiones y Discusión

Conclusiones Principales

QPMeL resuelve exitosamente el problema de inestabilidad del entrenamiento en aprendizaje de métrica cuántica
Logra aprendizaje de codificaciones conscientes de lo cuántico mediante entrenamiento puramente clásico
Alcanza rendimiento de última generación en múltiples tareas mientras utiliza menos recursos cuánticos
Primera implementación de aprendizaje automático cuántico multimodal

Limitaciones

Restricción de No Entrelazamiento: QPMeL solo puede aprender estados cuánticos no entrelazados, lo que potencialmente limita la explotación de ciertas ventajas cuánticas
Análisis Teórico Insuficiente: Falta análisis teórico profundo sobre las ventajas teóricas del método
Verificación en Hardware Cuántico Real: Los experimentos se realizan principalmente en simuladores, careciendo de verificación en dispositivos cuánticos reales

Direcciones Futuras

Extensión al aprendizaje de estados entrelazados
Análisis teórico de las fuentes de ventaja cuántica
Verificación experimental en dispositivos NISQ reales
Exploración de más escenarios de aplicación en aprendizaje automático cuántico

Evaluación Profunda

Fortalezas

Innovación Fuerte: Propone un nuevo paradigma de entrenamiento clásico consciente de lo cuántico, evitando efectivamente el problema de mesetas áridas
Alto Valor Práctico: El método es simple y eficiente, fácil de implementar en dispositivos NISQ
Experimentos Exhaustivos: Cobertura experimental amplia desde clasificación binaria hasta aprendizaje multimodal, con resultados convincentes
Rigor Técnico: La derivación matemática de PMeF es rigurosa, con soporte teórico para técnicas de estabilización de gradientes
Logros Innovadores: Primera implementación de aprendizaje automático cuántico multimodal, con significado importante

Deficiencias

Profundidad Teórica: Falta análisis teórico profundo sobre por qué los estados no entrelazados son suficientes
Equidad de Comparación: Debido a la indisponibilidad de código de métodos de referencia, existe incertidumbre sobre la equidad de los resultados comparativos
Ventaja Cuántica Poco Clara: No articula claramente la fuente de ventaja cuántica en comparación con métodos puramente clásicos
Verificación de Hardware Ausente: Falta verificación experimental en dispositivos cuánticos reales

Impacto

Contribución Académica: Proporciona un nuevo paradigma de investigación para aprendizaje automático cuántico, potencialmente inspirando trabajos posteriores
Valor Práctico: La naturaleza amigable con NISQ del método le confiere potencial de aplicación práctica a corto plazo
Avance del Campo: La primera implementación de aprendizaje automático cuántico multimodal tiene significado pionero

Escenarios Aplicables

Aplicaciones en la Era NISQ: Particularmente adecuado para aplicaciones bajo limitaciones actuales de hardware cuántico
Tareas de Aprendizaje de Métrica: Ventajoso en tareas que requieren aprender métricas de similitud
Aplicaciones Multimodales: Abre nuevos caminos para aprendizaje cuántico multimodal
Verificación de Conceptos: Adecuado como método base para verificación de conceptos en aprendizaje automático cuántico

Referencias

El artículo cita trabajos importantes en aprendizaje automático cuántico, aprendizaje de métrica y campos relacionados, incluyendo:

Havlíček et al. (2019): Aprendizaje supervisado en espacios de características cuánticas
McClean et al. (2018): Mesetas áridas en redes neuronales cuánticas
Lloyd et al. (2020): Incrustaciones cuánticas para aprendizaje automático
Snell et al. (2017): Redes prototípicas para aprendizaje pocos disparos

Evaluación General: Este es un artículo de alta calidad en aprendizaje automático cuántico que propone soluciones innovadoras para abordar desafíos clave que enfrenta actualmente QML. Aunque existen algunas deficiencias en el análisis teórico, su valor práctico e innovación lo convierten en una contribución importante al campo. En particular, la primera implementación de aprendizaje automático cuántico multimodal abre nuevas direcciones para investigación futura.