2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.
Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic

Incrustaciones Cuánticas Conscientes Entrenadas Clásicamente mediante Aprendizaje de Métrica Proyectiva

Información Básica

  • ID del Artículo: 2312.01655
  • Título: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
  • Autores: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
  • Instituciones: ¹Arizona State University, ²National Institute of Technology, Rourkela
  • Clasificación: quant-ph cs.AI
  • Fecha de Publicación: arXiv:2312.01655v4 quant-ph 16 Oct 2025
  • Enlace del Artículo: https://arxiv.org/abs/2312.01655

Resumen

El aprendizaje automático cuántico (QML) promete proporcionar representaciones más ricas y capacidades de aprendizaje mejoradas al aprovechar las propiedades únicas de la computación cuántica. Un primer paso necesario para utilizar QML es codificar datos clásicos en estados cuánticos. Los mecanismos de codificación estática tienen capacidad expresiva limitada, mientras que el entrenamiento cuántico se ve afectado por mesetas áridas (barren plateaus), lo que hace que la optimización sea inestable e ineficiente. Este artículo propone el Aprendizaje de Métrica Proyectiva Cuántica (QPMeL), un método consciente de lo cuántico y entrenado clásicamente para aprender incrustaciones cuánticas densas y de alta calidad. QPMeL logra esto mapeando datos clásicos a esferas unitarias independientes en ℝ³, que se alinean naturalmente con los estados de múltiples qubits no entrelazados. QPMeL también introduce una novedosa función de métrica proyectiva (PMeF) para aproximar la similitud en el espacio de Hilbert, y técnicas de estabilización de gradientes mejoran aún más la eficiencia del entrenamiento.

Antecedentes de Investigación y Motivación

Problemas Centrales

  1. Desafíos en la Codificación de Datos Cuánticos: La codificación efectiva de datos clásicos en estados cuánticos es un cuello de botella crítico en QML, y la calidad de la codificación determina directamente el rendimiento de los modelos cuánticos posteriores
  2. Limitaciones de Dispositivos NISQ: Los dispositivos cuánticos de escala intermedia ruidosa (NISQ) actuales tienen un número limitado de qubits, tiempos de coherencia cortos y carecen de corrección de errores robusta
  3. Problemas de Estabilidad del Entrenamiento: Las codificaciones cuánticas entrenables se ven afectadas por el fenómeno de mesetas áridas, lo que resulta en desvanecimiento de gradientes, entrenamiento inestable y consumo intensivo de recursos

Limitaciones de Métodos Existentes

  1. Métodos de Codificación Estática: Como la codificación de amplitud y codificación angular tienen capacidad expresiva limitada, típicamente solo accediendo a pequeños subespacios del espacio de Hilbert
  2. Codificaciones Cuánticas Entrenables: Aunque pueden aprender codificaciones optimizadas para tareas, se ven afectadas por mesetas áridas, lo que dificulta y consume tiempo el entrenamiento
  3. Métodos de Entrenamiento Híbrido: Al optimizar conjuntamente componentes clásicos y cuánticos, aún se ven gravemente afectados por el problema de mesetas áridas

Motivación de la Investigación

En la era NISQ, existe una necesidad urgente de un método que pueda aprovechar las ventajas cuánticas mientras evita los problemas del entrenamiento cuántico. QPMeL surge con el objetivo de aprender codificaciones conscientes de lo cuántico mediante entrenamiento puramente clásico.

Contribuciones Principales

  1. Espacio de Características Unificado: Propone un espacio de características unificado compuesto por superficies de esferas independientes, conectando los dominios clásico y cuántico, con salida de codificador clásico de ángulos (θ, γ)
  2. Función de Métrica Proyectiva (PMeF): Utiliza innovadoramente coordenadas en ℝ³ para calcular la similitud entre puntos en el espacio de estados cuánticos, sin necesidad de circuitos cuánticos reales
  3. Técnicas de Estabilización de Gradientes: Técnicas de gradientes diseñadas específicamente para PMeF que mejoran significativamente la estabilidad del entrenamiento y la convergencia
  4. Inferencia Amigable con NISQ: La inferencia requiere solo 2 puertas por qubit (RY y RZ), con profundidad de circuito extremadamente superficial
  5. Soporte Multimodal: Primer método QML que admite aprendizaje multimodal (imagen-texto), logrando más del 90% de precisión en aprendizaje de 15 vías 1 disparo

Explicación Detallada del Método

Definición de la Tarea

QPMeL tiene como objetivo aprender un codificador clásico que mapee datos de entrada x a coordenadas angulares (θ⃗, γ⃗), que pueden usarse directamente para parametrizar puertas cuánticas, generando estados cuánticos con buena separabilidad en el espacio de Hilbert.

Arquitectura del Modelo

1. Codificador QPMeL

  • Estructura: Codificador de métrica estándar + bloque denso + capa de proyección angular
  • Salida: Dos vectores independientes θ⃗ ∈ 0,π^Q y γ⃗ ∈ -π,π^Q
  • Proyección Angular: Implementada mediante dos capas densas paralelas, con salidas escaladas al rango deseado

2. Generación de Estados Cuánticos

El estado de Q qubits no entrelazados generado es:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Función de Métrica Proyectiva (PMeF)

PMeF calcula la fidelidad de estados cuánticos mediante dos pasos clave:

Paso 1: Conversión de Coordenadas Polares a Cartesianas

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Paso 2: Función Núcleo Compleja (CKF) Para dos estados cuánticos |ψ⟩ y |ϕ⟩, su fidelidad puede expresarse como:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

donde:

  • λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
  • λ^c_q = x_q y'_q - y_q x'_q

Puntos de Innovación Técnica

1. Diseño del Espacio de Características Unificado

  • Aprovecha ingeniosamente esferas unitarias independientes como puente entre los dominios clásico y cuántico
  • Corresponde naturalmente a la estructura geométrica de la esfera de Bloch de múltiples qubits no entrelazados

2. Entrenamiento Clásico Consciente de lo Cuántico

  • Evita el problema de mesetas áridas en el entrenamiento de circuitos cuánticos
  • Optimiza directamente la similitud en el espacio cuántico en el dominio clásico mediante PMeF

3. Estabilización de Gradientes

Durante el entrenamiento se utiliza la forma aditiva para evitar desvanecimiento de gradientes:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Configuración Experimental

Conjuntos de Datos

  1. Clasificación Estándar: MNIST, Fashion-MNIST
  2. Aprendizaje Pocos Disparos: Omniglot, MS-COCO Captions
  3. Aprendizaje Multimodal: Pares imagen-texto MS-COCO

Métricas de Evaluación

  • Precisión de clasificación
  • Precisión de N vías K disparos en aprendizaje pocos disparos
  • Precisión de recuperación entre modalidades en tareas multimodales

Métodos de Comparación

  • Hur, Araujo, and Park (2023)
  • Hou et al. (2023)
  • Huang, Shi, and Li (2025)
  • Wang et al. (2024)
  • Liu et al. (2022)

Detalles de Implementación

  • Cada experimento se repite 150 veces para calcular intervalos de confianza del 95%
  • Se utiliza función de pérdida prototípica para aprendizaje de métrica
  • Experimentos multimodales utilizan arquitectura CLIP (BERT+Xception)

Resultados Experimentales

Resultados Principales

1. Rendimiento de Clasificación Estándar

Conjunto de Datos MNIST:

  • Clasificación binaria: 99.8% ± 0.1% (0,1), 98.2% ± 0.4% (3,5)
  • Clasificación ternaria: 99.1% ± 0.5% (0,1,2), 98.9% ± 0.4% (3,5,6)
  • Clasificación de diez clases: 96.3% ± 0.3%

Conjunto de Datos Fashion-MNIST:

  • Clasificación binaria: 98.0% ± 0.6% (0,1)
  • Clasificación ternaria: 95.6% ± 0.5% (0,1,2)
  • Clasificación de diez clases: 85.0% ± 0.3%

2. Rendimiento de Aprendizaje Pocos Disparos

Conjunto de Datos Omniglot (N-Vías-5-Disparos):

  • 2 vías: 98.13% ± 0.49%
  • 5 vías: 96.0% ± 0.5%
  • 10 vías: 90.02% ± 0.42%

3. Rendimiento de Aprendizaje Multimodal

Conjunto de Datos MS-COCO (15-Vías-1-Disparo):

  • Soporte de imagen-consulta de texto: 94.71% ± 0.98% (clásico), 95.87% ± 0.88% (cuántico)
  • Soporte de texto-consulta de imagen: 93.60% ± 1.87% (clásico), 93.07% ± 1.71% (cuántico)

Experimentos de Ablación

  1. Eficiencia de Qubits: En comparación con Liu et al. que utiliza 64 qubits, QPMeL requiere solo 11-20 qubits para lograr rendimiento comparable
  2. Profundidad del Circuito: Solo 2 puertas por qubit, reduciendo significativamente la complejidad del circuito
  3. Efecto de Estabilización de Gradientes: La forma aditiva de PMeF mejora significativamente la estabilidad del entrenamiento

Hallazgos Experimentales

  1. Ventaja de Escalabilidad: QPMeL es el único método de aprendizaje de métrica cuántica que puede escalar a clasificación de 10 clases
  2. Avance Multimodal: Primer método que implementa aprendizaje automático cuántico multimodal
  3. Eficiencia de Recursos: Logra rendimiento mejor o comparable utilizando significativamente menos qubits

Trabajo Relacionado

Métodos de Codificación de Datos Cuánticos

  1. Codificación Estática: Métodos tempranos como codificación angular y codificación de amplitud
  2. Codificación Entrenable: QMeL y sus variantes
  3. Entrenamiento Híbrido: Métodos de optimización conjunta clásico-cuántica

Aprendizaje de Métrica Cuántica

  • Lloyd et al. (2020): Primer concepto de aprendizaje de métrica cuántica
  • Trabajos posteriores enfocados principalmente en mejorar la estabilidad del entrenamiento y la escalabilidad

Ventajas de Este Artículo

  • Evita completamente la inestabilidad del entrenamiento cuántico
  • Primera implementación de aprendizaje automático cuántico multimodal
  • Mejora significativa en la eficiencia de utilización de recursos

Conclusiones y Discusión

Conclusiones Principales

  1. QPMeL resuelve exitosamente el problema de inestabilidad del entrenamiento en aprendizaje de métrica cuántica
  2. Logra aprendizaje de codificaciones conscientes de lo cuántico mediante entrenamiento puramente clásico
  3. Alcanza rendimiento de última generación en múltiples tareas mientras utiliza menos recursos cuánticos
  4. Primera implementación de aprendizaje automático cuántico multimodal

Limitaciones

  1. Restricción de No Entrelazamiento: QPMeL solo puede aprender estados cuánticos no entrelazados, lo que potencialmente limita la explotación de ciertas ventajas cuánticas
  2. Análisis Teórico Insuficiente: Falta análisis teórico profundo sobre las ventajas teóricas del método
  3. Verificación en Hardware Cuántico Real: Los experimentos se realizan principalmente en simuladores, careciendo de verificación en dispositivos cuánticos reales

Direcciones Futuras

  1. Extensión al aprendizaje de estados entrelazados
  2. Análisis teórico de las fuentes de ventaja cuántica
  3. Verificación experimental en dispositivos NISQ reales
  4. Exploración de más escenarios de aplicación en aprendizaje automático cuántico

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Propone un nuevo paradigma de entrenamiento clásico consciente de lo cuántico, evitando efectivamente el problema de mesetas áridas
  2. Alto Valor Práctico: El método es simple y eficiente, fácil de implementar en dispositivos NISQ
  3. Experimentos Exhaustivos: Cobertura experimental amplia desde clasificación binaria hasta aprendizaje multimodal, con resultados convincentes
  4. Rigor Técnico: La derivación matemática de PMeF es rigurosa, con soporte teórico para técnicas de estabilización de gradientes
  5. Logros Innovadores: Primera implementación de aprendizaje automático cuántico multimodal, con significado importante

Deficiencias

  1. Profundidad Teórica: Falta análisis teórico profundo sobre por qué los estados no entrelazados son suficientes
  2. Equidad de Comparación: Debido a la indisponibilidad de código de métodos de referencia, existe incertidumbre sobre la equidad de los resultados comparativos
  3. Ventaja Cuántica Poco Clara: No articula claramente la fuente de ventaja cuántica en comparación con métodos puramente clásicos
  4. Verificación de Hardware Ausente: Falta verificación experimental en dispositivos cuánticos reales

Impacto

  1. Contribución Académica: Proporciona un nuevo paradigma de investigación para aprendizaje automático cuántico, potencialmente inspirando trabajos posteriores
  2. Valor Práctico: La naturaleza amigable con NISQ del método le confiere potencial de aplicación práctica a corto plazo
  3. Avance del Campo: La primera implementación de aprendizaje automático cuántico multimodal tiene significado pionero

Escenarios Aplicables

  1. Aplicaciones en la Era NISQ: Particularmente adecuado para aplicaciones bajo limitaciones actuales de hardware cuántico
  2. Tareas de Aprendizaje de Métrica: Ventajoso en tareas que requieren aprender métricas de similitud
  3. Aplicaciones Multimodales: Abre nuevos caminos para aprendizaje cuántico multimodal
  4. Verificación de Conceptos: Adecuado como método base para verificación de conceptos en aprendizaje automático cuántico

Referencias

El artículo cita trabajos importantes en aprendizaje automático cuántico, aprendizaje de métrica y campos relacionados, incluyendo:

  • Havlíček et al. (2019): Aprendizaje supervisado en espacios de características cuánticas
  • McClean et al. (2018): Mesetas áridas en redes neuronales cuánticas
  • Lloyd et al. (2020): Incrustaciones cuánticas para aprendizaje automático
  • Snell et al. (2017): Redes prototípicas para aprendizaje pocos disparos

Evaluación General: Este es un artículo de alta calidad en aprendizaje automático cuántico que propone soluciones innovadoras para abordar desafíos clave que enfrenta actualmente QML. Aunque existen algunas deficiencias en el análisis teórico, su valor práctico e innovación lo convierten en una contribución importante al campo. En particular, la primera implementación de aprendizaje automático cuántico multimodal abre nuevas direcciones para investigación futura.