Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic
Incrustaciones Cuánticas Conscientes Entrenadas Clásicamente mediante Aprendizaje de Métrica Proyectiva
El aprendizaje automático cuántico (QML) promete proporcionar representaciones más ricas y capacidades de aprendizaje mejoradas al aprovechar las propiedades únicas de la computación cuántica. Un primer paso necesario para utilizar QML es codificar datos clásicos en estados cuánticos. Los mecanismos de codificación estática tienen capacidad expresiva limitada, mientras que el entrenamiento cuántico se ve afectado por mesetas áridas (barren plateaus), lo que hace que la optimización sea inestable e ineficiente. Este artículo propone el Aprendizaje de Métrica Proyectiva Cuántica (QPMeL), un método consciente de lo cuántico y entrenado clásicamente para aprender incrustaciones cuánticas densas y de alta calidad. QPMeL logra esto mapeando datos clásicos a esferas unitarias independientes en ℝ³, que se alinean naturalmente con los estados de múltiples qubits no entrelazados. QPMeL también introduce una novedosa función de métrica proyectiva (PMeF) para aproximar la similitud en el espacio de Hilbert, y técnicas de estabilización de gradientes mejoran aún más la eficiencia del entrenamiento.
Desafíos en la Codificación de Datos Cuánticos: La codificación efectiva de datos clásicos en estados cuánticos es un cuello de botella crítico en QML, y la calidad de la codificación determina directamente el rendimiento de los modelos cuánticos posteriores
Limitaciones de Dispositivos NISQ: Los dispositivos cuánticos de escala intermedia ruidosa (NISQ) actuales tienen un número limitado de qubits, tiempos de coherencia cortos y carecen de corrección de errores robusta
Problemas de Estabilidad del Entrenamiento: Las codificaciones cuánticas entrenables se ven afectadas por el fenómeno de mesetas áridas, lo que resulta en desvanecimiento de gradientes, entrenamiento inestable y consumo intensivo de recursos
Métodos de Codificación Estática: Como la codificación de amplitud y codificación angular tienen capacidad expresiva limitada, típicamente solo accediendo a pequeños subespacios del espacio de Hilbert
Codificaciones Cuánticas Entrenables: Aunque pueden aprender codificaciones optimizadas para tareas, se ven afectadas por mesetas áridas, lo que dificulta y consume tiempo el entrenamiento
Métodos de Entrenamiento Híbrido: Al optimizar conjuntamente componentes clásicos y cuánticos, aún se ven gravemente afectados por el problema de mesetas áridas
En la era NISQ, existe una necesidad urgente de un método que pueda aprovechar las ventajas cuánticas mientras evita los problemas del entrenamiento cuántico. QPMeL surge con el objetivo de aprender codificaciones conscientes de lo cuántico mediante entrenamiento puramente clásico.
Espacio de Características Unificado: Propone un espacio de características unificado compuesto por superficies de esferas independientes, conectando los dominios clásico y cuántico, con salida de codificador clásico de ángulos (θ, γ)
Función de Métrica Proyectiva (PMeF): Utiliza innovadoramente coordenadas en ℝ³ para calcular la similitud entre puntos en el espacio de estados cuánticos, sin necesidad de circuitos cuánticos reales
Técnicas de Estabilización de Gradientes: Técnicas de gradientes diseñadas específicamente para PMeF que mejoran significativamente la estabilidad del entrenamiento y la convergencia
Inferencia Amigable con NISQ: La inferencia requiere solo 2 puertas por qubit (RY y RZ), con profundidad de circuito extremadamente superficial
Soporte Multimodal: Primer método QML que admite aprendizaje multimodal (imagen-texto), logrando más del 90% de precisión en aprendizaje de 15 vías 1 disparo
QPMeL tiene como objetivo aprender un codificador clásico que mapee datos de entrada x a coordenadas angulares (θ⃗, γ⃗), que pueden usarse directamente para parametrizar puertas cuánticas, generando estados cuánticos con buena separabilidad en el espacio de Hilbert.
Restricción de No Entrelazamiento: QPMeL solo puede aprender estados cuánticos no entrelazados, lo que potencialmente limita la explotación de ciertas ventajas cuánticas
Análisis Teórico Insuficiente: Falta análisis teórico profundo sobre las ventajas teóricas del método
Verificación en Hardware Cuántico Real: Los experimentos se realizan principalmente en simuladores, careciendo de verificación en dispositivos cuánticos reales
Profundidad Teórica: Falta análisis teórico profundo sobre por qué los estados no entrelazados son suficientes
Equidad de Comparación: Debido a la indisponibilidad de código de métodos de referencia, existe incertidumbre sobre la equidad de los resultados comparativos
Ventaja Cuántica Poco Clara: No articula claramente la fuente de ventaja cuántica en comparación con métodos puramente clásicos
Verificación de Hardware Ausente: Falta verificación experimental en dispositivos cuánticos reales
Contribución Académica: Proporciona un nuevo paradigma de investigación para aprendizaje automático cuántico, potencialmente inspirando trabajos posteriores
Valor Práctico: La naturaleza amigable con NISQ del método le confiere potencial de aplicación práctica a corto plazo
Avance del Campo: La primera implementación de aprendizaje automático cuántico multimodal tiene significado pionero
El artículo cita trabajos importantes en aprendizaje automático cuántico, aprendizaje de métrica y campos relacionados, incluyendo:
Havlíček et al. (2019): Aprendizaje supervisado en espacios de características cuánticas
McClean et al. (2018): Mesetas áridas en redes neuronales cuánticas
Lloyd et al. (2020): Incrustaciones cuánticas para aprendizaje automático
Snell et al. (2017): Redes prototípicas para aprendizaje pocos disparos
Evaluación General: Este es un artículo de alta calidad en aprendizaje automático cuántico que propone soluciones innovadoras para abordar desafíos clave que enfrenta actualmente QML. Aunque existen algunas deficiencias en el análisis teórico, su valor práctico e innovación lo convierten en una contribución importante al campo. En particular, la primera implementación de aprendizaje automático cuántico multimodal abre nuevas direcciones para investigación futura.