2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.
Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic

Квантово-осведомленные классически-обученные вложения через проективное метрическое обучение

Основная информация

  • ID статьи: 2312.01655
  • Название: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
  • Авторы: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
  • Учреждения: ¹Arizona State University, ²National Institute of Technology, Rourkela
  • Классификация: quant-ph cs.AI
  • Дата публикации: arXiv:2312.01655v4 quant-ph 16 Oct 2025
  • Ссылка на статью: https://arxiv.org/abs/2312.01655

Аннотация

Квантовое машинное обучение (QML) обещает обеспечить более богатые представления и улучшенные способности обучения, используя уникальные свойства квантовых вычислений. Необходимым первым шагом при использовании QML является кодирование классических данных в квантовые состояния. Статические механизмы кодирования имеют ограниченную выразительную способность, а квантовое обучение страдает от проблемы бесплодных плато (barren plateaus), что делает оптимизацию нестабильной и неэффективной. В данной работе предлагается квантово-проективное метрическое обучение (QPMeL) — квантово-осведомленный, классически-обученный метод для изучения плотных и высококачественных квантовых кодировок. QPMeL достигает этого путем отображения классических данных на независимые единичные сферы в R³, что естественным образом согласуется с состояниями нескольких неперепутанных кубитов. QPMeL также вводит новую проективную метрическую функцию (PMeF) для аппроксимации сходства в гильбертовом пространстве, а методы стабилизации градиента дополнительно повышают эффективность обучения.

Исследовательский контекст и мотивация

Основные проблемы

  1. Вызовы квантового кодирования данных: Эффективное кодирование классических данных в квантовые состояния является ключевым узким местом QML, качество кодирования напрямую определяет производительность последующих квантовых моделей
  2. Ограничения устройств NISQ: Современные устройства квантовых вычислений среднего масштаба с шумом (NISQ) имеют ограниченное количество кубитов, короткое время когерентности и отсутствие надежной коррекции ошибок
  3. Проблемы стабильности обучения: Обучаемые квантовые кодировки страдают от явления бесплодных плато, приводящего к исчезновению градиентов, нестабильности обучения и высокой ресурсоемкости

Ограничения существующих методов

  1. Статические методы кодирования: Такие как кодирование амплитуды и угловое кодирование, имеют ограниченную выразительную способность и обычно могут получить доступ только к небольшому подпространству гильбертова пространства
  2. Обучаемые квантовые кодировки: Хотя они могут изучать оптимизированные для задачи кодировки, они страдают от проблемы бесплодных плато, что затрудняет и замедляет обучение
  3. Гибридные методы обучения: При совместной оптимизации классических и квантовых компонентов все еще серьезно затронуты проблемой бесплодных плато

Исследовательская мотивация

В эпоху NISQ существует острая необходимость в методе, который может использовать квантовые преимущества и одновременно избежать проблем квантового обучения. QPMeL был разработан именно для этого, целью которого является изучение квантово-осведомленных кодировок посредством чисто классического обучения.

Основные вклады

  1. Унифицированное пространство признаков: Предложено унифицированное пространство признаков, состоящее из независимых сферических поверхностей, связывающее классический и квантовый домены, с выходом классического кодировщика в виде углового кодирования (θ, γ)
  2. Проективная метрическая функция (PMeF): Инновационное использование координат R³ для вычисления сходства между точками в квантовом пространстве состояний без необходимости в фактических квантовых схемах
  3. Методы стабилизации градиента: Методы градиента, разработанные специально для PMeF, значительно повышают стабильность и сходимость обучения
  4. NISQ-дружественный вывод: При выводе требуется только 2 гейта на кубит (RY и RZ), что обеспечивает крайне малую глубину схемы
  5. Поддержка мультимодальности: Первый метод QML, поддерживающий мультимодальное (изображение-текст) обучение, достигающий точности более 90% в 15-способном 1-выстреловом обучении

Подробное описание метода

Определение задачи

QPMeL направлен на изучение классического кодировщика, который отображает входные данные x в угловые координаты (θ⃗, γ⃗), которые могут быть непосредственно использованы для параметризации квантовых гейтов, генерируя квантовые состояния с хорошей разделимостью в гильбертовом пространстве.

Архитектура модели

1. Кодировщик QPMeL

  • Структура: Стандартный метрический кодировщик + плотный блок + слой углового проецирования
  • Выход: Два независимых вектора θ⃗ ∈ 0,π^Q и γ⃗ ∈ -π,π^Q
  • Угловое проецирование: Реализуется через два параллельных плотных слоя, выход масштабируется в требуемый диапазон

2. Генерация квантовых состояний

Генерируемое Q-кубитное неперепутанное состояние:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. Проективная метрическая функция (PMeF)

PMeF вычисляет верность квантовых состояний в два ключевых этапа:

Этап 1: Преобразование полярных координат в декартовы

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

Этап 2: Комплексная ядерная функция (CKF) Для двух квантовых состояний |ψ⟩ и |ϕ⟩ их верность может быть выражена как:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

где:

  • λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
  • λ^c_q = x_q y'_q - y_q x'_q

Технические инновации

1. Проектирование унифицированного пространства признаков

  • Умелое использование независимых единичных сфер в качестве моста между классическим и квантовым доменами
  • Естественное соответствие геометрии сферы Блоха нескольких неперепутанных кубитов

2. Квантово-осведомленное классическое обучение

  • Избегает проблемы бесплодных плато при обучении квантовых схем
  • Прямая оптимизация сходства в квантовом пространстве в классическом домене через PMeF

3. Стабилизация градиента

При обучении используется аддитивная форма для избежания исчезновения градиентов:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

Экспериментальная установка

Наборы данных

  1. Стандартная классификация: MNIST, Fashion-MNIST
  2. Обучение с малым числом примеров: Omniglot, MS-COCO Captions
  3. Мультимодальное обучение: Пары изображение-текст MS-COCO

Метрики оценки

  • Точность классификации
  • Точность N-способного K-выстрелового обучения
  • Точность кросс-модального поиска в мультимодальных задачах

Методы сравнения

  • Hur, Araujo, and Park (2023)
  • Hou et al. (2023)
  • Huang, Shi, and Li (2025)
  • Wang et al. (2024)
  • Liu et al. (2022)

Детали реализации

  • Каждый эксперимент повторен 150 раз для расчета 95% доверительного интервала
  • Использована функция потерь прототипа для метрического обучения
  • Мультимодальные эксперименты используют архитектуру CLIP (BERT+Xception)

Результаты экспериментов

Основные результаты

1. Производительность стандартной классификации

Набор данных MNIST:

  • Двоичная классификация: 99,8% ± 0,1% (0,1), 98,2% ± 0,4% (3,5)
  • Трёхклассовая классификация: 99,1% ± 0,5% (0,1,2), 98,9% ± 0,4% (3,5,6)
  • Десятиклассовая классификация: 96,3% ± 0,3%

Набор данных Fashion-MNIST:

  • Двоичная классификация: 98,0% ± 0,6% (0,1)
  • Трёхклассовая классификация: 95,6% ± 0,5% (0,1,2)
  • Десятиклассовая классификация: 85,0% ± 0,3%

2. Производительность обучения с малым числом примеров

Набор данных Omniglot (N-способное 5-выстреловое обучение):

  • 2-способное: 98,13% ± 0,49%
  • 5-способное: 96,0% ± 0,5%
  • 10-способное: 90,02% ± 0,42%

3. Производительность мультимодального обучения

Набор данных MS-COCO (15-способное 1-выстреловое обучение):

  • Поддержка изображения - запрос текста: 94,71% ± 0,98% (классический), 95,87% ± 0,88% (квантовый)
  • Поддержка текста - запрос изображения: 93,60% ± 1,87% (классический), 93,07% ± 1,71% (квантовый)

Абляционные исследования

  1. Эффективность кубитов: По сравнению с Liu et al., использующим 64 кубита, QPMeL требует только 11-20 кубитов для достижения сравнимой производительности
  2. Глубина схемы: Требуется только 2 гейта на кубит, что значительно снижает сложность схемы
  3. Эффект стабилизации градиента: Аддитивная форма PMeF значительно повышает стабильность обучения

Экспериментальные находки

  1. Преимущества масштабируемости: QPMeL — единственный метод квантового метрического обучения, масштабируемый до 10-классовой классификации
  2. Прорыв в мультимодальности: Первый метод, реализующий мультимодальное квантовое машинное обучение
  3. Эффективность ресурсов: Достигает лучшей или сравнимой производительности, используя значительно меньше кубитов

Связанные работы

Методы квантового кодирования данных

  1. Статическое кодирование: Угловое кодирование, кодирование амплитуды и другие ранние методы
  2. Обучаемое кодирование: QMeL и его варианты
  3. Гибридное обучение: Методы совместной оптимизации классических и квантовых компонентов

Квантовое метрическое обучение

  • Lloyd et al. (2020): Первое введение концепции квантового метрического обучения
  • Последующие работы в основном сосредоточены на повышении стабильности обучения и расширении масштабируемости

Преимущества данной работы

  • Полностью избегает нестабильности квантового обучения
  • Впервые реализует мультимодальное квантовое машинное обучение
  • Значительно повышает эффективность использования ресурсов

Заключение и обсуждение

Основные выводы

  1. QPMeL успешно решает проблему нестабильности обучения в квантовом метрическом обучении
  2. Достигает изучение квантово-осведомленных кодировок посредством чисто классического обучения
  3. Достигает производительности SOTA на нескольких задачах при использовании меньше квантовых ресурсов
  4. Впервые реализует мультимодальное квантовое машинное обучение

Ограничения

  1. Ограничение неперепутанности: QPMeL может изучать только неперепутанные квантовые состояния, что может ограничить реализацию некоторых квантовых преимуществ
  2. Недостаточный теоретический анализ: Отсутствует глубокий анализ теоретических преимуществ метода
  3. Проверка на реальном квантовом оборудовании: Эксперименты в основном проводились на симуляторах, отсутствует проверка на реальных квантовых устройствах

Направления будущих исследований

  1. Расширение на изучение перепутанных состояний
  2. Теоретический анализ источников квантовых преимуществ
  3. Экспериментальная проверка на реальных устройствах NISQ
  4. Исследование дополнительных приложений квантового машинного обучения

Глубокая оценка

Достоинства

  1. Высокая инновационность: Предлагает совершенно новую парадигму квантово-осведомленного классического обучения, эффективно избегая проблемы бесплодных плато
  2. Высокая практическая ценность: Метод простой и эффективный, легко реализуется на устройствах NISQ
  3. Комплексные эксперименты: От двоичной классификации до мультимодального обучения, широкий охват экспериментов с убедительными результатами
  4. Техническая строгость: Математический вывод PMeF строг, методы стабилизации градиента имеют теоретическую поддержку
  5. Прорывные результаты: Впервые реализует мультимодальное квантовое машинное обучение, имеет важное значение

Недостатки

  1. Недостаточная теоретическая глубина: Отсутствует глубокий теоретический анализ того, почему неперепутанных состояний достаточно
  2. Справедливость сравнения: Из-за недоступности кода базовых методов справедливость результатов сравнения вызывает сомнения
  3. Неясное квантовое преимущество: Не удается четко объяснить источник квантовых преимуществ по сравнению с чисто классическими методами
  4. Отсутствие проверки на оборудовании: Отсутствует экспериментальная проверка на реальных квантовых устройствах

Влияние

  1. Академический вклад: Предоставляет новую исследовательскую парадигму для квантового машинного обучения, может вдохновить последующие работы
  2. Практическая ценность: NISQ-дружественность метода обеспечивает ему потенциал для практического применения в ближайшем будущем
  3. Продвижение области: Впервые реализованное мультимодальное квантовое машинное обучение имеет пионерское значение

Применимые сценарии

  1. Приложения в эпоху NISQ: Особенно подходит для приложений в условиях ограничений современного квантового оборудования
  2. Задачи метрического обучения: Имеет преимущества в задачах, требующих изучения метрик сходства
  3. Мультимодальные приложения: Открывает новый путь для квантового мультимодального обучения
  4. Концептуальная проверка: Подходит в качестве базового метода для концептуальной проверки квантового машинного обучения

Библиография

Статья цитирует важные работы в соответствующих областях квантового машинного обучения и метрического обучения, включая:

  • Havlíček et al. (2019): Контролируемое обучение в квантовых пространствах признаков
  • McClean et al. (2018): Бесплодные плато в квантовых нейронных сетях
  • Lloyd et al. (2020): Квантовые вложения для машинного обучения
  • Snell et al. (2017): Сетевые прототипы для обучения с малым числом примеров

Общая оценка: Это высококачественная статья по квантовому машинному обучению, предлагающая инновационное решение для решения ключевых проблем, стоящих перед современным QML. Хотя существуют некоторые недостатки в теоретическом анализе, её практическая ценность и инновационность делают её важным вкладом в данную область. В частности, впервые реализованное мультимодальное квантовое машинное обучение открывает новые направления для будущих исследований.