2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.
Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(θ)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.
academic

Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning

基本信息

  • 论文ID: 2312.01655
  • 标题: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
  • 作者: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
  • 机构: ¹Arizona State University, ²National Institute of Technology, Rourkela
  • 分类: quant-ph cs.AI
  • 发表时间: arXiv:2312.01655v4 quant-ph 16 Oct 2025
  • 论文链接: https://arxiv.org/abs/2312.01655

摘要

量子机器学习(QML)通过利用量子计算的独特性质,承诺提供更丰富的表示和改进的学习能力。使用QML的必要第一步是将经典数据编码为量子状态。静态编码机制表达能力有限,而量子训练受到贫瘠高原(barren plateaus)的困扰,使优化不稳定且效率低下。本文提出量子投影度量学习(QPMeL)——一种量子感知的、经典训练的方法来学习密集且高质量的量子编码。QPMeL通过将经典数据映射到R³中独立单位球面上来实现这一点,这自然地与多个非纠缠量子比特的状态对齐。QPMeL还引入了一个新颖的投影度量函数(PMeF)来近似希尔伯特空间中的相似性,梯度稳定化技巧进一步提高了训练效率。

研究背景与动机

核心问题

  1. 量子数据编码挑战:将经典数据有效编码到量子状态是QML的关键瓶颈,编码质量直接决定下游量子模型的性能
  2. NISQ设备限制:当前噪声中等规模量子(NISQ)设备具有有限的量子比特数、短相干时间和缺乏鲁棒的错误纠正
  3. 训练稳定性问题:可训练的量子编码受到贫瘠高原现象影响,导致梯度消失、训练不稳定且资源密集

现有方法局限性

  1. 静态编码方法:如幅度编码和角度编码表达能力有限,通常只能访问希尔伯特空间的小子空间
  2. 可训练量子编码:虽然能学习任务优化的编码,但受贫瘠高原影响,训练困难且耗时
  3. 混合训练方法:联合优化经典和量子组件时,仍然受到贫瘠高原问题的严重影响

研究动机

在NISQ时代,迫切需要一种既能利用量子优势又能避免量子训练问题的方法,QPMeL应运而生,旨在通过纯经典训练学习量子感知的编码。

核心贡献

  1. 统一特征空间:提出由独立球面表面组成的统一特征空间,连接经典和量子域,通过经典编码器输出角度编码(θ, γ)
  2. 投影度量函数(PMeF):创新性地使用R³坐标计算量子状态空间中点之间的相似性,无需实际量子电路
  3. 梯度稳定化技巧:针对PMeF设计的梯度技巧,显著提高训练稳定性和收敛性
  4. NISQ友好的推理:推理时仅需每个量子比特2个门(RY和RZ),电路深度极浅
  5. 多模态支持:首个支持多模态(图像-文本)学习的QML方法,在15路1次学习中达到90%以上准确率

方法详解

任务定义

QPMeL旨在学习一个经典编码器,将输入数据x映射到角度坐标(θ⃗, γ⃗),这些坐标可以直接用于参数化量子门,生成在希尔伯特空间中具有良好分离性的量子状态。

模型架构

1. QPMeL编码器

  • 结构:标准度量编码器 + 密集块 + 角度投影层
  • 输出:两个独立向量θ⃗ ∈ 0,π^Q 和 γ⃗ ∈ -π,π^Q
  • 角度投影:通过两个并行的密集层实现,输出被缩放到所需范围

2. 量子状态生成

生成的Q量子比特非纠缠态为:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. 投影度量函数(PMeF)

PMeF通过两个关键步骤计算量子态保真度:

步骤1:极坐标到笛卡尔坐标转换

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

步骤2:复数核函数(CKF) 对于两个量子态|ψ⟩和|ϕ⟩,其保真度可表示为:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

其中:

  • λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
  • λ^c_q = x_q y'_q - y_q x'_q

技术创新点

1. 统一特征空间设计

  • 巧妙地利用独立单位球面作为经典和量子域的桥梁
  • 自然对应多个非纠缠量子比特的Bloch球几何结构

2. 量子感知的经典训练

  • 避免了量子电路训练中的贫瘠高原问题
  • 通过PMeF在经典域中直接优化量子空间的相似性

3. 梯度稳定化

训练时使用加法形式避免梯度消失:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

实验设置

数据集

  1. 标准分类:MNIST, Fashion-MNIST
  2. 少样本学习:Omniglot, MS-COCO Captions
  3. 多模态学习:MS-COCO图像-文本对

评价指标

  • 分类准确率
  • 少样本学习中的N路K次准确率
  • 多模态任务中的跨模态检索准确率

对比方法

  • Hur, Araujo, and Park (2023)
  • Hou et al. (2023)
  • Huang, Shi, and Li (2025)
  • Wang et al. (2024)
  • Liu et al. (2022)

实现细节

  • 每个实验重复150次计算95%置信区间
  • 使用原型损失函数进行度量学习
  • 多模态实验采用CLIP架构(BERT+Xception)

实验结果

主要结果

1. 标准分类性能

MNIST数据集

  • 二分类:99.8% ± 0.1% (0,1), 98.2% ± 0.4% (3,5)
  • 三分类:99.1% ± 0.5% (0,1,2), 98.9% ± 0.4% (3,5,6)
  • 十分类:96.3% ± 0.3%

Fashion-MNIST数据集

  • 二分类:98.0% ± 0.6% (0,1)
  • 三分类:95.6% ± 0.5% (0,1,2)
  • 十分类:85.0% ± 0.3%

2. 少样本学习性能

Omniglot数据集(N-Way-5-shot)

  • 2路:98.13% ± 0.49%
  • 5路:96.0% ± 0.5%
  • 10路:90.02% ± 0.42%

3. 多模态学习性能

MS-COCO数据集(15-Way-1-shot)

  • 图像支持-文本查询:94.71% ± 0.98% (经典), 95.87% ± 0.88% (量子)
  • 文本支持-图像查询:93.60% ± 1.87% (经典), 93.07% ± 1.71% (量子)

消融实验

  1. 量子比特效率:相比Liu et al.使用64量子比特,QPMeL仅需11-20个量子比特达到相当性能
  2. 电路深度:每个量子比特仅需2个门,显著降低电路复杂度
  3. 梯度稳定化效果:加法形式的PMeF显著提升训练稳定性

实验发现

  1. 扩展性优势:QPMeL是唯一能扩展到10类分类的量子度量学习方法
  2. 多模态突破:首个实现多模态量子机器学习的方法
  3. 资源效率:使用显著更少的量子比特实现更好或相当的性能

相关工作

量子数据编码方法

  1. 静态编码:角度编码、幅度编码等早期方法
  2. 可训练编码:QMeL及其变体
  3. 混合训练:经典-量子联合优化方法

量子度量学习

  • Lloyd et al. (2020):首次提出量子度量学习概念
  • 后续工作主要集中在改进训练稳定性和扩展性

本文优势

  • 完全避免量子训练的不稳定性
  • 首次实现多模态量子机器学习
  • 显著提升资源利用效率

结论与讨论

主要结论

  1. QPMeL成功解决了量子度量学习中的训练不稳定问题
  2. 通过纯经典训练实现了量子感知的编码学习
  3. 在多个任务上达到了SOTA性能,同时使用更少的量子资源
  4. 首次实现了多模态量子机器学习

局限性

  1. 非纠缠限制:QPMeL只能学习非纠缠量子态,可能限制某些量子优势的发挥
  2. 理论分析不足:缺乏对方法理论优势的深入分析
  3. 实际量子硬件验证:实验主要在模拟器上进行,缺乏真实量子设备验证

未来方向

  1. 扩展到纠缠态的学习
  2. 理论分析量子优势的来源
  3. 在真实NISQ设备上的实验验证
  4. 探索更多量子机器学习应用场景

深度评价

优点

  1. 创新性强:提出了全新的量子感知经典训练范式,有效避免了贫瘠高原问题
  2. 实用价值高:方法简单高效,易于在NISQ设备上实现
  3. 实验全面:从二分类到多模态学习,实验覆盖面广且结果令人信服
  4. 技术严谨:PMeF的数学推导严密,梯度稳定化技巧有理论支撑
  5. 突破性成果:首次实现多模态量子机器学习,具有重要意义

不足

  1. 理论深度:缺乏对为什么非纠缠态就足够的深入理论分析
  2. 对比公平性:由于基线方法代码不可用,对比结果的公平性存在疑问
  3. 量子优势不明确:未能清晰阐述相比纯经典方法的量子优势来源
  4. 硬件验证缺失:缺乏在真实量子设备上的实验验证

影响力

  1. 学术贡献:为量子机器学习提供了新的研究范式,可能启发后续工作
  2. 实用价值:方法的NISQ友好性使其具有近期实用化潜力
  3. 领域推进:多模态量子机器学习的首次实现具有开创性意义

适用场景

  1. NISQ时代应用:特别适合当前量子硬件限制下的应用
  2. 度量学习任务:在需要学习相似性度量的任务中具有优势
  3. 多模态应用:为量子多模态学习开辟了新路径
  4. 原型验证:适合作为量子机器学习概念验证的基础方法

参考文献

论文引用了量子机器学习、度量学习等相关领域的重要工作,包括:

  • Havlíček et al. (2019): 量子特征空间监督学习
  • McClean et al. (2018): 量子神经网络中的贫瘠高原
  • Lloyd et al. (2020): 机器学习的量子嵌入
  • Snell et al. (2017): 少样本学习的原型网络

总体评价:这是一篇高质量的量子机器学习论文,提出了创新的解决方案来应对当前QML面临的关键挑战。虽然存在一些理论分析的不足,但其实用价值和创新性使其成为该领域的重要贡献。特别是多模态量子机器学习的首次实现,为未来研究开辟了新的方向。