2025-11-12T21:07:10.726633

Quantum Polar Metric Learning: Efficient Classically Learned Quantum Embeddings

Sharma, Padhy, Behera et al.

Deep metric learning has recently shown extremely promising results in the classical data domain, creating well-separated feature spaces. This idea was also adapted to quantum computers via Quantum Metric Learning(QMeL). QMeL consists of a 2 step process with a classical model to compress the data to fit into the limited number of qubits, then train a Parameterized Quantum Circuit(PQC) to create better separation in Hilbert Space. However, on Noisy Intermediate Scale Quantum (NISQ) devices. QMeL solutions result in high circuit width and depth, both of which limit scalability. We propose Quantum Polar Metric Learning (QPMeL) that uses a classical model to learn the parameters of the polar form of a qubit. We then utilize a shallow PQC with $R_y$ and $R_z$ gates to create the state and a trainable layer of $ZZ(Î¸)$-gates to learn entanglement. The circuit also computes fidelity via a SWAP Test for our proposed Fidelity Triplet Loss function, used to train both classical and quantum components. When compared to QMeL approaches, QPMeL achieves 3X better multi-class separation, while using only 1/2 the number of gates and depth. We also demonstrate that QPMeL outperforms classical networks with similar configurations, presenting a promising avenue for future research on fully classical models with quantum loss functions.

academic

투영 메트릭 학습을 통한 양자 인식 고전 훈련 임베딩

기본 정보

논문 ID: 2312.01655
제목: Quantum-Aware Classically-Trained Embeddings via Projective Metric Learning
저자: Vinayak Sharma¹, Ashish Padhy², Sourav Behera², Lord Sen², Shyamapada Mukherjee², Aviral Shrivastava¹
소속: ¹애리조나 주립대학교, ²국립기술대학교 루르켈라
분류: quant-ph cs.AI
발표 시간: arXiv:2312.01655v4 quant-ph 2025년 10월 16일
논문 링크: https://arxiv.org/abs/2312.01655

초록

양자 기계학습(QML)은 양자 컴퓨팅의 고유한 특성을 활용하여 더욱 풍부한 표현과 개선된 학습 능력을 제공할 것을 약속합니다. QML 사용의 필수적인 첫 단계는 고전 데이터를 양자 상태로 인코딩하는 것입니다. 정적 인코딩 메커니즘은 표현 능력이 제한적이며, 양자 훈련은 황량한 고원(barren plateaus) 현상으로 인해 최적화가 불안정하고 비효율적입니다. 본 논문은 양자 투영 메트릭 학습(QPMeL)을 제안합니다. 이는 밀집하고 고품질의 양자 인코딩을 학습하기 위한 양자 인식의 고전 훈련 방법입니다. QPMeL은 고전 데이터를 R³의 독립적인 단위 구면에 매핑함으로써 이를 달성하며, 이는 자연스럽게 여러 개의 얽히지 않은 양자비트 상태와 정렬됩니다. QPMeL은 또한 힐베르트 공간에서의 유사성을 근사하기 위한 새로운 투영 메트릭 함수(PMeF)를 도입하며, 기울기 안정화 기법이 훈련 효율성을 더욱 향상시킵니다.

연구 배경 및 동기

핵심 문제

양자 데이터 인코딩 과제: 고전 데이터를 양자 상태로 효과적으로 인코딩하는 것은 QML의 핵심 병목이며, 인코딩 품질은 후속 양자 모델의 성능을 직접 결정합니다.
NISQ 장치 제한: 현재의 잡음이 있는 중간 규모 양자(NISQ) 장치는 제한된 양자비트 수, 짧은 일관성 시간, 견고한 오류 정정의 부재를 특징으로 합니다.
훈련 안정성 문제: 훈련 가능한 양자 인코딩은 황량한 고원 현상의 영향을 받아 기울기 소실, 훈련 불안정성, 자원 집약적 특성을 초래합니다.

기존 방법의 한계

정적 인코딩 방법: 진폭 인코딩 및 각도 인코딩과 같은 방법은 표현 능력이 제한적이며, 일반적으로 힐베르트 공간의 작은 부분공간에만 접근할 수 있습니다.
훈련 가능한 양자 인코딩: 작업 최적화 인코딩을 학습할 수 있지만, 황량한 고원의 영향을 받아 훈련이 어렵고 시간이 많이 소요됩니다.
혼합 훈련 방법: 고전 및 양자 구성 요소를 공동으로 최적화할 때, 여전히 황량한 고원 문제의 심각한 영향을 받습니다.

연구 동기

NISQ 시대에는 양자 우위를 활용하면서도 양자 훈련 문제를 피할 수 있는 방법이 시급히 필요하며, QPMeL은 순수 고전 훈련을 통해 양자 인식 인코딩을 학습하기 위해 개발되었습니다.

핵심 기여

통합 특징 공간: 독립적인 구면 표면으로 구성된 통합 특징 공간을 제안하여 고전 및 양자 영역을 연결하고, 고전 인코더 출력 각도 인코딩(θ, γ)을 통해 연결합니다.
투영 메트릭 함수(PMeF): R³ 좌표를 사용하여 양자 상태 공간의 점 사이 유사성을 계산하는 혁신적인 방법으로, 실제 양자 회로가 필요하지 않습니다.
기울기 안정화 기법: PMeF를 위해 설계된 기울기 기법으로, 훈련 안정성과 수렴성을 크게 향상시킵니다.
NISQ 친화적 추론: 추론 시 각 양자비트당 2개의 게이트(RY 및 RZ)만 필요하며, 회로 깊이가 극히 얕습니다.
다중 모달 지원: 다중 모달(이미지-텍스트) 학습을 지원하는 첫 번째 QML 방법으로, 15-Way 1-Shot 학습에서 90% 이상의 정확도를 달성합니다.

방법론 상세 설명

작업 정의

QPMeL은 입력 데이터 x를 각도 좌표(θ⃗, γ⃗)에 매핑하는 고전 인코더를 학습하는 것을 목표로 합니다. 이러한 좌표는 양자 게이트를 직접 매개변수화하여 힐베르트 공간에서 양호한 분리성을 가진 양자 상태를 생성하는 데 사용될 수 있습니다.

모델 아키텍처

1. QPMeL 인코더

구조: 표준 메트릭 인코더 + 밀집 블록 + 각도 투영 계층
출력: 두 개의 독립적인 벡터 θ⃗ ∈ 0,π^Q 및 γ⃗ ∈ -π,π^Q
각도 투영: 두 개의 병렬 밀집 계층을 통해 구현되며, 출력은 원하는 범위로 스케일됩니다.

2. 양자 상태 생성

생성된 Q 양자비트 얽히지 않은 상태는 다음과 같습니다:

|ϕ⟩ = ⊗_{q=1}^Q [cos(θ_q)|0⟩ + e^{iγ_q}sin(θ_q)|1⟩]

3. 투영 메트릭 함수(PMeF)

PMeF는 두 가지 핵심 단계를 통해 양자 상태 충실도를 계산합니다:

단계 1: 극좌표에서 직교좌표로의 변환

(θ, γ) → (x, y, z) = (sinθcosγ, sinθsinγ, cosθ)

단계 2: 복소수 커널 함수(CKF) 두 양자 상태 |ψ⟩ 및 |ϕ⟩에 대해, 그 충실도는 다음과 같이 표현될 수 있습니다:

PMeF(A⃗_ψ, A⃗_ϕ) = ∏_{q=1}^Q [(λ^r_q)² + (λ^c_q)²]

여기서:

λ^r_q = x_q x'_q + y_q y'_q + z_q z'_q
λ^c_q = x_q y'_q - y_q x'_q

기술 혁신 포인트

1. 통합 특징 공간 설계

독립적인 단위 구면을 고전 및 양자 영역의 다리로 영리하게 활용합니다.
여러 개의 얽히지 않은 양자비트의 블로흐 구 기하학적 구조와 자연스럽게 대응됩니다.

2. 양자 인식 고전 훈련

양자 회로 훈련에서 황량한 고원 문제를 회피합니다.
PMeF를 통해 고전 영역에서 양자 공간의 유사성을 직접 최적화합니다.

3. 기울기 안정화

훈련 시 덧셈 형태를 사용하여 기울기 소실을 방지합니다:

PMeF_train(ψ, ϕ) = ∑_{q=1}^Q |⟨ψ_q|ϕ_q⟩|²

실험 설정

데이터셋

표준 분류: MNIST, Fashion-MNIST
소수 샘플 학습: Omniglot, MS-COCO Captions
다중 모달 학습: MS-COCO 이미지-텍스트 쌍

평가 지표

분류 정확도
소수 샘플 학습의 N-Way K-Shot 정확도
다중 모달 작업의 크로스 모달 검색 정확도

비교 방법

Hur, Araujo, and Park (2023)
Hou et al. (2023)
Huang, Shi, and Li (2025)
Wang et al. (2024)
Liu et al. (2022)

구현 세부사항

각 실험을 150회 반복하여 95% 신뢰 구간 계산
메트릭 학습을 위해 원형 손실 함수 사용
다중 모달 실험은 CLIP 아키텍처(BERT+Xception) 채택

실험 결과

주요 결과

1. 표준 분류 성능

MNIST 데이터셋:

이진 분류: 99.8% ± 0.1% (0,1), 98.2% ± 0.4% (3,5)
삼진 분류: 99.1% ± 0.5% (0,1,2), 98.9% ± 0.4% (3,5,6)
십진 분류: 96.3% ± 0.3%

Fashion-MNIST 데이터셋:

이진 분류: 98.0% ± 0.6% (0,1)
삼진 분류: 95.6% ± 0.5% (0,1,2)
십진 분류: 85.0% ± 0.3%

2. 소수 샘플 학습 성능

Omniglot 데이터셋(N-Way-5-Shot):

2-Way: 98.13% ± 0.49%
5-Way: 96.0% ± 0.5%
10-Way: 90.02% ± 0.42%

3. 다중 모달 학습 성능

MS-COCO 데이터셋(15-Way-1-Shot):

이미지 지원-텍스트 쿼리: 94.71% ± 0.98% (고전), 95.87% ± 0.88% (양자)
텍스트 지원-이미지 쿼리: 93.60% ± 1.87% (고전), 93.07% ± 1.71% (양자)

절제 실험

양자비트 효율성: Liu et al.의 64 양자비트 사용과 비교하여, QPMeL은 동등한 성능을 달성하기 위해 11-20개의 양자비트만 필요합니다.
회로 깊이: 각 양자비트당 2개의 게이트만 필요하여 회로 복잡도를 크게 감소시킵니다.
기울기 안정화 효과: 덧셈 형태의 PMeF는 훈련 안정성을 크게 향상시킵니다.

실험 발견

확장성 우위: QPMeL은 10-클래스 분류로 확장할 수 있는 유일한 양자 메트릭 학습 방법입니다.
다중 모달 돌파: 다중 모달 양자 기계학습을 구현한 첫 번째 방법입니다.
자원 효율성: 훨씬 적은 양자비트를 사용하여 더 나은 또는 동등한 성능을 달성합니다.

결론 및 논의

주요 결론

QPMeL은 양자 메트릭 학습의 훈련 불안정성 문제를 성공적으로 해결합니다.
순수 고전 훈련을 통해 양자 인식 인코딩 학습을 달성했습니다.
여러 작업에서 SOTA 성능을 달성하면서 더 적은 양자 자원을 사용합니다.
다중 모달 양자 기계학습을 최초로 구현했습니다.

한계

얽히지 않은 제한: QPMeL은 얽히지 않은 양자 상태만 학습할 수 있으며, 이는 특정 양자 우위의 발휘를 제한할 수 있습니다.
이론 분석 부족: 방법의 이론적 우위에 대한 심층 분석이 부족합니다.
실제 양자 하드웨어 검증 부재: 실험은 주로 시뮬레이터에서 수행되었으며, 실제 양자 장치 검증이 부족합니다.

향후 방향

얽힌 상태 학습으로 확장
양자 우위의 출처에 대한 이론 분석
실제 NISQ 장치에서의 실험 검증
더 많은 양자 기계학습 응용 시나리오 탐색

심층 평가

장점

높은 혁신성: 황량한 고원 문제를 효과적으로 회피하는 완전히 새로운 양자 인식 고전 훈련 패러다임을 제안합니다.
높은 실용 가치: 방법이 간단하고 효율적이며 NISQ 장치에서 구현하기 쉽습니다.
포괄적인 실험: 이진 분류에서 다중 모달 학습까지 광범위한 실험 범위와 설득력 있는 결과를 제공합니다.
기술적 엄밀성: PMeF의 수학적 유도가 엄밀하고 기울기 안정화 기법이 이론적 지원을 받습니다.
획기적 성과: 다중 모달 양자 기계학습의 최초 구현으로 중요한 의미를 가집니다.

부족한 점

이론적 깊이: 왜 얽히지 않은 상태만으로 충분한지에 대한 심층 이론 분석이 부족합니다.
비교의 공정성: 기준 방법 코드를 사용할 수 없어 비교 결과의 공정성에 의문이 있습니다.
양자 우위 불명확: 순수 고전 방법 대비 양자 우위의 출처를 명확히 설명하지 못합니다.
하드웨어 검증 부재: 실제 양자 장치에서의 실험 검증이 부족합니다.

영향력

학술적 기여: 양자 기계학습에 새로운 연구 패러다임을 제공하여 후속 연구에 영감을 줄 수 있습니다.
실용적 가치: 방법의 NISQ 친화성으로 인해 근기간 실용화 가능성을 가집니다.
분야 발전: 다중 모달 양자 기계학습의 최초 구현으로 개척적 의미를 가집니다.

적용 시나리오

NISQ 시대 응용: 특히 현재 양자 하드웨어 제한 하에서의 응용에 적합합니다.
메트릭 학습 작업: 유사성 메트릭 학습이 필요한 작업에서 우위를 가집니다.
다중 모달 응용: 양자 다중 모달 학습을 위한 새로운 경로를 개척합니다.
개념 검증: 양자 기계학습 개념 검증의 기초 방법으로 적합합니다.

참고문헌

본 논문은 양자 기계학습, 메트릭 학습 등 관련 분야의 중요 연구를 인용하고 있으며, 다음을 포함합니다:

Havlíček et al. (2019): 양자 특징 공간 지도 학습
McClean et al. (2018): 양자 신경망의 황량한 고원
Lloyd et al. (2020): 기계학습을 위한 양자 임베딩
Snell et al. (2017): 소수 샘플 학습을 위한 원형 네트워크

종합 평가: 이는 현재 QML이 직면한 핵심 과제를 해결하기 위한 혁신적인 솔루션을 제안하는 고품질의 양자 기계학습 논문입니다. 이론 분석의 일부 부족에도 불구하고, 그 실용적 가치와 혁신성은 이를 해당 분야의 중요한 기여로 만듭니다. 특히 다중 모달 양자 기계학습의 최초 구현은 향후 연구를 위한 새로운 방향을 개척합니다.