2025-11-23T13:22:17.314370

Recent quantum runtime (dis)advantages

Tuziemski, PawÅowski, Tarasiuk et al.

We (re)evaluate recent claims of quantum advantage in annealing- and gate-based algorithms, testing whether reported speedups survive rigorous end-to-end runtime definitions and comparison against strong classical baselines. Conventional analyses often omit substantial overhead (readout, transpilation, thermalization, etc.) yielding biased assessments. While excluding seemingly not important parts of the simulation may seem reasonable, on most current quantum hardware a clean separation between "pure compute" and "overhead" cannot be experimentally justified. This may distort "supremacy" results. In contrast, for most classical hardware total time $\approx$ compute $+$ a weakly varying constant leading to robust claims. We scrutinize two important milestones: (1) quantum annealing for approximate QUBO PRL 134, 160601 (2025) [https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.134.160601], which uses a sensible time-to-$Îµ$ metric but proxies runtime by the annealing time (non-measurable); (2) a restricted Simon's problem PRX 15, 021082 (2025) [https://journals.aps.org/prx/abstract/10.1103/PhysRevX.15.021082] , whose advantageous scaling in oracle calls is undisputed; yet, as we demonstrate, estimated runtime of the quantum experiment is $\sim 100 \times$ slower than a tuned classical baseline. Finally, we show that recently claimed "runtime advantage" of the BF-DCQO hybrid algorithm (arXiv:2505.08663) does not withstand rigorous benchmarking. Therefore, we conclude that runtime-based supremacy remains elusive on NISQ hardware, and credible claims require a careful time accounting with a proper reference selections, and an adequate metric.

academic

最近の量子ランタイム(不)利点

基本情報

論文ID: 2510.06337
タイトル: Recent quantum runtime (dis)advantages
著者: J. Tuziemski, J. Pawłowski, P. Tarasiuk, Ł. Pawela, B. Gardas
分類: quant-ph
発表日時: 2025年10月16日 (arXiv v2)
論文リンク: https://arxiv.org/abs/2510.06337

要約

本論文は、量子優位性に関する最近の主張、特に量子アニーリングとゲートベースのアルゴリズムにおける主張を再評価し、これらの報告された加速効果が厳密なエンドツーエンドランタイム定義と強力な古典的ベンチマークとの比較の下で依然として成立するかどうかをテストしています。従来の分析は、読み取り、翻訳、熱化などの膨大なオーバーヘッドを見落とすことが多く、評価の偏りをもたらしています。著者は3つの重要なマイルストーンを検証しています：(1) 近似QUBOの量子アニーリング、(2) 制限されたSimon問題、(3) BF-DCQO混合アルゴリズム。結果は、NISQ硬件上でのランタイムベースの量子優位性の実現がまだ困難であることを示しています。

研究背景と動機

研究問題

本論文が解決しようとしている中核的な問題は：現在の量子優位性の主張は、厳密なランタイム定義と公平な古典的ベンチマーク比較の下で依然として成立するのか？

問題の重要性

実用性の考慮：量子計算の最終的な目標は実際のアプリケーションで古典計算を超えることであり、ランタイム性能は実用的価値を決定する重要な指標です
評価偏差の問題：既存の研究は量子ハードウェアの著しいオーバーヘッドを見落とすことが多く、量子優位性に対する過度に楽観的な評価をもたらしています
科学的厳密性：量子アルゴリズムの真の性能を評価するために、公平で厳密なベンチマーク方法論を確立する必要があります

既存方法の限界

不適切なランタイム定義：多くの研究は「純粋計算」時間のみを考慮し、読み取り、熱化、翻訳などのオーバーヘッドを無視しています
ベンチマーク選択の偏り：古典的ベンチマークアルゴリズムの選択が不適切で、最先端の並列化方法を使用していません
統計分析の不足：十分な統計分析が欠けており、チェリーピッキングの問題が存在します

研究の動機

著者は、量子技術の成熟に伴い、量子優位性の真実性を検証し、過度な宣伝が科学的判断に影響を与えるのを避けるために、より厳密な評価基準が必要であると考えています。

核心的貢献

厳密なランタイム定義フレームワークの確立：プログラミング、実行、読み取り、熱化を含むすべての必要なコンポーネントを含む完全なランタイム定義を提案しています
3つの重要な量子優位性主張の再評価：
- 近似QUBO問題での量子アニーリングの利点
- 制限されたSimon問題のクエリ複雑性の利点
- BF-DCQO混合アルゴリズムのランタイム利点
評価偏差の根本原因の解明：量子ハードウェアが「純粋計算」と「オーバーヘッド」の明確な分離を実現することが困難な理由を分析しています
公平なベンチマークテストガイドラインの提供：将来の量子優位性主張のための評価基準と方法論を確立しています

方法の詳細説明

タスク定義

本論文は、以下の3つの具体的なタスクでの量子アルゴリズムの性能を再評価しています：

入力：最適化問題インスタンス、Oracleクエリ、HUBO問題
出力：問題の解またはクエリ結果
制約：現在のNISQハードウェア制限下での実際のランタイム性能

ランタイム定義フレームワーク

量子アニーリングデバイスのランタイム

量子アニーリングの完全なランタイムには以下が含まれます：

総ランタイム = プログラミング時間 + アニーリング時間 + 読み取り時間 + 熱化時間

主要な発見：

読み取り時間は約200μs、アニーリング時間は0.5～27μs
読み取り時間はアニーリング時間より2桁長い
これにより、アニーリング時間に基づく性能評価が大きく歪みます

デジタル量子デバイスのランタイム

デジタル量子計算の完全なランタイムには以下が含まれます：

総ランタイム = 前処理時間 + 翻訳時間 + 実行時間 + 読み取り時間 + 熱化時間

TTε指標

$TTε = t_f \cdot \frac{\log(1-0.99)}{\log(1-p_{E≤E_0+ε|E_0})}$

ここで：

$t_f$ ：解を生成する時間
$p_{E≤E_0+ε|E_0}$ ：ε最適性ギャップ内で解を見つける確率

技術的革新点

包括的なランタイム計測：量子計算のすべての段階の時間オーバーヘッドを初めて体系的に含めています
強力な古典的ベンチマーク：GPU最適化された並列アルゴリズム（SBMなど）をベンチマークとして使用しています
統計的厳密性：チェリーピッキングを回避し、十分なインスタンス数で統計分析を使用しています

実験設定

評価ケース

ケース1：量子アニーリング近似QUBO

データセット：Sidon-28インスタンス、規模N∈142, 1322
量子デバイス：D-Wave量子アニーリングマシン
古典的ベンチマーク：シミュレートされた分岐機械(SBM)
指標：TTε中央値

ケース2：制限されたSimon問題

問題規模：29ビット入力、Hammingウェイトw∈2,7
量子デバイス：IBM Brisbane
古典的実装：GPU上のブルートフォースアルゴリズム
指標：Oracleコール数と実際のランタイム

ケース3：BF-DCQO混合アルゴリズム

問題タイプ：高次制約なし二進最適化(HUBO)
インスタンス規模：N∈80, 100, 130, 156
比較方法：CPLEX、シミュレーテッドアニーリング、SBM

実装の詳細

ハードウェア環境：デュアルIntel Xeon Platinum 8462Y+ CPU、4×NVIDIA H100 GPU、1TB RAM
統計方法：50個のランダムインスタンス、複数の独立実行
パラメータ最適化：すべてのアルゴリズムについてハイパーパラメータ調整を実施

実験結果

主要な結果

量子アニーリング結果

完全なランタイム定義を使用した場合：

TTε中央値はほぼ定数：指数αの不確実性が大きすぎて、ゼロ以外の結論を導き出せません
読み取り時間が支配的：総ランタイムの主要部分を占めています
SBMがより優れた性能：同じ問題でより良いスケーラビリティを示しています

制限されたSimon問題の結果

クエリ複雑性の利点は確かに存在：量子アルゴリズムは理論上、より少ないOracleコールを必要とします
実際のランタイムの欠点は顕著：
- N=29、w=7の場合：古典的アルゴリズム～0.035秒、量子アルゴリズム～2秒
- 量子アルゴリズムは約100倍遅い
- 交差点はN≈60で予想されていますが、ノイズにより実際の到達可能性が制限されています

BF-DCQO混合アルゴリズム結果

方法論的問題：ランタイム推定が不正確で、重要なオーバーヘッドを無視しています
統計的問題：少数のインスタンス(5個)に基づくチェリーピッキング
SBMの明らかな利点：同じ問題でより良い性能を示しています

アブレーション実験

ランタイム定義の感度分析

異なるランタイム定義の影響を比較：

ランタイム定義	量子アニーリング拡張指数α	SBM拡張指数α
アニーリング時間のみ	2.23±0.25	-
QPU総時間	0.61±1.20	-
完全なランタイム	0.93±1.24	1.83±0.11

結果は、量子アルゴリズムがランタイム定義に極めて敏感であり、古典的アルゴリズムは相対的に堅牢であることを示しています。

ケース分析

HUBOインスタンスの課題

生成されたHUBOインスタンスは、異なるアルゴリズムに対して異なる難度を示しています：

SBM：Cauchy分布インスタンスでの成功率は低いですが、ランタイムの利点は明らかです
SA(QUBO)：解の品質が最良ですが、ランタイムが長くなります
SA(HUBO)：Pareto分布インスタンスで優れた性能を示しています

これはインスタンス特性がアルゴリズム性能に大きな影響を与えることを示しており、十分な統計分析が必要です。

結論と議論

主要な結論

NISQ硬件上でのランタイムベースの量子優位性はまだ実現困難：厳密なランタイム定義と公平なベンチマーク比較の下では、検証されたすべての量子優位性主張が成立しません
ランタイム定義は極めて重要：量子ハードウェアの高いオーバーヘッドにより、「純粋計算」と「オーバーヘッド」の分離が困難であり、完全なランタイムを使用する必要があります
古典的ベンチマーク選択の重要性：最先端の並列化古典的アルゴリズムをベンチマークとして使用することは、公平な評価の前提条件です
統計的厳密性は不可欠：十分なインスタンス数と統計分析は、信頼できる量子優位性主張に必要です