2025-11-23T13:22:17.314370

Recent quantum runtime (dis)advantages

Tuziemski, PawÅowski, Tarasiuk et al.

We (re)evaluate recent claims of quantum advantage in annealing- and gate-based algorithms, testing whether reported speedups survive rigorous end-to-end runtime definitions and comparison against strong classical baselines. Conventional analyses often omit substantial overhead (readout, transpilation, thermalization, etc.) yielding biased assessments. While excluding seemingly not important parts of the simulation may seem reasonable, on most current quantum hardware a clean separation between "pure compute" and "overhead" cannot be experimentally justified. This may distort "supremacy" results. In contrast, for most classical hardware total time $\approx$ compute $+$ a weakly varying constant leading to robust claims. We scrutinize two important milestones: (1) quantum annealing for approximate QUBO PRL 134, 160601 (2025) [https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.134.160601], which uses a sensible time-to-$Îµ$ metric but proxies runtime by the annealing time (non-measurable); (2) a restricted Simon's problem PRX 15, 021082 (2025) [https://journals.aps.org/prx/abstract/10.1103/PhysRevX.15.021082] , whose advantageous scaling in oracle calls is undisputed; yet, as we demonstrate, estimated runtime of the quantum experiment is $\sim 100 \times$ slower than a tuned classical baseline. Finally, we show that recently claimed "runtime advantage" of the BF-DCQO hybrid algorithm (arXiv:2505.08663) does not withstand rigorous benchmarking. Therefore, we conclude that runtime-based supremacy remains elusive on NISQ hardware, and credible claims require a careful time accounting with a proper reference selections, and an adequate metric.

academic

Jüngste Quantenlaufzeit-(Dis)Vorteile

Grundlegende Informationen

Papier-ID: 2510.06337
Titel: Recent quantum runtime (dis)advantages
Autoren: J. Tuziemski, J. Pawłowski, P. Tarasiuk, Ł. Pawela, B. Gardas
Klassifizierung: quant-ph
Veröffentlichungsdatum: 16. Oktober 2025 (arXiv v2)
Papierlink: https://arxiv.org/abs/2510.06337

Zusammenfassung

Dieses Papier bewertet kürzliche Behauptungen über Quantenvorteil neu, insbesondere bei Quantenglühen und gattergestützten Algorithmen, und prüft, ob die gemeldeten Beschleunigungseffekte unter strikten End-to-End-Laufzeitdefinitionen und im Vergleich mit starken klassischen Benchmarks bestehen bleiben. Herkömmliche Analysen vernachlässigen häufig erhebliche Gemeinkosten (Auslesen, Übersetzung, Thermalisierung usw.), was zu verzerrten Bewertungen führt. Die Autoren überprüfen drei wichtige Meilensteine: (1) Quantenglühen für approximative QUBO; (2) eingeschränktes Simon-Problem; (3) BF-DCQO-Hybrid-Algorithmus. Die Ergebnisse deuten darauf hin, dass laufzeitbasierte Quantenvorteile auf NISQ-Hardware weiterhin schwer zu erreichen sind.

Forschungshintergrund und Motivation

Forschungsfrage

Die zentrale Frage, die dieses Papier adressiert, lautet: Bleiben aktuelle Behauptungen über Quantenvorteil unter strikten Laufzeitdefinitionen und fairen klassischen Benchmark-Vergleichen gültig?

Bedeutung des Problems

Praktische Überlegungen: Das ultimative Ziel des Quantencomputing ist es, klassisches Computing in praktischen Anwendungen zu übertreffen, wobei die Laufzeitleistung ein Schlüsselindikator für praktischen Wert ist
Bewertungsverzerrungsproblem: Bestehende Forschung vernachlässigt häufig erhebliche Gemeinkosten von Quantenhardware, was zu übermäßig optimistischen Bewertungen des Quantenvorteils führt
Wissenschaftliche Strenge: Es ist notwendig, faire und strikte Benchmark-Methoden zur Bewertung der echten Leistung von Quantenalgorithmen zu etablieren

Einschränkungen bestehender Methoden

Unangemessene Laufzeitdefinition: Viele Studien berücksichtigen nur "reine Rechenzeit" und ignorieren Auslesen, Thermalisierung, Übersetzung und andere Gemeinkosten
Benchmark-Auswahlverzerrung: Klassische Benchmark-Algorithmen werden nicht angemessen ausgewählt und verwenden nicht die neuesten Parallelisierungsmethoden
Unzureichende statistische Analyse: Mangelnde statistische Analyse mit Cherry-Picking-Problemen

Forschungsmotivation

Die Autoren argumentieren, dass mit der Reifung der Quantentechnologie strengere Bewertungsstandards erforderlich sind, um die Authentizität des Quantenvorteils zu überprüfen und Übertreibungen zu vermeiden, die wissenschaftliche Urteile beeinflussen.

Kernbeiträge

Etablierung eines strikten Laufzeitdefinitionsrahmens: Vorschlag einer vollständigen Laufzeitdefinition, die alle notwendigen Komponenten enthält (Programmierung, Ausführung, Auslesen, Thermalisierung)
Neubewertung von drei wichtigen Quantenvorteil-Behauptungen:
- Quantenglühen-Vorteil bei approximativen QUBO-Problemen
- Abfragekomplexitätsvorteil des eingeschränkten Simon-Problems
- Laufzeitvorteil des BF-DCQO-Hybrid-Algorithmus
Aufdeckung der Grundursachen von Bewertungsverzerrungen: Analyse, warum Quantenhardware eine klare Trennung zwischen "reiner Berechnung" und "Gemeinkosten" schwer erreichen kann
Bereitstellung von Richtlinien für faire Benchmark-Tests: Etablierung von Bewertungsstandards und Methoden für zukünftige Quantenvorteil-Behauptungen

Methodische Details

Aufgabendefinition

Dieses Papier bewertet die Leistung von Quantenalgorithmen bei den folgenden drei konkreten Aufgaben neu:

Eingabe: Optimierungsprobleminstanzen, Oracle-Abfragen, HUBO-Probleme
Ausgabe: Problemlösungen oder Abfrageergebnisse
Einschränkungen: Echte Laufzeitleistung unter aktuellen NISQ-Hardware-Einschränkungen

Laufzeitdefinitionsrahmen

Quantenglüh-Gerätelaufzeit

Die vollständige Laufzeit des Quantenglühens sollte Folgendes umfassen:

Gesamtlaufzeit = Programmierzeit + Glühzeit + Auslesezeit + Thermalisierungszeit

Wichtige Erkenntnisse:

Auslesezeit etwa 200 μs, während Glühzeit nur 0,5–27 μs beträgt
Auslesezeit ist zwei Größenordnungen länger als Glühzeit
Dies führt zu erheblichen Verzerrungen bei der Leistungsbewertung basierend auf Glühzeit

Digitale Quantengerätelaufzeit

Die vollständige Laufzeit des digitalen Quantencomputing umfasst:

Gesamtlaufzeit = Vorverarbeitungszeit + Übersetzungszeit + Ausführungszeit + Auslesezeit + Thermalisierungszeit

Time-to-ε (TTε) Metrik

$TTε = t_f \cdot \frac{\log(1-0.99)}{\log(1-p_{E≤E_0+ε|E_0})}$

Wobei:

$t_f$ : Zeit zur Generierung einer Lösung
$p_{E≤E_0+ε|E_0}$ : Wahrscheinlichkeit, eine Lösung innerhalb der ε-Optimalitätslücke zu finden

Technische Innovationen

Umfassende Laufzeitmessung: Erste systematische Einbeziehung aller Zeitgemeinkosten in Quantencomputingphasen
Starke klassische Benchmarks: Verwendung GPU-optimierter paralleler Algorithmen (z. B. SBM) als Benchmark
Statistische Strenge: Vermeidung von Cherry-Picking durch Verwendung ausreichender Instanzanzahl für statistische Analyse

Experimentelle Einrichtung

Bewertungsfälle

Fall 1: Quantenglühen für approximative QUBO

Datensatz: Sidon-28-Instanzen, Größe N∈142, 1322
Quantengerät: D-Wave Quantenglüh-Maschine
Klassischer Benchmark: Simulierte Bifurkationsmaschine (SBM)
Metrik: TTε-Median

Fall 2: Eingeschränktes Simon-Problem

Problemgröße: 29-Bit-Eingabe, Hamming-Gewicht w∈2,7
Quantengerät: IBM Brisbane
Klassische Implementierung: Brute-Force-Algorithmus auf GPU
Metrik: Oracle-Aufrufe und echte Laufzeit

Fall 3: BF-DCQO-Hybrid-Algorithmus

Problemtyp: Hochordnungsunbeschränkte binäre Optimierung (HUBO)
Instanzgröße: N∈80, 100, 130, 156
Vergleichsmethoden: CPLEX, simuliertes Glühen, SBM

Implementierungsdetails

Hardware-Umgebung: Dual Intel Xeon Platinum 8462Y+ CPU, 4×NVIDIA H100 GPU, 1 TB RAM
Statistische Methode: 50 zufällige Instanzen, mehrere unabhängige Durchläufe
Parameteroptimierung: Hyperparameter-Tuning für alle Algorithmen

Experimentelle Ergebnisse

Hauptergebnisse

Quantenglüh-Ergebnisse

Mit vollständiger Laufzeitdefinition:

TTεMed ist nahezu konstant: Unsicherheit des angepassten Exponenten α ist zu groß für nicht-triviale Schlussfolgerungen
Auslesezeit dominiert: Macht den Hauptteil der Gesamtlaufzeit aus
SBM zeigt bessere Leistung: Bessere Skalierbarkeit bei identischen Problemen

Ergebnisse des eingeschränkten Simon-Problems

Abfragekomplexitätsvorteil existiert tatsächlich: Quantenalgorithmus benötigt theoretisch weniger Oracle-Aufrufe
Echte Laufzeitnachteil ist signifikant:
- N=29, w=7: Klassischer Algorithmus ~0,035s, Quantenalgorithmus ~2s
- Quantenalgorithmus ist etwa 100-mal langsamer
- Vorhergesagter Kreuzungspunkt bei N≈60, aber Rauschen begrenzt praktische Erreichbarkeit

BF-DCQO-Hybrid-Algorithmus-Ergebnisse

Methodologische Probleme: Ungenaue Laufzeitschätzung, wichtige Gemeinkosten ignoriert
Statistische Probleme: Cherry-Picking basierend auf wenigen Instanzen (5)
Klarer SBM-Vorteil: Bessere Leistung bei identischen Problemen

Ablationsexperimente

Sensitivitätsanalyse der Laufzeitdefinition

Vergleich der Auswirkungen verschiedener Laufzeitdefinitionen:

Laufzeitdefinition	Quantenglüh-Exponenten α	SBM-Exponenten α
Nur Glühzeit	2,23±0,25	-
Gesamt-QPU-Zeit	0,61±1,20	-
Vollständige Laufzeit	0,93±1,24	1,83±0,11

Die Ergebnisse zeigen, dass Quantenalgorithmen äußerst empfindlich gegenüber Laufzeitdefinitionen sind, während klassische Algorithmen relativ robust sind.

Fallstudien

Herausforderungen bei HUBO-Instanzen

Generierte HUBO-Instanzen zeigen unterschiedliche Schwierigkeitsgrade für verschiedene Algorithmen:

SBM: Niedrigere Erfolgsquote bei Cauchy-Verteilungsinstanzen, aber deutlicher Laufzeitvorteil
SA(QUBO): Beste Lösungsqualität, aber längere Laufzeit
SA(HUBO): Ausgezeichnete Leistung bei Pareto-Verteilungsinstanzen

Dies zeigt, dass Instanzcharakteristiken großen Einfluss auf Algorithmusleistung haben und umfassende statistische Analysen erforderlich sind.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Laufzeitbasierte Quantenvorteile auf NISQ-Hardware sind weiterhin schwer zu erreichen: Unter strikten Laufzeitdefinitionen und fairen Benchmark-Vergleichen bestehen alle überprüften Quantenvorteil-Behauptungen nicht
Laufzeitdefinition ist entscheidend: Die hohen Gemeinkosten von Quantenhardware machen eine klare Trennung zwischen "reiner Berechnung" und "Gemeinkosten" schwierig; vollständige Laufzeit muss verwendet werden
Bedeutung der klassischen Benchmark-Auswahl: Die Verwendung der neuesten parallelisierten klassischen Algorithmen als Benchmark ist Voraussetzung für faire Bewertung
Statistische Strenge ist unverzichtbar: Ausreichende Instanzanzahl und statistische Analyse sind für glaubwürdige Quantenvorteil-Behauptungen erforderlich

Einschränkungen

Hardware-Einschränkungen: Bewertung begrenzt auf aktuelle NISQ-Geräte; zukünftige fehlertolerante Quantencomputer könnten Schlussfolgerungen ändern
Problemgröße: Begrenzt durch aktuelle Quantenhardware-Skalierbarkeit; asymptotisches Verhalten bei großen Problemen kann nicht bewertet werden
Algorithmusabdeckung: Nur spezifische Quantenalgorithmen bewertet; kann nicht alle möglichen Quantenmethoden repräsentieren

Zukünftige Richtungen

Verbesserte Laufzeitmessmethoden: Entwicklung präziserer Laufzeitmesswerkzeuge für Quantenalgorithmen
Stärkere klassische Benchmarks: Kontinuierliche Verfolgung neuester Fortschritte in klassischen Algorithmen
Bewertung fehlertoleranter Quantencomputer: Etablierung von Bewertungsrahmen für zukünftige fehlertolerante Quantengeräte
Neue Bewertungsmetriken: Berücksichtigung anderer praktischer Indikatoren neben Laufzeit wie Energieverbrauch und Kosten

Tiefgreifende Bewertung

Stärken

Methodische Strenge: Etablierung eines vollständigen und fairen Bewertungsrahmens für Quantenalgorithmen
Umfassende Experimente: Abdeckung von drei wichtigen Quantenvorteil-Behauptungen mit angemessenem Experimentdesign
Statistische Zuverlässigkeit: Verwendung ausreichender Stichprobengröße, Vermeidung von Cherry-Picking-Verzerrungen
Hoher praktischer Wert: Bereitstellung wichtiger methodologischer Richtlinien für die Quantencomputing-Gemeinschaft
Klare Darstellung: Logische Struktur und präzise technische Beschreibungen

Schwächen

Begrenzte Abdeckung: Nur drei spezifische Fälle bewertet, möglicherweise nicht umfassend genug
Hardware-Abhängigkeit: Schlussfolgerungen könnten sich mit Fortschritten in der Quantenhardware-Technologie ändern
Klassische Algorithmus-Verzerrung: Mögliche Optimierungsverzerrung zugunsten klassischer Methoden
Unzureichende theoretische Analyse: Stärkerer Fokus auf experimentelle Ergebnisse, relativ weniger theoretische Analyse

Auswirkungen

Akademische Auswirkungen: Etablierung neuer Standards für Quantenvorteil-Bewertung, könnte zukünftige Forschungsrichtungen beeinflussen
Praktischer Wert: Hilft Forschern und Investoren, den aktuellen Stand des Quantencomputing objektiver zu bewerten
Politische Bedeutung: Bietet wissenschaftliche Grundlagen für Quantencomputing-Investitionen und Politikgestaltung
Starke Reproduzierbarkeit: Bereitstellung vollständiger Code und Daten für Verifikation und Erweiterung

Anwendungsszenarien

Quantenalgorithmus-Bewertung: Bereitstellung methodologischer Grundlagen für Leistungsbewertung neuer Quantenalgorithmen
Investitionsentscheidungen: Objektive technische Bewertung für Quantencomputing-Investitionen
Forschungsrichtungsleitung: Hilft Forschern, wirklich vielversprechende Quantenanwendungen zu identifizieren
Bildung und Schulung: Wichtiges Referenzmaterial für Quantencomputing-Kurse

Literaturverzeichnis

Dieses Papier zitiert wichtige Literatur im Bereich Quantencomputing, einschließlich:

Feynman, R.P. - Bahnbrechende Arbeiten zum Quantencomputing
Shor, P. - Quantenfaktorisierungsalgorithmus
Simon, D.R. - Originalarbeit zum Simon-Algorithmus
Arute, F. et al. - Google-Quantenvorteil-Behauptung
Munoz-Bauza, H. & Lidar, D. - Quantenglühen-Vorteil-Behauptung

Gesamtbewertung: Dies ist ein Papier mit wichtigem akademischem und praktischem Wert, das durch strikte Experimente und Analysen wichtige Erkenntnisse zur Quantenvorteil-Bewertung für die Quantencomputing-Gemeinschaft liefert. Obwohl die Schlussfolgerungen einige Quantencomputing-Befürworter enttäuschen könnten, tragen seine wissenschaftliche Strenge und methodologischen Beiträge positiv zur Entwicklung des Feldes bei.