2025-11-23T13:22:17.314370

Recent quantum runtime (dis)advantages

Tuziemski, Pawłowski, Tarasiuk et al.
We (re)evaluate recent claims of quantum advantage in annealing- and gate-based algorithms, testing whether reported speedups survive rigorous end-to-end runtime definitions and comparison against strong classical baselines. Conventional analyses often omit substantial overhead (readout, transpilation, thermalization, etc.) yielding biased assessments. While excluding seemingly not important parts of the simulation may seem reasonable, on most current quantum hardware a clean separation between "pure compute" and "overhead" cannot be experimentally justified. This may distort "supremacy" results. In contrast, for most classical hardware total time $\approx$ compute $+$ a weakly varying constant leading to robust claims. We scrutinize two important milestones: (1) quantum annealing for approximate QUBO PRL 134, 160601 (2025) [https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.134.160601], which uses a sensible time-to-$ε$ metric but proxies runtime by the annealing time (non-measurable); (2) a restricted Simon's problem PRX 15, 021082 (2025) [https://journals.aps.org/prx/abstract/10.1103/PhysRevX.15.021082] , whose advantageous scaling in oracle calls is undisputed; yet, as we demonstrate, estimated runtime of the quantum experiment is $\sim 100 \times$ slower than a tuned classical baseline. Finally, we show that recently claimed "runtime advantage" of the BF-DCQO hybrid algorithm (arXiv:2505.08663) does not withstand rigorous benchmarking. Therefore, we conclude that runtime-based supremacy remains elusive on NISQ hardware, and credible claims require a careful time accounting with a proper reference selections, and an adequate metric.
academic

Jüngste Quantenlaufzeit-(Dis)Vorteile

Grundlegende Informationen

  • Papier-ID: 2510.06337
  • Titel: Recent quantum runtime (dis)advantages
  • Autoren: J. Tuziemski, J. Pawłowski, P. Tarasiuk, Ł. Pawela, B. Gardas
  • Klassifizierung: quant-ph
  • Veröffentlichungsdatum: 16. Oktober 2025 (arXiv v2)
  • Papierlink: https://arxiv.org/abs/2510.06337

Zusammenfassung

Dieses Papier bewertet kürzliche Behauptungen über Quantenvorteil neu, insbesondere bei Quantenglühen und gattergestützten Algorithmen, und prüft, ob die gemeldeten Beschleunigungseffekte unter strikten End-to-End-Laufzeitdefinitionen und im Vergleich mit starken klassischen Benchmarks bestehen bleiben. Herkömmliche Analysen vernachlässigen häufig erhebliche Gemeinkosten (Auslesen, Übersetzung, Thermalisierung usw.), was zu verzerrten Bewertungen führt. Die Autoren überprüfen drei wichtige Meilensteine: (1) Quantenglühen für approximative QUBO; (2) eingeschränktes Simon-Problem; (3) BF-DCQO-Hybrid-Algorithmus. Die Ergebnisse deuten darauf hin, dass laufzeitbasierte Quantenvorteile auf NISQ-Hardware weiterhin schwer zu erreichen sind.

Forschungshintergrund und Motivation

Forschungsfrage

Die zentrale Frage, die dieses Papier adressiert, lautet: Bleiben aktuelle Behauptungen über Quantenvorteil unter strikten Laufzeitdefinitionen und fairen klassischen Benchmark-Vergleichen gültig?

Bedeutung des Problems

  1. Praktische Überlegungen: Das ultimative Ziel des Quantencomputing ist es, klassisches Computing in praktischen Anwendungen zu übertreffen, wobei die Laufzeitleistung ein Schlüsselindikator für praktischen Wert ist
  2. Bewertungsverzerrungsproblem: Bestehende Forschung vernachlässigt häufig erhebliche Gemeinkosten von Quantenhardware, was zu übermäßig optimistischen Bewertungen des Quantenvorteils führt
  3. Wissenschaftliche Strenge: Es ist notwendig, faire und strikte Benchmark-Methoden zur Bewertung der echten Leistung von Quantenalgorithmen zu etablieren

Einschränkungen bestehender Methoden

  1. Unangemessene Laufzeitdefinition: Viele Studien berücksichtigen nur "reine Rechenzeit" und ignorieren Auslesen, Thermalisierung, Übersetzung und andere Gemeinkosten
  2. Benchmark-Auswahlverzerrung: Klassische Benchmark-Algorithmen werden nicht angemessen ausgewählt und verwenden nicht die neuesten Parallelisierungsmethoden
  3. Unzureichende statistische Analyse: Mangelnde statistische Analyse mit Cherry-Picking-Problemen

Forschungsmotivation

Die Autoren argumentieren, dass mit der Reifung der Quantentechnologie strengere Bewertungsstandards erforderlich sind, um die Authentizität des Quantenvorteils zu überprüfen und Übertreibungen zu vermeiden, die wissenschaftliche Urteile beeinflussen.

Kernbeiträge

  1. Etablierung eines strikten Laufzeitdefinitionsrahmens: Vorschlag einer vollständigen Laufzeitdefinition, die alle notwendigen Komponenten enthält (Programmierung, Ausführung, Auslesen, Thermalisierung)
  2. Neubewertung von drei wichtigen Quantenvorteil-Behauptungen:
    • Quantenglühen-Vorteil bei approximativen QUBO-Problemen
    • Abfragekomplexitätsvorteil des eingeschränkten Simon-Problems
    • Laufzeitvorteil des BF-DCQO-Hybrid-Algorithmus
  3. Aufdeckung der Grundursachen von Bewertungsverzerrungen: Analyse, warum Quantenhardware eine klare Trennung zwischen "reiner Berechnung" und "Gemeinkosten" schwer erreichen kann
  4. Bereitstellung von Richtlinien für faire Benchmark-Tests: Etablierung von Bewertungsstandards und Methoden für zukünftige Quantenvorteil-Behauptungen

Methodische Details

Aufgabendefinition

Dieses Papier bewertet die Leistung von Quantenalgorithmen bei den folgenden drei konkreten Aufgaben neu:

  • Eingabe: Optimierungsprobleminstanzen, Oracle-Abfragen, HUBO-Probleme
  • Ausgabe: Problemlösungen oder Abfrageergebnisse
  • Einschränkungen: Echte Laufzeitleistung unter aktuellen NISQ-Hardware-Einschränkungen

Laufzeitdefinitionsrahmen

Quantenglüh-Gerätelaufzeit

Die vollständige Laufzeit des Quantenglühens sollte Folgendes umfassen:

Gesamtlaufzeit = Programmierzeit + Glühzeit + Auslesezeit + Thermalisierungszeit

Wichtige Erkenntnisse:

  • Auslesezeit etwa 200 μs, während Glühzeit nur 0,5–27 μs beträgt
  • Auslesezeit ist zwei Größenordnungen länger als Glühzeit
  • Dies führt zu erheblichen Verzerrungen bei der Leistungsbewertung basierend auf Glühzeit

Digitale Quantengerätelaufzeit

Die vollständige Laufzeit des digitalen Quantencomputing umfasst:

Gesamtlaufzeit = Vorverarbeitungszeit + Übersetzungszeit + Ausführungszeit + Auslesezeit + Thermalisierungszeit

Time-to-ε (TTε) Metrik

TTε=tflog(10.99)log(1pEE0+εE0)TTε = t_f \cdot \frac{\log(1-0.99)}{\log(1-p_{E≤E_0+ε|E_0})}

Wobei:

  • tft_f: Zeit zur Generierung einer Lösung
  • pEE0+εE0p_{E≤E_0+ε|E_0}: Wahrscheinlichkeit, eine Lösung innerhalb der ε-Optimalitätslücke zu finden

Technische Innovationen

  1. Umfassende Laufzeitmessung: Erste systematische Einbeziehung aller Zeitgemeinkosten in Quantencomputingphasen
  2. Starke klassische Benchmarks: Verwendung GPU-optimierter paralleler Algorithmen (z. B. SBM) als Benchmark
  3. Statistische Strenge: Vermeidung von Cherry-Picking durch Verwendung ausreichender Instanzanzahl für statistische Analyse

Experimentelle Einrichtung

Bewertungsfälle

Fall 1: Quantenglühen für approximative QUBO

  • Datensatz: Sidon-28-Instanzen, Größe N∈142, 1322
  • Quantengerät: D-Wave Quantenglüh-Maschine
  • Klassischer Benchmark: Simulierte Bifurkationsmaschine (SBM)
  • Metrik: TTε-Median

Fall 2: Eingeschränktes Simon-Problem

  • Problemgröße: 29-Bit-Eingabe, Hamming-Gewicht w∈2,7
  • Quantengerät: IBM Brisbane
  • Klassische Implementierung: Brute-Force-Algorithmus auf GPU
  • Metrik: Oracle-Aufrufe und echte Laufzeit

Fall 3: BF-DCQO-Hybrid-Algorithmus

  • Problemtyp: Hochordnungsunbeschränkte binäre Optimierung (HUBO)
  • Instanzgröße: N∈80, 100, 130, 156
  • Vergleichsmethoden: CPLEX, simuliertes Glühen, SBM

Implementierungsdetails

  • Hardware-Umgebung: Dual Intel Xeon Platinum 8462Y+ CPU, 4×NVIDIA H100 GPU, 1 TB RAM
  • Statistische Methode: 50 zufällige Instanzen, mehrere unabhängige Durchläufe
  • Parameteroptimierung: Hyperparameter-Tuning für alle Algorithmen

Experimentelle Ergebnisse

Hauptergebnisse

Quantenglüh-Ergebnisse

Mit vollständiger Laufzeitdefinition:

  • TTεMed ist nahezu konstant: Unsicherheit des angepassten Exponenten α ist zu groß für nicht-triviale Schlussfolgerungen
  • Auslesezeit dominiert: Macht den Hauptteil der Gesamtlaufzeit aus
  • SBM zeigt bessere Leistung: Bessere Skalierbarkeit bei identischen Problemen

Ergebnisse des eingeschränkten Simon-Problems

  • Abfragekomplexitätsvorteil existiert tatsächlich: Quantenalgorithmus benötigt theoretisch weniger Oracle-Aufrufe
  • Echte Laufzeitnachteil ist signifikant:
    • N=29, w=7: Klassischer Algorithmus ~0,035s, Quantenalgorithmus ~2s
    • Quantenalgorithmus ist etwa 100-mal langsamer
    • Vorhergesagter Kreuzungspunkt bei N≈60, aber Rauschen begrenzt praktische Erreichbarkeit

BF-DCQO-Hybrid-Algorithmus-Ergebnisse

  • Methodologische Probleme: Ungenaue Laufzeitschätzung, wichtige Gemeinkosten ignoriert
  • Statistische Probleme: Cherry-Picking basierend auf wenigen Instanzen (5)
  • Klarer SBM-Vorteil: Bessere Leistung bei identischen Problemen

Ablationsexperimente

Sensitivitätsanalyse der Laufzeitdefinition

Vergleich der Auswirkungen verschiedener Laufzeitdefinitionen:

LaufzeitdefinitionQuantenglüh-Exponenten αSBM-Exponenten α
Nur Glühzeit2,23±0,25-
Gesamt-QPU-Zeit0,61±1,20-
Vollständige Laufzeit0,93±1,241,83±0,11

Die Ergebnisse zeigen, dass Quantenalgorithmen äußerst empfindlich gegenüber Laufzeitdefinitionen sind, während klassische Algorithmen relativ robust sind.

Fallstudien

Herausforderungen bei HUBO-Instanzen

Generierte HUBO-Instanzen zeigen unterschiedliche Schwierigkeitsgrade für verschiedene Algorithmen:

  • SBM: Niedrigere Erfolgsquote bei Cauchy-Verteilungsinstanzen, aber deutlicher Laufzeitvorteil
  • SA(QUBO): Beste Lösungsqualität, aber längere Laufzeit
  • SA(HUBO): Ausgezeichnete Leistung bei Pareto-Verteilungsinstanzen

Dies zeigt, dass Instanzcharakteristiken großen Einfluss auf Algorithmusleistung haben und umfassende statistische Analysen erforderlich sind.

Verwandte Arbeiten

Theoretische Grundlagen des Quantenvorteils

  • Simon-Algorithmus: Exponentielle Abfragekomplexitätstrennung
  • Shor-Algorithmus: Basierend auf Faktorisierungsschwierigkeitsannahme
  • Zufällige Schaltkreisabtastung: Erste experimentelle Quantenvorteil-Behauptung

Heuristische Quantenalgorithmen

  • Quantenglühen: Suche nach Vorteil bei spezifischen NP-schweren Probleminstanzen
  • Variationelle Quantenalgorithmen: Hauptrichtung der NISQ-Ära
  • Hybrid-Quantenklassische Algorithmen: Kombination der Vorteile beider Rechenmodi

Benchmark-Testmethoden

  • TTε-Metrik: Standardbewertungsmethode für approximative Optimierung
  • Abfragekomplexitätsrahmen: Wichtiges Werkzeug für theoretische Analyse
  • Klassische Benchmark-Auswahl: Schlüsselfaktor, der die Gültigkeit von Quantenvorteil-Behauptungen beeinflusst

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Laufzeitbasierte Quantenvorteile auf NISQ-Hardware sind weiterhin schwer zu erreichen: Unter strikten Laufzeitdefinitionen und fairen Benchmark-Vergleichen bestehen alle überprüften Quantenvorteil-Behauptungen nicht
  2. Laufzeitdefinition ist entscheidend: Die hohen Gemeinkosten von Quantenhardware machen eine klare Trennung zwischen "reiner Berechnung" und "Gemeinkosten" schwierig; vollständige Laufzeit muss verwendet werden
  3. Bedeutung der klassischen Benchmark-Auswahl: Die Verwendung der neuesten parallelisierten klassischen Algorithmen als Benchmark ist Voraussetzung für faire Bewertung
  4. Statistische Strenge ist unverzichtbar: Ausreichende Instanzanzahl und statistische Analyse sind für glaubwürdige Quantenvorteil-Behauptungen erforderlich

Einschränkungen

  1. Hardware-Einschränkungen: Bewertung begrenzt auf aktuelle NISQ-Geräte; zukünftige fehlertolerante Quantencomputer könnten Schlussfolgerungen ändern
  2. Problemgröße: Begrenzt durch aktuelle Quantenhardware-Skalierbarkeit; asymptotisches Verhalten bei großen Problemen kann nicht bewertet werden
  3. Algorithmusabdeckung: Nur spezifische Quantenalgorithmen bewertet; kann nicht alle möglichen Quantenmethoden repräsentieren

Zukünftige Richtungen

  1. Verbesserte Laufzeitmessmethoden: Entwicklung präziserer Laufzeitmesswerkzeuge für Quantenalgorithmen
  2. Stärkere klassische Benchmarks: Kontinuierliche Verfolgung neuester Fortschritte in klassischen Algorithmen
  3. Bewertung fehlertoleranter Quantencomputer: Etablierung von Bewertungsrahmen für zukünftige fehlertolerante Quantengeräte
  4. Neue Bewertungsmetriken: Berücksichtigung anderer praktischer Indikatoren neben Laufzeit wie Energieverbrauch und Kosten

Tiefgreifende Bewertung

Stärken

  1. Methodische Strenge: Etablierung eines vollständigen und fairen Bewertungsrahmens für Quantenalgorithmen
  2. Umfassende Experimente: Abdeckung von drei wichtigen Quantenvorteil-Behauptungen mit angemessenem Experimentdesign
  3. Statistische Zuverlässigkeit: Verwendung ausreichender Stichprobengröße, Vermeidung von Cherry-Picking-Verzerrungen
  4. Hoher praktischer Wert: Bereitstellung wichtiger methodologischer Richtlinien für die Quantencomputing-Gemeinschaft
  5. Klare Darstellung: Logische Struktur und präzise technische Beschreibungen

Schwächen

  1. Begrenzte Abdeckung: Nur drei spezifische Fälle bewertet, möglicherweise nicht umfassend genug
  2. Hardware-Abhängigkeit: Schlussfolgerungen könnten sich mit Fortschritten in der Quantenhardware-Technologie ändern
  3. Klassische Algorithmus-Verzerrung: Mögliche Optimierungsverzerrung zugunsten klassischer Methoden
  4. Unzureichende theoretische Analyse: Stärkerer Fokus auf experimentelle Ergebnisse, relativ weniger theoretische Analyse

Auswirkungen

  1. Akademische Auswirkungen: Etablierung neuer Standards für Quantenvorteil-Bewertung, könnte zukünftige Forschungsrichtungen beeinflussen
  2. Praktischer Wert: Hilft Forschern und Investoren, den aktuellen Stand des Quantencomputing objektiver zu bewerten
  3. Politische Bedeutung: Bietet wissenschaftliche Grundlagen für Quantencomputing-Investitionen und Politikgestaltung
  4. Starke Reproduzierbarkeit: Bereitstellung vollständiger Code und Daten für Verifikation und Erweiterung

Anwendungsszenarien

  1. Quantenalgorithmus-Bewertung: Bereitstellung methodologischer Grundlagen für Leistungsbewertung neuer Quantenalgorithmen
  2. Investitionsentscheidungen: Objektive technische Bewertung für Quantencomputing-Investitionen
  3. Forschungsrichtungsleitung: Hilft Forschern, wirklich vielversprechende Quantenanwendungen zu identifizieren
  4. Bildung und Schulung: Wichtiges Referenzmaterial für Quantencomputing-Kurse

Literaturverzeichnis

Dieses Papier zitiert wichtige Literatur im Bereich Quantencomputing, einschließlich:

  1. Feynman, R.P. - Bahnbrechende Arbeiten zum Quantencomputing
  2. Shor, P. - Quantenfaktorisierungsalgorithmus
  3. Simon, D.R. - Originalarbeit zum Simon-Algorithmus
  4. Arute, F. et al. - Google-Quantenvorteil-Behauptung
  5. Munoz-Bauza, H. & Lidar, D. - Quantenglühen-Vorteil-Behauptung

Gesamtbewertung: Dies ist ein Papier mit wichtigem akademischem und praktischem Wert, das durch strikte Experimente und Analysen wichtige Erkenntnisse zur Quantenvorteil-Bewertung für die Quantencomputing-Gemeinschaft liefert. Obwohl die Schlussfolgerungen einige Quantencomputing-Befürworter enttäuschen könnten, tragen seine wissenschaftliche Strenge und methodologischen Beiträge positiv zur Entwicklung des Feldes bei.