Simulating the dynamics of neutral atom arrays is a challenging problem. To address this, we introduce two emulators, emu-sv and emu-mps, as computational backends for Pasqal's pulser package. Emu-sv is designed for high-precision state-vector simulations, giving the possibility to emulate systems of up to $\thicksim 27$ qubits on an A100 40GB GPU, making it perfect for cases where numerically exact results are needed. In contrast, emu-mps uses a Matrix Product State representation and other controlled approximations to efficiently simulate much larger arrays of atoms with manageable errors. We show through benchmark comparisons that both emulators provide significant speed-ups over generic solvers such as QuTiP. In addition, we provide practical guidance on choosing between the two emulators. These quantum software tools are designed to support researchers and developers aiming to simulate quantum systems either as a precursor to full hardware implementation or as a means of benchmarking hardware performance.
- Paper-ID: 2510.09813
- Titel: Efficient Emulation of Neutral Atom Quantum Hardware
- Autoren: Kemal Bidzhiev, Stefano Grava, Pablo le Henaff, Mauro Mendizabal, Elie Merhej, Anton Quelle (PASQAL)
- Klassifizierung: quant-ph (Quantenphysik)
- Veröffentlichungsdatum: 14. Oktober 2025
- Paper-Link: https://arxiv.org/abs/2510.09813
Die Simulation der Dynamik von Neutral-Atom-Arrays ist ein herausforderndes Problem. Um dieses zu lösen, führen die Autoren zwei Simulatoren ein – emu-sv und emu-mps – als Rechenbackends für das Pulser-Paket von Pasqal. Emu-sv ist für hochpräzise Zustandsvektorsimulation konzipiert und kann Systeme mit bis zu 27 Qubits auf einer A100 40GB GPU simulieren, was sich für Fälle eignet, die numerisch exakte Ergebnisse erfordern. Im Gegensatz dazu nutzt emu-mps die Matrixproduktzustand-(MPS-)Darstellung und andere kontrollierte Approximationen, um größere Atom-Arrays effizient zu simulieren und dabei verwaltbare Fehler zu bewahren. Benchmark-Vergleiche zeigen, dass beide Simulatoren erhebliche Beschleunigungen gegenüber universellen Lösern wie QuTiP bieten. Darüber hinaus stellen die Autoren praktische Richtlinien zur Auswahl zwischen den beiden Simulatoren bereit.
- Kernherausforderung: Die Simulation der Quantendynamik von Neutral-Atom-Arrays ist ein rechnerintensives Problem mit exponentieller Komplexität, die mit der Systemgröße wächst
- Bestehende Einschränkungen: Das Pulser-Softwarepaket ist auf QuTiP für klassische Simulation angewiesen, aber QuTiP-Löser können nicht effektiv auf größere Systemskalen skaliert werden, die für Neutral-Atom-Prozessoren relevant sind
- Praktische Anforderungen: Es werden Simulatoren benötigt, die die Eigenschaften des QuTiP-Backends treu wiedergeben und gleichzeitig Leistung und Skalierbarkeit verbessern
- Neutral-Atom-Quantenprozessoren werden wegen ihrer flexiblen Qubit-Konnektivität, Skalierbarkeit und langen Kohärenzzeiten geschätzt
- Sie ermöglichen die Realisierung großer Qubit-Arrays mit dynamisch rekonfigurierbarer Geometrie und kontrollierten Wechselwirkungen
- Anwendbar sowohl auf Quantensimulation als auch auf universelle Quantenberechnung
Die Forschung basiert auf der zeitabhängigen Schrödinger-Gleichung:
idtd∣ψ⟩=H^(t)∣ψ⟩
wobei der Hamilton-Operator gegeben ist durch:
H^(t)=∑i=1N2Ωi(t)σ^ix−∑i=1Nδi(t)n^i+∑i>j∣rij∣6Cn^in^j
- Entwicklung von zwei hochleistungsfähigen Quantensimulatoren:
- emu-sv: Exakter Zustandsvektorsimulator mit Unterstützung für bis zu 27 Qubits
- emu-mps: Approximativer MPS-basierter Simulator für größere Systeme
- Realisierung erheblicher Leistungssteigerungen: Erhebliche Beschleunigung gegenüber universellen Lösern wie QuTiP
- Bereitstellung einer vollständigen Software-Ökosystem-Integration:
- Vollständige Kompatibilität mit dem Pulser-Paket
- Unterstützung für PyTorch-Machine-Learning-Workflows
- Implementierung einer einheitlichen API-Schnittstelle
- Etablierung praktischer Auswahlrichtlinien: Empirische Faustregeln für die Simulatorauswahl in verschiedenen Anwendungsszenarien
Eingaben:
- N-Qubit-Neutral-Atom-System
- Zeitabhängige Steuerparameter Ωᵢ(t) (Rabi-Frequenzen) und δᵢ(t) (Verstimmungen)
- Anfangsquantenzustand |ψ(0)⟩
Ausgaben:
- Zeitlich entwickelter Quantenzustand |ψ(t)⟩
- Erwartungswerte von Observablen
Einschränkungen:
- Speicherbegrenzungen (GPU/CPU)
- Genauigkeitsanforderungen
- Rechenzeitbegrenzungen
- Zustandsdarstellung: Verwendung einer vollständigen Zustandsvektordarstellung mit Dimension 2^N
- Hamilton-Operator-Speicherung: Nutzung der Struktureigenschaften des Rydberg-Hamilton-Operators, wobei nur Diagonalelemente und Ωᵢ-Werte gespeichert werden
- Zeitentwicklungsalgorithmus:
- Verwendung von stückweise konstanter Approximation: |ψ(tₖ₊₁)⟩ = e^(-iHₖdt)|ψ(tₖ)⟩
- Anwendung des Lanczos-Algorithmus zur Berechnung der Matrixexponentialfunktion
- Formal ein Integrator zweiter Ordnung
- MPS-Darstellung: Darstellung des Quantenzustands als Matrixproduktzustand
ci1...iN=Aj1i1Aj1,j2i2…AjNiN
- Zeitentwicklungsalgorithmus:
- Verwendung des zeitabhängigen Variationsprinzips (TDVP)
- Schema mit zweiter Ordnung und zwei Positionen
- Behandlung von Rauschmodellen durch Monte-Carlo-Quantensprünge
- Speicheroptimierung: Kontrolle des Speicherverbrauchs durch Bindungsdimensionen mit exponentiellen Speichereinsparungen für Zustände mit niedriger Verschränkung
- Strukturierte Hamilton-Operator-Speicherung:
- Nutzung der Tatsache, dass σˣᵢ-Terme nur außerdiagonale Elemente erzeugen
- Implementierung von Matrix-Vektor-Multiplikation durch Subvektor-Austausch
- Speichereinsparungen gegenüber COO- und CSR-Formaten
- Adaptive Integrationsordnung:
- Lanczos-Algorithmus erreicht adaptive Ordnung durch Konstruktion von Krylov-Unterräumen
- Vermeidung fester Obergrenzen wie bei ZVODE-Methoden
- Bessere Leistung bei breitem Hamilton-Operator-Spektrum für große Systeme
- Intelligente Qubit-Anordnung:
- Verwendung des Cuthill-McKee-Algorithmus zur Optimierung der Qubit-Reihenfolge in MPS
- Reduzierung von TDVP-Algorithmusfehlern in zweidimensionalen Systemen
- Verringerung erforderlicher Bindungsdimensionen
- GPU: NVIDIA A100 40GB DRAM
- CPU: AMD EPYC 7742, bis zu 1TB RAM
- Softwareversionen:
- Pulser 1.5 (basierend auf QuTiP 5.2, NumPy 2.2, SciPy 1.15)
- Simulatorversion 2.3 (basierend auf PyTorch 2.8)
- Laufzeit: Rechenzeit bei verschiedenen Systemgrößen
- Speicherverbrauch: Spitzenspeichernutzung
- Genauigkeit: Wellenfunktionsnorm-Differenz zur QuTiP-Referenzlösung
- Skalierbarkeit: Maximale Anzahl handhabbarer Qubits
- Pulser-Standard-Backend: ZVODE-ODE-Löser basierend auf QuTiP
- Verschiedene Konfigurationen: Vergleiche mit unterschiedlichen Zeitschrittweiten dt und Genauigkeitsparametern
- Laufzeitvergleich:
- Ab 9 Qubits zeigt emu-sv erhebliche Vorteile gegenüber Pulser
- Exponentielle Skalierung tritt später auf, wird aber letztendlich durch Speicher begrenzt
- GPU-Beschleunigung zeigt signifikante Effekte bei großen Systemen
- Speicherverbrauch:
- 26 Qubits benötigen etwa 1GB Speicher für Zustandsvektorspeicherung
- Annahme von 15 Krylov-Vektoren, Gesamtspeicherverbrauch für 26 Qubits unter 20GB
- Genauigkeitsanalyse:
- Hauptfehlerquelle ist das Zeitdiskretisierungsschema
- Bei dt=5ns typischer Fehler etwa 10⁻⁵
- Genauigkeitsparameter p beeinflusst hauptsächlich Lanczos-Konvergenz, nicht Gesamtfehler
- Speichervorhersage:
- Speicherbedarf für gegebene Qubit-Anzahl N und maximale Bindungsdimension χ kann vorhergesagt werden
- Systemgröße auf 40GB GPU hängt von Bindungsdimension ab
- Laufzeitschätzung:
- Zeitaufwand pro Zeitschritt hängt von N und χ ab
- Lanczos-Iterationszahl zeigt schwache Parameterabhängigkeit über Bereiche
- Genauigkeitskontrolle:
- Standard-Abschneidungsgenauigkeit p=10⁻⁵
- Gesamtfehlerschranke: p × m × (2N-3), wobei m die Anzahl der Zeitschritte ist
- Tatsächlicher Fehler liegt typischerweise unter theoretischer Schranke
Empirische Faustregeln basierend auf GPU-Benchmarks:
- ≤27 Qubits: emu-sv empfohlen
- >27 Qubits: emu-mps empfohlen
- Berechnung dynamischer Strukturfaktoren: emu-mps erfolgreich bei Systemen mit über 20 Qubits angewendet
- Quantengraph-Optimierung: Beide Simulatoren auf quantengraph-optimierungsbezogene Probleme angewendet
- QuTiP: Universelles Quantenwerkzeugkasten mit ZVODE-Löser für zeitabhängige Probleme
- Pulser: Open-Source-Python-Paket speziell für Neutral-Atom-Quantenberechnung
- Andere Plattformen: Simulationswerkzeuge für verschiedene Hardwareplattformen (supraleitende Qubits, Ionenfallen, photonische Geräte)
- MPS/DMRG: Dichtematzrix-Renormalisierungsgruppe und Matrixproduktzustand-Methoden
- TDVP: Zeitabhängiges Variationsprinzip in Quantendynamik
- Quantenmonte-Carlo: Stochastische Methoden für offene Systemdynamik
- Erhebliche Leistungssteigerung: Beide Simulatoren bieten große Leistungsverbesserungen gegenüber QuTiP
- Komplementäres Design: emu-sv eignet sich für exakte Kleinskalen-Berechnungen, emu-mps für großskalige Approximationen
- Benutzerfreundlichkeit: Einheitliches API-Design ermöglicht einfachen Wechsel zwischen Simulatoren
- Emu-sv-Speicherbegrenzung: Begrenzt durch exponentielle Zustandsvektorvergrößerung, maximal etwa 27 Qubits
- Emu-mps-Genauigkeitskontrolle: Erfordert korrekte Konfiguration von Abschneidungsparametern, Anordnungsprobleme in zweidimensionalen Systemen
- Integrationsordnung: Derzeit Integrator zweiter Ordnung, keine höherwertigen Methoden wie Richardson-Extrapolation
- Differenzierbarkeit: Emu-sv unterstützt bereits differenzierbare Berechnung, Plan zur Hinzufügung für emu-mps
- Grundzustand-Verfolgung: Implementierung des DMRG-Algorithmus zur Verfolgung des Grundzustands während Zeitentwicklung
- Rauschmodell-Erweiterung: Hinzufügung neuer Rauschquellen basierend auf Hardware-Team-Analysen
- Machine-Learning-Integration: Unterstützung für PyTorch-basierte Machine-Learning-Workflows
- Hoher praktischer Wert: Löst direkt praktische Anforderungen im Neutral-Atom-Quantencomputing
- Ausgezeichnete technische Implementierung:
- Vollständige Nutzung der Struktureigenschaften des Rydberg-Hamilton-Operators
- Adaptive Eigenschaften des Lanczos-Algorithmus zeigen gute Leistung bei großen Systemen
- MPS-Methode zeigt signifikante Speicheroptimierung für Zustände mit niedriger Verschränkung
- Softwareingenieur-Qualität:
- Gute Integration mit bestehendem Ökosystem
- Einheitliches API-Design erleichtert Verwendung
- Bereitstellung praktischer Auswahlrichtlinien
- Umfassende Benchmarks: Detaillierte Vergleiche über mehrere Dimensionen (Laufzeit, Speicher, Genauigkeit)
- Begrenzte theoretische Analyse:
- Fehlende theoretische Analyse der Algorithmen-Komplexität
- Unzureichende Analyse der theoretischen Fehlerschranken des TDVP-Algorithmus
- Relativ begrenzte Anwendungsszenarien:
- Hauptsächlich auf Neutral-Atom-Systeme ausgerichtet
- Anwendbarkeit auf andere Quantenhardware-Plattformen nicht ausreichend erforscht
- Fehlende höherwertige Methoden:
- Keine Implementierung von Richardson-Extrapolation und anderen höherwertigen Integrationsmethoden
- Möglicherweise unzureichende Leistung in Szenarien mit hohen Genauigkeitsanforderungen
- Beitrag zum Fachgebiet: Bereitstellung wichtiger Simulationswerkzeuge für Neutral-Atom-Quantenberechnung
- Praktischer Wert: Bereits in mehreren Forschungsprojekten validiert und angewendet
- Open-Source-Beitrag: Als Teil des Pulser-Ökosystems förderlich für Fachentwicklung
- Quantenalgorithmus-Entwicklung: Algorithmusvalidierung vor Hardware-Implementierung
- Hardware-Benchmarking: Bewertung der Quantenhardware-Leistung
- Quantenphysik-Forschung: Untersuchung der Dynamik von Vielteilchen-Quantensystemen
- Bildung und Training: Quantencomputing-Lehre und Forschungsschulung
Das Papier zitiert 51 relevante Referenzen, die wichtige Arbeiten in mehreren Bereichen abdecken – Quantencomputing-Hardware, numerische Algorithmen, Tensornetzwerk-Methoden – und bieten eine solide theoretische Grundlage für die Forschung.
Gesamtbewertung: Dies ist ein hochqualitatives anwendungsorientiertes Forschungspapier, das praktische Anforderungen im Neutral-Atom-Quantencomputing-Bereich löst. Mit solider technischer Implementierung, umfassender experimenteller Validierung und starkem praktischem Wert hat es große Bedeutung und Verbreitungspotenzial.