Simulating the dynamics of neutral atom arrays is a challenging problem. To address this, we introduce two emulators, emu-sv and emu-mps, as computational backends for Pasqal's pulser package. Emu-sv is designed for high-precision state-vector simulations, giving the possibility to emulate systems of up to $\thicksim 27$ qubits on an A100 40GB GPU, making it perfect for cases where numerically exact results are needed. In contrast, emu-mps uses a Matrix Product State representation and other controlled approximations to efficiently simulate much larger arrays of atoms with manageable errors. We show through benchmark comparisons that both emulators provide significant speed-ups over generic solvers such as QuTiP. In addition, we provide practical guidance on choosing between the two emulators. These quantum software tools are designed to support researchers and developers aiming to simulate quantum systems either as a precursor to full hardware implementation or as a means of benchmarking hardware performance.
- ID de l'article: 2510.09813
- Titre: Efficient Emulation of Neutral Atom Quantum Hardware
- Auteurs: Kemal Bidzhiev, Stefano Grava, Pablo le Henaff, Mauro Mendizabal, Elie Merhej, Anton Quelle (PASQAL)
- Classification: quant-ph (Physique quantique)
- Date de publication: 14 octobre 2025
- Lien de l'article: https://arxiv.org/abs/2510.09813
La simulation de la dynamique des réseaux d'atomes neutres constitue un problème complexe. Pour résoudre cette problématique, les auteurs introduisent deux simulateurs — emu-sv et emu-mps — en tant que backends de calcul du package pulser de Pasqal. Emu-sv est conçu pour la simulation de vecteur d'état haute précision, capable de simuler jusqu'à 27 qubits sur un GPU A100 40GB, ce qui le rend particulièrement adapté aux situations nécessitant des résultats numériquement exacts. En contraste, emu-mps utilise la représentation par état de produit matriciel (MPS) et d'autres approximations contrôlées pour simuler efficacement des réseaux atomiques plus grands tout en maintenant une erreur gérable. Les comparaisons de référence démontrent que les deux simulateurs offrent une accélération significative par rapport aux solveurs génériques tels que QuTiP. De plus, les auteurs fournissent des directives pratiques pour le choix entre les deux simulateurs.
- Défi fondamental: La simulation de la dynamique quantique des réseaux d'atomes neutres constitue un problème intensif en calcul, avec une complexité croissant exponentiellement avec la taille du système
- Limitations existantes: Le package Pulser dépend de QuTiP pour la simulation classique, mais les solveurs QuTiP ne peuvent pas s'adapter efficacement aux échelles de système plus grandes pertinentes pour les processeurs à atomes neutres
- Besoins pratiques: Nécessité de simulateurs capables de reproduire fidèlement les caractéristiques du backend QuTiP tout en améliorant les performances et la scalabilité
- Les processeurs quantiques à atomes neutres suscitent un intérêt considérable en raison de leur connectivité flexible des qubits, de leur scalabilité et de leurs longs temps de cohérence
- Capacité à réaliser de grands réseaux de qubits avec une géométrie dynamiquement reconfigurable et des interactions contrôlables
- Applicables à la fois à la simulation quantique et au calcul quantique universel
La recherche s'appuie sur l'équation de Schrödinger dépendante du temps:
idtd∣ψ⟩=H^(t)∣ψ⟩
où l'hamiltonien est défini comme:
H^(t)=∑i=1N2Ωi(t)σ^ix−∑i=1Nδi(t)n^i+∑i>j∣rij∣6Cn^in^j
- Développement de deux simulateurs quantiques haute performance:
- emu-sv: simulateur exact basé sur le vecteur d'état, supportant jusqu'à 27 qubits
- emu-mps: simulateur approximatif basé sur l'état de produit matriciel, capable de traiter des systèmes de plus grande envergure
- Réalisation d'améliorations de performance significatives: accélération considérable par rapport aux solveurs génériques tels que QuTiP
- Fourniture d'un écosystème logiciel complet intégré:
- Compatibilité complète avec le package Pulser
- Support des workflows d'apprentissage automatique PyTorch
- Implémentation d'une interface API unifiée
- Établissement de directives pratiques de sélection: règles empiriques pour le choix du simulateur selon différents scénarios d'application
Entrées:
- Système d'atomes neutres comportant N qubits
- Paramètres de contrôle dépendants du temps Ωᵢ(t) (fréquences de Rabi) et δᵢ(t) (désaccords)
- État quantique initial |ψ(0)⟩
Sorties:
- État quantique |ψ(t)⟩ après évolution temporelle
- Valeurs d'espérance des observables
Contraintes:
- Limitations de mémoire (GPU/CPU)
- Exigences de précision
- Limites de temps de calcul
- Représentation d'état: utilisation d'une représentation complète du vecteur d'état, de dimension 2^N
- Stockage de l'hamiltonien: exploitation des caractéristiques structurelles de l'hamiltonien de Rydberg, stockage uniquement des éléments diagonaux et des valeurs Ωᵢ
- Algorithme d'évolution temporelle:
- Utilisation d'une approximation par constante par segments: |ψ(tₖ₊₁)⟩ = e^(-iHₖdt)|ψ(tₖ)⟩
- Adoption de l'algorithme de Lanczos pour le calcul de l'exponentielle matricielle
- Formellement un intégrateur du second ordre
- Représentation MPS: représentation de l'état quantique sous forme d'état de produit matriciel
ci1...iN=Aj1i1Aj1,j2i2…AjNiN
- Algorithme d'évolution temporelle:
- Utilisation du principe variationnel dépendant du temps (TDVP)
- Schéma TDVP bisite du second ordre
- Traitement des modèles de bruit via sauts quantiques de Monte Carlo
- Optimisation mémoire: contrôle de l'utilisation mémoire via la dimension de liaison, réalisant des économies mémoire exponentielles pour les états faiblement intriqués
- Stockage structuré de l'hamiltonien:
- Exploitation de la propriété que les termes σˣᵢ ne produisent que des éléments hors-diagonaux
- Implémentation de la multiplication matrice-vecteur via échange de sous-vecteurs
- Économies mémoire par rapport aux formats COO et CSR
- Ordre d'intégration adaptatif:
- L'algorithme de Lanczos réalise un ordre adaptatif via la construction d'un sous-espace de Krylov
- Évite les limites supérieures fixes des méthodes comme ZVODE
- Performance améliorée sur les systèmes de grande taille avec spectre hamiltonien large
- Ordonnancement intelligent des qubits:
- Utilisation de l'algorithme de Cuthill-McKee pour optimiser l'ordre des qubits dans le MPS
- Réduction de l'erreur de l'algorithme TDVP dans les systèmes bidimensionnels
- Diminution de la dimension de liaison requise
- GPU: NVIDIA A100 40GB DRAM
- CPU: AMD EPYC 7742, jusqu'à 1TB RAM
- Versions logicielles:
- Pulser 1.5 (basé sur QuTiP 5.2, NumPy 2.2, SciPy 1.15)
- Version simulateur 2.3 (basée sur PyTorch 2.8)
- Temps d'exécution: temps de calcul pour différentes tailles de système
- Consommation mémoire: utilisation mémoire maximale
- Précision: divergence de la norme de la fonction d'onde par rapport à la référence QuTiP
- Scalabilité: nombre maximal de qubits traitable
- Backend par défaut Pulser: solveur ODE ZVODE basé sur QuTiP
- Configurations différentes: comparaisons avec différents pas de temps dt et paramètres de précision
- Comparaison des temps d'exécution:
- À partir de 9 qubits, emu-sv surpasse significativement Pulser
- L'échelle exponentielle apparaît plus tard, mais finit par être limitée par la mémoire
- L'accélération GPU montre des effets significatifs sur les grands systèmes
- Consommation mémoire:
- Environ 1GB de mémoire nécessaire pour stocker le vecteur d'état de 26 qubits
- En supposant 15 vecteurs de Krylov, la consommation mémoire totale pour 26 qubits reste inférieure à 20GB
- Analyse de précision:
- Les sources d'erreur principales proviennent du schéma de discrétisation temporelle
- Avec dt=5ns, l'erreur typique est environ 10⁻⁵
- Le paramètre de précision p affecte principalement la convergence de Lanczos, non l'erreur globale
- Prédiction mémoire:
- Estimation préalable possible des besoins mémoire pour un nombre de qubits N et une dimension de liaison maximale χ donnés
- L'échelle du système traitable sur un GPU 40GB dépend de la dimension de liaison
- Estimation du temps d'exécution:
- Le temps par pas de temps dépend de N et χ
- Le nombre d'itérations de Lanczos montre une dépendance relativement faible à la plage de paramètres
- Contrôle de précision:
- Précision de troncature par défaut p=10⁻⁵
- Limite d'erreur totale: p × m × (2N-3), où m est le nombre de pas de temps
- L'erreur réelle est généralement inférieure à la limite théorique
Règles empiriques basées sur les benchmarks GPU:
- ≤27 qubits: utilisation recommandée d'emu-sv
- >27 qubits: utilisation recommandée d'emu-mps
- Calcul du facteur de structure dynamique: emu-mps appliqué avec succès à des systèmes dépassant 20 qubits
- Optimisation de graphes quantiques: les deux simulateurs appliqués aux problèmes d'optimisation de graphes quantiques
- QuTiP: boîte à outils quantique générique, utilisant le solveur ZVODE pour les problèmes dépendants du temps
- Pulser: package Python open-source spécialisé dans le calcul quantique à atomes neutres
- Autres plateformes: outils de simulation pour différentes plateformes matérielles (qubits supraconducteurs, pièges à ions, dispositifs photoniques)
- MPS/DMRG: groupe de renormalisation de matrice densité et méthodes d'état de produit matriciel
- TDVP: principe variationnel dépendant du temps appliqué à la dynamique quantique
- Monte Carlo quantique: méthodes stochastiques pour traiter la dynamique des systèmes ouverts
- Améliorations de performance significatives: les deux simulateurs offrent des améliorations de performance considérables par rapport à QuTiP
- Conception complémentaire: emu-sv adapté aux calculs exacts à petite échelle, emu-mps adapté aux calculs approximatifs à grande échelle
- Facilité d'utilisation: la conception API unifiée rend la commutation entre simulateurs simple
- Limitations mémoire d'emu-sv: limitée par la croissance exponentielle du vecteur d'état, environ 27 qubits maximum
- Contrôle de précision d'emu-mps: nécessite une configuration correcte des paramètres de troncature, problèmes d'ordonnancement dans les systèmes bidimensionnels
- Ordre d'intégration: utilisation actuelle d'un intégrateur du second ordre, pas de méthodes d'ordre supérieur comme l'extrapolation de Richardson
- Différentiabilité: emu-sv supporte déjà le calcul différentiable, plan d'ajout de cette fonctionnalité à emu-mps
- Suivi d'état fondamental: implémentation de l'algorithme DMRG pour suivre l'état fondamental lors de l'évolution temporelle
- Extension des modèles de bruit: ajout de nouvelles sources de bruit selon l'analyse de l'équipe matérielle
- Intégration d'apprentissage automatique: support des workflows d'apprentissage automatique basés sur PyTorch
- Valeur pratique élevée: résolution directe des besoins réels du domaine du calcul quantique à atomes neutres
- Implémentation technique excellente:
- Exploitation complète des caractéristiques structurelles de l'hamiltonien de Rydberg
- Caractère adaptatif de l'algorithme de Lanczos performant sur les systèmes de grande taille
- Optimisation mémoire significative de la méthode MPS pour les états faiblement intriqués
- Qualité d'ingénierie logicielle:
- Intégration excellente avec l'écosystème existant
- Conception API unifiée facilitant l'utilisation
- Fourniture de directives pratiques de sélection
- Benchmarking suffisant: comparaisons détaillées multidimensionnelles incluant temps d'exécution, mémoire et précision
- Analyse théorique limitée:
- Absence d'analyse théorique de la complexité algorithmique
- Analyse insuffisante des limites théoriques d'erreur de l'algorithme TDVP
- Scénarios d'application relativement limités:
- Orientation principale vers les systèmes à atomes neutres
- Applicabilité insuffisamment explorée à d'autres plateformes matérielles quantiques
- Absence de méthodes d'ordre supérieur:
- Pas d'implémentation de l'extrapolation de Richardson ou d'autres méthodes d'ordre supérieur
- Performance potentiellement insuffisante dans certains scénarios d'exigences haute précision
- Contribution au domaine: fourniture d'outils de simulation importants pour le calcul quantique à atomes neutres
- Valeur pratique: validation d'application dans plusieurs projets de recherche
- Contribution open-source: promotion du développement du domaine en tant que partie de l'écosystème Pulser
- Développement d'algorithmes quantiques: vérification d'algorithmes avant implémentation matérielle
- Benchmarking matériel quantique: évaluation des performances du matériel quantique
- Recherche en physique quantique: étude du comportement dynamique des systèmes quantiques à plusieurs corps
- Formation et enseignement: enseignement du calcul quantique et formation à la recherche
L'article cite 51 références pertinentes, couvrant plusieurs domaines incluant le matériel de calcul quantique, les algorithmes numériques et les méthodes de réseaux tensoriels, fournissant une base théorique solide pour la recherche.
Évaluation Globale: Cet article représente une recherche de haute qualité de nature appliquée, résolvant les besoins réels du domaine du calcul quantique à atomes neutres, avec une implémentation technique solide, une vérification expérimentale complète, et une valeur pratique et un potentiel de diffusion considérables.