2025-11-18T04:37:13.643074

Efficient Emulation of Neutral Atom Quantum Hardware

Bidzhiev, Grava, Henaff et al.

Simulating the dynamics of neutral atom arrays is a challenging problem. To address this, we introduce two emulators, emu-sv and emu-mps, as computational backends for Pasqal's pulser package. Emu-sv is designed for high-precision state-vector simulations, giving the possibility to emulate systems of up to $\thicksim 27$ qubits on an A100 40GB GPU, making it perfect for cases where numerically exact results are needed. In contrast, emu-mps uses a Matrix Product State representation and other controlled approximations to efficiently simulate much larger arrays of atoms with manageable errors. We show through benchmark comparisons that both emulators provide significant speed-ups over generic solvers such as QuTiP. In addition, we provide practical guidance on choosing between the two emulators. These quantum software tools are designed to support researchers and developers aiming to simulate quantum systems either as a precursor to full hardware implementation or as a means of benchmarking hardware performance.

academic

Émulation Efficace du Matériel Quantique à Atomes Neutres

Informations Fondamentales

ID de l'article: 2510.09813
Titre: Efficient Emulation of Neutral Atom Quantum Hardware
Auteurs: Kemal Bidzhiev, Stefano Grava, Pablo le Henaff, Mauro Mendizabal, Elie Merhej, Anton Quelle (PASQAL)
Classification: quant-ph (Physique quantique)
Date de publication: 14 octobre 2025
Lien de l'article: https://arxiv.org/abs/2510.09813

Résumé

La simulation de la dynamique des réseaux d'atomes neutres constitue un problème complexe. Pour résoudre cette problématique, les auteurs introduisent deux simulateurs — emu-sv et emu-mps — en tant que backends de calcul du package pulser de Pasqal. Emu-sv est conçu pour la simulation de vecteur d'état haute précision, capable de simuler jusqu'à 27 qubits sur un GPU A100 40GB, ce qui le rend particulièrement adapté aux situations nécessitant des résultats numériquement exacts. En contraste, emu-mps utilise la représentation par état de produit matriciel (MPS) et d'autres approximations contrôlées pour simuler efficacement des réseaux atomiques plus grands tout en maintenant une erreur gérable. Les comparaisons de référence démontrent que les deux simulateurs offrent une accélération significative par rapport aux solveurs génériques tels que QuTiP. De plus, les auteurs fournissent des directives pratiques pour le choix entre les deux simulateurs.

Contexte et Motivation de la Recherche

Définition du Problème

Défi fondamental: La simulation de la dynamique quantique des réseaux d'atomes neutres constitue un problème intensif en calcul, avec une complexité croissant exponentiellement avec la taille du système
Limitations existantes: Le package Pulser dépend de QuTiP pour la simulation classique, mais les solveurs QuTiP ne peuvent pas s'adapter efficacement aux échelles de système plus grandes pertinentes pour les processeurs à atomes neutres
Besoins pratiques: Nécessité de simulateurs capables de reproduire fidèlement les caractéristiques du backend QuTiP tout en améliorant les performances et la scalabilité

Importance de la Recherche

Les processeurs quantiques à atomes neutres suscitent un intérêt considérable en raison de leur connectivité flexible des qubits, de leur scalabilité et de leurs longs temps de cohérence
Capacité à réaliser de grands réseaux de qubits avec une géométrie dynamiquement reconfigurable et des interactions contrôlables
Applicables à la fois à la simulation quantique et au calcul quantique universel

Contexte Technique

La recherche s'appuie sur l'équation de Schrödinger dépendante du temps: $i\frac{d|\psi\rangle}{dt} = \hat{H}(t)|\psi\rangle$

où l'hamiltonien est défini comme: $\hat{H}(t) = \sum_{i=1}^N \frac{\Omega_i(t)}{2}\hat{\sigma}^x_i - \sum_{i=1}^N \delta_i(t)\hat{n}_i + \sum_{i>j} \frac{C}{|r_{ij}|^6}\hat{n}_i\hat{n}_j$

Contributions Principales

Développement de deux simulateurs quantiques haute performance:
- emu-sv: simulateur exact basé sur le vecteur d'état, supportant jusqu'à 27 qubits
- emu-mps: simulateur approximatif basé sur l'état de produit matriciel, capable de traiter des systèmes de plus grande envergure
Réalisation d'améliorations de performance significatives: accélération considérable par rapport aux solveurs génériques tels que QuTiP
Fourniture d'un écosystème logiciel complet intégré:
- Compatibilité complète avec le package Pulser
- Support des workflows d'apprentissage automatique PyTorch
- Implémentation d'une interface API unifiée
Établissement de directives pratiques de sélection: règles empiriques pour le choix du simulateur selon différents scénarios d'application

Détails Méthodologiques

Définition de la Tâche

Entrées:

Système d'atomes neutres comportant N qubits
Paramètres de contrôle dépendants du temps Ωᵢ(t) (fréquences de Rabi) et δᵢ(t) (désaccords)
État quantique initial |ψ(0)⟩

Sorties:

État quantique |ψ(t)⟩ après évolution temporelle
Valeurs d'espérance des observables

Contraintes:

Limitations de mémoire (GPU/CPU)
Exigences de précision
Limites de temps de calcul

Architecture du Modèle

Architecture Emu-sv

Représentation d'état: utilisation d'une représentation complète du vecteur d'état, de dimension 2^N
Stockage de l'hamiltonien: exploitation des caractéristiques structurelles de l'hamiltonien de Rydberg, stockage uniquement des éléments diagonaux et des valeurs Ωᵢ
Algorithme d'évolution temporelle:
- Utilisation d'une approximation par constante par segments: |ψ(tₖ₊₁)⟩ = e^(-iHₖdt)|ψ(tₖ)⟩
- Adoption de l'algorithme de Lanczos pour le calcul de l'exponentielle matricielle
- Formellement un intégrateur du second ordre

Architecture Emu-mps

Représentation MPS: représentation de l'état quantique sous forme d'état de produit matriciel $c_{i_1...i_N} = A^{i_1}_{j_1} A^{i_2}_{j_1,j_2} \ldots A^{i_N}_{j_N}$
Algorithme d'évolution temporelle:
- Utilisation du principe variationnel dépendant du temps (TDVP)
- Schéma TDVP bisite du second ordre
- Traitement des modèles de bruit via sauts quantiques de Monte Carlo
Optimisation mémoire: contrôle de l'utilisation mémoire via la dimension de liaison, réalisant des économies mémoire exponentielles pour les états faiblement intriqués

Points d'Innovation Technique

Stockage structuré de l'hamiltonien:
- Exploitation de la propriété que les termes σˣᵢ ne produisent que des éléments hors-diagonaux
- Implémentation de la multiplication matrice-vecteur via échange de sous-vecteurs
- Économies mémoire par rapport aux formats COO et CSR
Ordre d'intégration adaptatif:
- L'algorithme de Lanczos réalise un ordre adaptatif via la construction d'un sous-espace de Krylov
- Évite les limites supérieures fixes des méthodes comme ZVODE
- Performance améliorée sur les systèmes de grande taille avec spectre hamiltonien large
Ordonnancement intelligent des qubits:
- Utilisation de l'algorithme de Cuthill-McKee pour optimiser l'ordre des qubits dans le MPS
- Réduction de l'erreur de l'algorithme TDVP dans les systèmes bidimensionnels
- Diminution de la dimension de liaison requise

Configuration Expérimentale

Environnement Matériel

GPU: NVIDIA A100 40GB DRAM
CPU: AMD EPYC 7742, jusqu'à 1TB RAM
Versions logicielles:
- Pulser 1.5 (basé sur QuTiP 5.2, NumPy 2.2, SciPy 1.15)
- Version simulateur 2.3 (basée sur PyTorch 2.8)

Métriques d'Évaluation

Temps d'exécution: temps de calcul pour différentes tailles de système
Consommation mémoire: utilisation mémoire maximale
Précision: divergence de la norme de la fonction d'onde par rapport à la référence QuTiP
Scalabilité: nombre maximal de qubits traitable

Méthodes Comparatives

Backend par défaut Pulser: solveur ODE ZVODE basé sur QuTiP
Configurations différentes: comparaisons avec différents pas de temps dt et paramètres de précision

Résultats Expérimentaux

Résultats de Performance Principaux

Performance Emu-sv

Comparaison des temps d'exécution:
- À partir de 9 qubits, emu-sv surpasse significativement Pulser
- L'échelle exponentielle apparaît plus tard, mais finit par être limitée par la mémoire
- L'accélération GPU montre des effets significatifs sur les grands systèmes
Consommation mémoire:
- Environ 1GB de mémoire nécessaire pour stocker le vecteur d'état de 26 qubits
- En supposant 15 vecteurs de Krylov, la consommation mémoire totale pour 26 qubits reste inférieure à 20GB
Analyse de précision:
- Les sources d'erreur principales proviennent du schéma de discrétisation temporelle
- Avec dt=5ns, l'erreur typique est environ 10⁻⁵
- Le paramètre de précision p affecte principalement la convergence de Lanczos, non l'erreur globale

Performance Emu-mps

Prédiction mémoire:
- Estimation préalable possible des besoins mémoire pour un nombre de qubits N et une dimension de liaison maximale χ donnés
- L'échelle du système traitable sur un GPU 40GB dépend de la dimension de liaison
Estimation du temps d'exécution:
- Le temps par pas de temps dépend de N et χ
- Le nombre d'itérations de Lanczos montre une dépendance relativement faible à la plage de paramètres
Contrôle de précision:
- Précision de troncature par défaut p=10⁻⁵
- Limite d'erreur totale: p × m × (2N-3), où m est le nombre de pas de temps
- L'erreur réelle est généralement inférieure à la limite théorique

Directives de Sélection

Règles empiriques basées sur les benchmarks GPU:

≤27 qubits: utilisation recommandée d'emu-sv
>27 qubits: utilisation recommandée d'emu-mps

Cas d'Application

Calcul du facteur de structure dynamique: emu-mps appliqué avec succès à des systèmes dépassant 20 qubits
Optimisation de graphes quantiques: les deux simulateurs appliqués aux problèmes d'optimisation de graphes quantiques

Travaux Connexes

Logiciels de Simulation Quantique

QuTiP: boîte à outils quantique générique, utilisant le solveur ZVODE pour les problèmes dépendants du temps
Pulser: package Python open-source spécialisé dans le calcul quantique à atomes neutres
Autres plateformes: outils de simulation pour différentes plateformes matérielles (qubits supraconducteurs, pièges à ions, dispositifs photoniques)

Méthodes de Réseaux Tensoriels

MPS/DMRG: groupe de renormalisation de matrice densité et méthodes d'état de produit matriciel
TDVP: principe variationnel dépendant du temps appliqué à la dynamique quantique
Monte Carlo quantique: méthodes stochastiques pour traiter la dynamique des systèmes ouverts

Conclusions et Discussion

Conclusions Principales

Améliorations de performance significatives: les deux simulateurs offrent des améliorations de performance considérables par rapport à QuTiP
Conception complémentaire: emu-sv adapté aux calculs exacts à petite échelle, emu-mps adapté aux calculs approximatifs à grande échelle
Facilité d'utilisation: la conception API unifiée rend la commutation entre simulateurs simple

Limitations

Limitations mémoire d'emu-sv: limitée par la croissance exponentielle du vecteur d'état, environ 27 qubits maximum
Contrôle de précision d'emu-mps: nécessite une configuration correcte des paramètres de troncature, problèmes d'ordonnancement dans les systèmes bidimensionnels
Ordre d'intégration: utilisation actuelle d'un intégrateur du second ordre, pas de méthodes d'ordre supérieur comme l'extrapolation de Richardson

Directions Futures

Différentiabilité: emu-sv supporte déjà le calcul différentiable, plan d'ajout de cette fonctionnalité à emu-mps
Suivi d'état fondamental: implémentation de l'algorithme DMRG pour suivre l'état fondamental lors de l'évolution temporelle
Extension des modèles de bruit: ajout de nouvelles sources de bruit selon l'analyse de l'équipe matérielle
Intégration d'apprentissage automatique: support des workflows d'apprentissage automatique basés sur PyTorch

Évaluation Approfondie

Points Forts

Valeur pratique élevée: résolution directe des besoins réels du domaine du calcul quantique à atomes neutres
Implémentation technique excellente:
- Exploitation complète des caractéristiques structurelles de l'hamiltonien de Rydberg
- Caractère adaptatif de l'algorithme de Lanczos performant sur les systèmes de grande taille
- Optimisation mémoire significative de la méthode MPS pour les états faiblement intriqués
Qualité d'ingénierie logicielle:
- Intégration excellente avec l'écosystème existant
- Conception API unifiée facilitant l'utilisation
- Fourniture de directives pratiques de sélection
Benchmarking suffisant: comparaisons détaillées multidimensionnelles incluant temps d'exécution, mémoire et précision

Insuffisances

Analyse théorique limitée:
- Absence d'analyse théorique de la complexité algorithmique
- Analyse insuffisante des limites théoriques d'erreur de l'algorithme TDVP
Scénarios d'application relativement limités:
- Orientation principale vers les systèmes à atomes neutres
- Applicabilité insuffisamment explorée à d'autres plateformes matérielles quantiques
Absence de méthodes d'ordre supérieur:
- Pas d'implémentation de l'extrapolation de Richardson ou d'autres méthodes d'ordre supérieur
- Performance potentiellement insuffisante dans certains scénarios d'exigences haute précision

Impact

Contribution au domaine: fourniture d'outils de simulation importants pour le calcul quantique à atomes neutres
Valeur pratique: validation d'application dans plusieurs projets de recherche
Contribution open-source: promotion du développement du domaine en tant que partie de l'écosystème Pulser

Scénarios d'Application

Développement d'algorithmes quantiques: vérification d'algorithmes avant implémentation matérielle
Benchmarking matériel quantique: évaluation des performances du matériel quantique
Recherche en physique quantique: étude du comportement dynamique des systèmes quantiques à plusieurs corps
Formation et enseignement: enseignement du calcul quantique et formation à la recherche

Références

L'article cite 51 références pertinentes, couvrant plusieurs domaines incluant le matériel de calcul quantique, les algorithmes numériques et les méthodes de réseaux tensoriels, fournissant une base théorique solide pour la recherche.

Évaluation Globale: Cet article représente une recherche de haute qualité de nature appliquée, résolvant les besoins réels du domaine du calcul quantique à atomes neutres, avec une implémentation technique solide, une vérification expérimentale complète, et une valeur pratique et un potentiel de diffusion considérables.