2025-11-16T09:34:12.542193

AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs

Conti, Volpe, Graziano et al.

Researchers and industries are increasingly drawn to quantum computing for its computational potential. However, validating new quantum algorithms is challenging due to the limitations of current quantum devices. Software simulators are time and memory-consuming, making hardware emulators an attractive alternative. This article introduces AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), designed for quantum computing emulation on low-tier Field-Programmable gate arrays (FPGAs), supporting Clifford+T and rotational gate sets. It simplifies and accelerates the verification of quantum algorithms using a Reduced-Instruction-Set-Computer (RISC)-like structure and efficient handling of sparse quantum gates. A dedicated compiler translates OpenQASM 2.0 into RISC-like instructions. AMARETTO is validated against the Qiskit simulators. Our results show successful emulation of sixteen qubits on a AMD Kria KV260 SoM. This approach rivals other works in emulated qubit capacity on a smaller, more affordable FPGA

academic

AMARETTO : Permettre l'émulation efficace d'algorithmes quantiques sur les FPGA de bas niveau

Informations de base

ID de l'article : 2411.09320
Titre : AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs
Auteurs : Christian Conti, Deborah Volpe, Mariagrazia Graziano, Maurizio Zamboni, Giovanna Turvani (Politecnico di Torino, Italie)
Classification : quant-ph cs.SY eess.SY
Date de publication : 14 novembre 2024 (prépublication arXiv)
Lien de l'article : https://arxiv.org/abs/2411.09320

Résumé

Les chercheurs et l'industrie manifestent un intérêt croissant pour le potentiel informatique du calcul quantique. Cependant, la vérification de nouveaux algorithmes quantiques s'avère difficile en raison des limitations des dispositifs quantiques actuels. Les simulateurs logiciels sont chronophages et consomment beaucoup de mémoire, ce qui rend les émulateurs matériels attrayants comme alternative. Cet article présente AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), conçu spécifiquement pour l'émulation du calcul quantique sur les matrices de portes programmables (FPGA) de bas niveau, supportant les ensembles de portes Clifford+T et de rotation. Il utilise une architecture de type RISC et un traitement efficace des portes quantiques éparses pour simplifier et accélérer la vérification des algorithmes quantiques. Un compilateur dédié convertit OpenQASM 2.0 en instructions de type RISC. AMARETTO a été validé par rapport au simulateur Qiskit. Les résultats montrent l'émulation réussie de 16 qubits sur le AMD Kria KV260 SoM. Cette approche réalise une capacité en qubits comparable à d'autres travaux sur des FPGA plus petits et plus économiques.

Contexte et motivation de la recherche

Définition du problème

Difficulté de vérification des algorithmes quantiques : Les dispositifs quantiques actuels présentent du bruit et une faible fidélité, ce qui rend difficile la vérification fiable des nouveaux algorithmes quantiques
Limitations des simulateurs logiciels : Les simulateurs classiques font face à des temps d'exécution longs et des besoins en mémoire élevés, limitant la scalabilité
Accès limité au matériel : L'accès au matériel quantique est monopolisé par les grandes entreprises et généralement fourni via des plateformes cloud payantes

Importance de la recherche

Le calcul quantique offre un potentiel énorme pour les applications gourmandes en données, mais le développement et la vérification des algorithmes nécessitent une plateforme de simulation fiable. Les émulateurs matériels FPGA peuvent reproduire plus précisément les caractéristiques parallèles du calcul quantique, promettant de surpasser les performances des simulateurs logiciels.

Limitations des approches existantes

Complexité informatique : Un système de n qubits nécessite des opérations de multiplication de matrices 2^n×2^n et de vecteurs d'état 2^n
Besoins en mémoire : Les besoins de stockage des vecteurs d'état croissent exponentiellement avec le nombre de qubits
Mauvaise scalabilité : Les solutions FPGA existantes supportent soit un nombre limité de qubits, soit nécessitent des FPGA haut de gamme coûteux

Contributions principales

Proposition de l'architecture AMARETTO : Un émulateur quantique efficace conçu pour les FPGA bas de gamme, adoptant une architecture de type RISC
Mécanisme de sélection papillon : Exploite la parcimonie des matrices de portes quantiques, calculant uniquement les couplages d'amplitudes de probabilité nécessaires, évitant les opérations redondantes
Support d'ensemble de portes universel : Supporte les ensembles de portes Clifford+T et de rotation, capable d'exécuter tout type de circuit quantique
Représentation numérique optimisée : Utilise une représentation en virgule fixe 20 bits (2 bits entiers, 18 bits fractionnaires), équilibrant précision et consommation de ressources
Environnement de simulation complet : Inclut un compilateur convertissant OpenQASM 2.0 en instructions de type RISC, avec une interface conviviale

Détails de la méthode

Définition de la tâche

Entrée : Description de circuit quantique au format OpenQASM 2.0 Sortie : Amplitudes de probabilité du vecteur d'état final Contraintes : Réaliser une émulation efficace sous les limitations de ressources des FPGA bas de gamme

Architecture du modèle

AMARETTO adopte une architecture de type RISC contenant les composants principaux suivants :

Fichier de registres d'état quantique (QSRF) :
- Stocke les parties réelle et imaginaire du vecteur d'état
- Taille de 2^N éléments (N étant le nombre de qubits)
- Utilise la technique de pompage des blocs BRAM, fonctionnant à fréquence doublée pour lire/écrire deux amplitudes de probabilité par cycle
Sélecteur d'état quantique (QSS) :
- Implémente le mécanisme de sélection papillon
- Identifie les paires d'amplitudes de probabilité nécessitant une interaction
- Exploite la parcimonie des matrices de portes quantiques pour éviter les calculs inutiles
Unité arithmétique quantique (QAU) :
- Contient quatre unités de calcul (une pour la partie réelle et imaginaire de chaque amplitude de probabilité)
- Chaque unité contient deux multiplicateurs et un additionneur
- Supporte les opérations en pipeline
Unité de fonctions trigonométriques (TU) :
- Basée sur les tables de consultation (LUT) et les séries de Taylor
- Calcule les valeurs de sinus et cosinus
- Nécessite moins d'unités de traitement comparé à l'algorithme CORDIC
Unité de contrôle d'émulation quantique (QECU) :
- Coordonne les opérations synchronisées de tous les modules
- Gère le flux d'exécution des instructions

Architecture de l'ensemble d'instructions

AMARETTO définit trois types d'instructions :

Type s : Définit le nombre de qubits du circuit
Type g : Exécute les opérations de portes quantiques, contenant le code d'opération, les qubits cibles et de contrôle, et le champ de valeur immédiate
Type r : Lit le vecteur d'état

La longueur d'instruction est de 32 bits : 5 bits de code d'opération + 8 bits d'identifiant de qubit + 19 bits de valeur immédiate

Points d'innovation technique

Représentation unifiée des opérations de portes : Toutes les portes supportées peuvent être représentées sous forme unifiée :
```
c_i^out = α sin(θ) + β cos(θ) + i(γ sin(θ) + δ cos(θ))
c_j^out = ε sin(θ) + ζ cos(θ) + i(η sin(θ) + ι cos(θ))
```
Pipeline à cinq étages :
- Exploite le parallélisme au niveau des instructions
- Atteint l'efficacité maximale lorsque le nombre de couplages ≥ nombre d'étages du pipeline
- Exigence minimale de qubits : N_q ≥ ⌈log₂(N_pipe) + 2⌉
Représentation numérique en virgule fixe :
- 20 bits en virgule fixe (2 bits entiers + 18 bits fractionnaires)
- Mécanisme d'arrondi au pair le plus proche
- Réduit la surface et la complexité par rapport à la virgule flottante

Configuration expérimentale

Plateforme cible

FPGA : AMD Kria KV260 SoM
Outils de développement : Vivado 2023.1
Précision numérique : Représentation en virgule fixe 20 bits

Méthodologie de validation

Circuits de test : Environ 50 circuits quantiques OpenQASM 2.0
Référence de comparaison : Simulateur de vecteur d'état Qiskit
Métriques d'évaluation : Distance géodésique (GCD), considérant les éléments du vecteur d'état en forme polaire
Seuil acceptable : GCD < 0,05

Plateformes de comparaison de performance

Simulation logicielle : CPU Intel Xeon Gold 6134 @ 3,20 GHz, 103 GB de mémoire
Simulateurs de comparaison : Simulateur QASM et simulateur de vecteur d'état de Qiskit

Résultats expérimentaux

Utilisation des ressources

Implémentation réussie de l'émulation 16 qubits sur AMD Kria KV260 :

BRAM : 2,62 MB (utilisation 100%, devenant le goulot d'étranglement)
Ressources logiques : 7751/117120 CLB
DSP : 11/1248
Fréquence d'horloge : 100 MHz

Comparaison de performance

Architecture	AMARETTO	2	3	4	5	6
Nombre de qubits	16	2	4	32	16	9
FPGA	AMD Kria KV260	Intel Cyclone V	Intel Arria 10	Intel Arria 10	Intel APEX 20KE1500	Intel Stratix
Précision	20 bits virgule fixe	10 bits virgule fixe	32 bits virgule flottante	64 bits virgule flottante	-	18 bits virgule fixe
Fréquence d'horloge	100 MHz	-	233 MHz	233 MHz	60 MHz	-

Analyse du temps d'exécution

Complexité temporelle : O(N) cycles d'horloge (N étant la longueur du vecteur d'état 2^Nq), contre O(N²) pour les méthodes traditionnelles
Performance réelle : Environ deux ordres de grandeur plus rapide que le simulateur Qiskit
Formule d'extension : Temps d'exécution = (2^max(Nq,Nqmin)-1 × Ng(2-α)/2 + (Npipe-1)) × Tclock

Résultats de vérification fonctionnelle

Toutes les valeurs GCD des circuits de test sont inférieures à 0,05
Vérification réussie de la correction fonctionnelle de l'architecture
Support complet de l'ensemble universel de portes quantiques

Travaux connexes

Solutions FPGA existantes pour l'émulation quantique

Méthode multiplication matrice-vecteur 2,3 : Calcul parallèle du produit de la matrice de couche et du vecteur d'état, mais scalabilité limitée
Solution mémoire externe 4 : Stockage du vecteur d'état en mémoire externe pour améliorer la scalabilité, mais les besoins en mémoire restent importants
Méthode hypercube 5 : Calcul basé sur l'interaction d'états de base d'hypercubes N-dimensionnels, atteignant 16 qubits
Solution ensemble de portes limité 6 : Utilise le mécanisme papillon mais supporte uniquement un ensemble limité de portes (Pauli X, CNOT, Toffoli, Hadamard)

Avantages d'AMARETTO

Universalité : Supporte l'ensemble universel de portes quantiques, sans restriction d'application
Efficacité : Complexité temporelle O(N) vs O(N²) traditionnel
Rapport coût-efficacité : Réalise des performances comparables sur des FPGA plus petits et moins chers
Pas de re-synthèse requise : Pas besoin de re-synthétiser le matériel lors de l'exécution de nouveaux circuits

Conclusions et discussion

Conclusions principales

AMARETTO réalise avec succès l'émulation efficace de 16 qubits sur FPGA bas de gamme
Le temps d'exécution est environ deux ordres de grandeur plus rapide que les simulateurs logiciels
L'efficacité d'utilisation des ressources est élevée, avec le taux d'occupation logique le plus bas parmi les solutions comparables
Supporte l'ensemble universel de portes quantiques, avec une large applicabilité

Limitations

Goulot d'étranglement mémoire : La disponibilité de BRAM devient le facteur limitant principal, suivant une loi d'extension O(N_bit × 2^Nq)
Limitation du nombre de qubits : Limitée par la capacité mémoire du FPGA cible
Précision virgule fixe : La représentation 20 bits peut être insuffisante en précision pour certaines applications
Dépendance à la plateforme : Les interfaces de communication nécessitent une adaptation pour différentes plateformes

Directions futures

Optimisation mémoire : Explorer des stratégies de stockage et d'accès aux vecteurs d'état plus efficaces
Amélioration de la précision : Étudier des mécanismes de précision configurable équilibrant performance et exactitude
Extension multi-FPGA : Utiliser plusieurs FPGA pour l'émulation de systèmes quantiques à plus grande échelle
Modèles de bruit : Intégrer des modèles de bruit pour mieux simuler les dispositifs quantiques réels

Évaluation approfondie

Points forts

Innovation technique :
- Le mécanisme de sélection papillon exploite efficacement la parcimonie des portes quantiques
- La représentation unifiée des opérations de portes simplifie l'implémentation matérielle
- La conception en pipeline exploite pleinement le parallélisme au niveau des instructions
Valeur pratique :
- La conception pour FPGA bas de gamme réduit les barrières d'entrée
- La chaîne d'outils complète (compilateur + émulateur) fournit une solution de bout en bout
- L'interface conviviale supporte les frameworks quantiques courants
Suffisance expérimentale :
- Comparaison détaillée avec plusieurs solutions existantes
- Vérification fonctionnelle couvrant environ 50 circuits de test
- L'analyse de performance inclut les dimensions temps et ressources

Insuffisances

Limitations de comparaison :
- Les différentes solutions utilisent des produits FPGA de différents fabricants, introduisant des biais de comparaison directe
- Certains travaux de comparaison ont des informations incomplètes
- Absence de comparaison équitable sur la même plateforme
Analyse insuffisante de la scalabilité :
- Analyse insuffisante des solutions possibles pour surmonter le goulot d'étranglement mémoire
- Discussion limitée des stratégies d'extension pour les systèmes quantiques à plus grande échelle
Vérification insuffisante des scénarios d'application :
- Absence de démonstration complète d'algorithmes quantiques concrets (comme l'algorithme de Shor, l'algorithme de Grover)
- Analyse manquante des différences de performance pour différents types de circuits quantiques

Impact

Contribution académique : Fournit de nouvelles idées de conception d'architecture pour l'émulation quantique FPGA
Valeur pratique : Réduit le coût matériel et les barrières techniques pour la vérification des algorithmes quantiques
Reproductibilité : Fournit des détails d'implémentation relativement détaillés, mais manque de code open source

Scénarios d'application

Développement d'algorithmes quantiques : Approprié pour la vérification et le débogage rapides d'algorithmes quantiques de taille moyenne
Applications éducatives : Fournit une plateforme matérielle économique et pratique pour l'enseignement du calcul quantique
Vérification de prototype : Permet la vérification de prototype d'algorithme avant le déploiement sur matériel quantique réel

Références bibliographiques

L'article cite des travaux importants dans les domaines du calcul quantique, de la conception FPGA et du calcul numérique, incluant :

Les manuels classiques de Nielsen & Chuang sur le calcul quantique
Plusieurs travaux connexes sur l'émulation quantique FPGA
Les spécifications du langage OpenQASM
La littérature sur les techniques d'optimisation de conception FPGA

Évaluation générale : Cet article représente un travail d'une valeur pratique significative dans le domaine de l'émulation quantique FPGA. L'architecture AMARETTO réalise, grâce à une conception ingénieuse, des performances comparables aux solutions haut de gamme sur des FPGA bas de gamme, fournissant une solution économique et pratique pour la vérification des algorithmes quantiques. Bien qu'il y ait encore de la place pour l'amélioration en termes de scalabilité et d'analyse approfondie, son innovation technique et sa valeur pratique méritent d'être reconnues.