2025-11-16T09:34:12.542193

AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs

Conti, Volpe, Graziano et al.
Researchers and industries are increasingly drawn to quantum computing for its computational potential. However, validating new quantum algorithms is challenging due to the limitations of current quantum devices. Software simulators are time and memory-consuming, making hardware emulators an attractive alternative. This article introduces AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), designed for quantum computing emulation on low-tier Field-Programmable gate arrays (FPGAs), supporting Clifford+T and rotational gate sets. It simplifies and accelerates the verification of quantum algorithms using a Reduced-Instruction-Set-Computer (RISC)-like structure and efficient handling of sparse quantum gates. A dedicated compiler translates OpenQASM 2.0 into RISC-like instructions. AMARETTO is validated against the Qiskit simulators. Our results show successful emulation of sixteen qubits on a AMD Kria KV260 SoM. This approach rivals other works in emulated qubit capacity on a smaller, more affordable FPGA
academic

AMARETTO : Permettre l'émulation efficace d'algorithmes quantiques sur les FPGA de bas niveau

Informations de base

  • ID de l'article : 2411.09320
  • Titre : AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs
  • Auteurs : Christian Conti, Deborah Volpe, Mariagrazia Graziano, Maurizio Zamboni, Giovanna Turvani (Politecnico di Torino, Italie)
  • Classification : quant-ph cs.SY eess.SY
  • Date de publication : 14 novembre 2024 (prépublication arXiv)
  • Lien de l'article : https://arxiv.org/abs/2411.09320

Résumé

Les chercheurs et l'industrie manifestent un intérêt croissant pour le potentiel informatique du calcul quantique. Cependant, la vérification de nouveaux algorithmes quantiques s'avère difficile en raison des limitations des dispositifs quantiques actuels. Les simulateurs logiciels sont chronophages et consomment beaucoup de mémoire, ce qui rend les émulateurs matériels attrayants comme alternative. Cet article présente AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), conçu spécifiquement pour l'émulation du calcul quantique sur les matrices de portes programmables (FPGA) de bas niveau, supportant les ensembles de portes Clifford+T et de rotation. Il utilise une architecture de type RISC et un traitement efficace des portes quantiques éparses pour simplifier et accélérer la vérification des algorithmes quantiques. Un compilateur dédié convertit OpenQASM 2.0 en instructions de type RISC. AMARETTO a été validé par rapport au simulateur Qiskit. Les résultats montrent l'émulation réussie de 16 qubits sur le AMD Kria KV260 SoM. Cette approche réalise une capacité en qubits comparable à d'autres travaux sur des FPGA plus petits et plus économiques.

Contexte et motivation de la recherche

Définition du problème

  1. Difficulté de vérification des algorithmes quantiques : Les dispositifs quantiques actuels présentent du bruit et une faible fidélité, ce qui rend difficile la vérification fiable des nouveaux algorithmes quantiques
  2. Limitations des simulateurs logiciels : Les simulateurs classiques font face à des temps d'exécution longs et des besoins en mémoire élevés, limitant la scalabilité
  3. Accès limité au matériel : L'accès au matériel quantique est monopolisé par les grandes entreprises et généralement fourni via des plateformes cloud payantes

Importance de la recherche

Le calcul quantique offre un potentiel énorme pour les applications gourmandes en données, mais le développement et la vérification des algorithmes nécessitent une plateforme de simulation fiable. Les émulateurs matériels FPGA peuvent reproduire plus précisément les caractéristiques parallèles du calcul quantique, promettant de surpasser les performances des simulateurs logiciels.

Limitations des approches existantes

  • Complexité informatique : Un système de n qubits nécessite des opérations de multiplication de matrices 2^n×2^n et de vecteurs d'état 2^n
  • Besoins en mémoire : Les besoins de stockage des vecteurs d'état croissent exponentiellement avec le nombre de qubits
  • Mauvaise scalabilité : Les solutions FPGA existantes supportent soit un nombre limité de qubits, soit nécessitent des FPGA haut de gamme coûteux

Contributions principales

  1. Proposition de l'architecture AMARETTO : Un émulateur quantique efficace conçu pour les FPGA bas de gamme, adoptant une architecture de type RISC
  2. Mécanisme de sélection papillon : Exploite la parcimonie des matrices de portes quantiques, calculant uniquement les couplages d'amplitudes de probabilité nécessaires, évitant les opérations redondantes
  3. Support d'ensemble de portes universel : Supporte les ensembles de portes Clifford+T et de rotation, capable d'exécuter tout type de circuit quantique
  4. Représentation numérique optimisée : Utilise une représentation en virgule fixe 20 bits (2 bits entiers, 18 bits fractionnaires), équilibrant précision et consommation de ressources
  5. Environnement de simulation complet : Inclut un compilateur convertissant OpenQASM 2.0 en instructions de type RISC, avec une interface conviviale

Détails de la méthode

Définition de la tâche

Entrée : Description de circuit quantique au format OpenQASM 2.0 Sortie : Amplitudes de probabilité du vecteur d'état final Contraintes : Réaliser une émulation efficace sous les limitations de ressources des FPGA bas de gamme

Architecture du modèle

AMARETTO adopte une architecture de type RISC contenant les composants principaux suivants :

  1. Fichier de registres d'état quantique (QSRF) :
    • Stocke les parties réelle et imaginaire du vecteur d'état
    • Taille de 2^N éléments (N étant le nombre de qubits)
    • Utilise la technique de pompage des blocs BRAM, fonctionnant à fréquence doublée pour lire/écrire deux amplitudes de probabilité par cycle
  2. Sélecteur d'état quantique (QSS) :
    • Implémente le mécanisme de sélection papillon
    • Identifie les paires d'amplitudes de probabilité nécessitant une interaction
    • Exploite la parcimonie des matrices de portes quantiques pour éviter les calculs inutiles
  3. Unité arithmétique quantique (QAU) :
    • Contient quatre unités de calcul (une pour la partie réelle et imaginaire de chaque amplitude de probabilité)
    • Chaque unité contient deux multiplicateurs et un additionneur
    • Supporte les opérations en pipeline
  4. Unité de fonctions trigonométriques (TU) :
    • Basée sur les tables de consultation (LUT) et les séries de Taylor
    • Calcule les valeurs de sinus et cosinus
    • Nécessite moins d'unités de traitement comparé à l'algorithme CORDIC
  5. Unité de contrôle d'émulation quantique (QECU) :
    • Coordonne les opérations synchronisées de tous les modules
    • Gère le flux d'exécution des instructions

Architecture de l'ensemble d'instructions

AMARETTO définit trois types d'instructions :

  • Type s : Définit le nombre de qubits du circuit
  • Type g : Exécute les opérations de portes quantiques, contenant le code d'opération, les qubits cibles et de contrôle, et le champ de valeur immédiate
  • Type r : Lit le vecteur d'état

La longueur d'instruction est de 32 bits : 5 bits de code d'opération + 8 bits d'identifiant de qubit + 19 bits de valeur immédiate

Points d'innovation technique

  1. Représentation unifiée des opérations de portes : Toutes les portes supportées peuvent être représentées sous forme unifiée :
    c_i^out = α sin(θ) + β cos(θ) + i(γ sin(θ) + δ cos(θ))
    c_j^out = ε sin(θ) + ζ cos(θ) + i(η sin(θ) + ι cos(θ))
    
  2. Pipeline à cinq étages :
    • Exploite le parallélisme au niveau des instructions
    • Atteint l'efficacité maximale lorsque le nombre de couplages ≥ nombre d'étages du pipeline
    • Exigence minimale de qubits : N_q ≥ ⌈log₂(N_pipe) + 2⌉
  3. Représentation numérique en virgule fixe :
    • 20 bits en virgule fixe (2 bits entiers + 18 bits fractionnaires)
    • Mécanisme d'arrondi au pair le plus proche
    • Réduit la surface et la complexité par rapport à la virgule flottante

Configuration expérimentale

Plateforme cible

  • FPGA : AMD Kria KV260 SoM
  • Outils de développement : Vivado 2023.1
  • Précision numérique : Représentation en virgule fixe 20 bits

Méthodologie de validation

  • Circuits de test : Environ 50 circuits quantiques OpenQASM 2.0
  • Référence de comparaison : Simulateur de vecteur d'état Qiskit
  • Métriques d'évaluation : Distance géodésique (GCD), considérant les éléments du vecteur d'état en forme polaire
  • Seuil acceptable : GCD < 0,05

Plateformes de comparaison de performance

  • Simulation logicielle : CPU Intel Xeon Gold 6134 @ 3,20 GHz, 103 GB de mémoire
  • Simulateurs de comparaison : Simulateur QASM et simulateur de vecteur d'état de Qiskit

Résultats expérimentaux

Utilisation des ressources

Implémentation réussie de l'émulation 16 qubits sur AMD Kria KV260 :

  • BRAM : 2,62 MB (utilisation 100%, devenant le goulot d'étranglement)
  • Ressources logiques : 7751/117120 CLB
  • DSP : 11/1248
  • Fréquence d'horloge : 100 MHz

Comparaison de performance

ArchitectureAMARETTO23456
Nombre de qubits162432169
FPGAAMD Kria KV260Intel Cyclone VIntel Arria 10Intel Arria 10Intel APEX 20KE1500Intel Stratix
Précision20 bits virgule fixe10 bits virgule fixe32 bits virgule flottante64 bits virgule flottante-18 bits virgule fixe
Fréquence d'horloge100 MHz-233 MHz233 MHz60 MHz-

Analyse du temps d'exécution

  • Complexité temporelle : O(N) cycles d'horloge (N étant la longueur du vecteur d'état 2^Nq), contre O(N²) pour les méthodes traditionnelles
  • Performance réelle : Environ deux ordres de grandeur plus rapide que le simulateur Qiskit
  • Formule d'extension : Temps d'exécution = (2^max(Nq,Nqmin)-1 × Ng(2-α)/2 + (Npipe-1)) × Tclock

Résultats de vérification fonctionnelle

  • Toutes les valeurs GCD des circuits de test sont inférieures à 0,05
  • Vérification réussie de la correction fonctionnelle de l'architecture
  • Support complet de l'ensemble universel de portes quantiques

Travaux connexes

Solutions FPGA existantes pour l'émulation quantique

  1. Méthode multiplication matrice-vecteur 2,3 : Calcul parallèle du produit de la matrice de couche et du vecteur d'état, mais scalabilité limitée
  2. Solution mémoire externe 4 : Stockage du vecteur d'état en mémoire externe pour améliorer la scalabilité, mais les besoins en mémoire restent importants
  3. Méthode hypercube 5 : Calcul basé sur l'interaction d'états de base d'hypercubes N-dimensionnels, atteignant 16 qubits
  4. Solution ensemble de portes limité 6 : Utilise le mécanisme papillon mais supporte uniquement un ensemble limité de portes (Pauli X, CNOT, Toffoli, Hadamard)

Avantages d'AMARETTO

  • Universalité : Supporte l'ensemble universel de portes quantiques, sans restriction d'application
  • Efficacité : Complexité temporelle O(N) vs O(N²) traditionnel
  • Rapport coût-efficacité : Réalise des performances comparables sur des FPGA plus petits et moins chers
  • Pas de re-synthèse requise : Pas besoin de re-synthétiser le matériel lors de l'exécution de nouveaux circuits

Conclusions et discussion

Conclusions principales

  1. AMARETTO réalise avec succès l'émulation efficace de 16 qubits sur FPGA bas de gamme
  2. Le temps d'exécution est environ deux ordres de grandeur plus rapide que les simulateurs logiciels
  3. L'efficacité d'utilisation des ressources est élevée, avec le taux d'occupation logique le plus bas parmi les solutions comparables
  4. Supporte l'ensemble universel de portes quantiques, avec une large applicabilité

Limitations

  1. Goulot d'étranglement mémoire : La disponibilité de BRAM devient le facteur limitant principal, suivant une loi d'extension O(N_bit × 2^Nq)
  2. Limitation du nombre de qubits : Limitée par la capacité mémoire du FPGA cible
  3. Précision virgule fixe : La représentation 20 bits peut être insuffisante en précision pour certaines applications
  4. Dépendance à la plateforme : Les interfaces de communication nécessitent une adaptation pour différentes plateformes

Directions futures

  1. Optimisation mémoire : Explorer des stratégies de stockage et d'accès aux vecteurs d'état plus efficaces
  2. Amélioration de la précision : Étudier des mécanismes de précision configurable équilibrant performance et exactitude
  3. Extension multi-FPGA : Utiliser plusieurs FPGA pour l'émulation de systèmes quantiques à plus grande échelle
  4. Modèles de bruit : Intégrer des modèles de bruit pour mieux simuler les dispositifs quantiques réels

Évaluation approfondie

Points forts

  1. Innovation technique :
    • Le mécanisme de sélection papillon exploite efficacement la parcimonie des portes quantiques
    • La représentation unifiée des opérations de portes simplifie l'implémentation matérielle
    • La conception en pipeline exploite pleinement le parallélisme au niveau des instructions
  2. Valeur pratique :
    • La conception pour FPGA bas de gamme réduit les barrières d'entrée
    • La chaîne d'outils complète (compilateur + émulateur) fournit une solution de bout en bout
    • L'interface conviviale supporte les frameworks quantiques courants
  3. Suffisance expérimentale :
    • Comparaison détaillée avec plusieurs solutions existantes
    • Vérification fonctionnelle couvrant environ 50 circuits de test
    • L'analyse de performance inclut les dimensions temps et ressources

Insuffisances

  1. Limitations de comparaison :
    • Les différentes solutions utilisent des produits FPGA de différents fabricants, introduisant des biais de comparaison directe
    • Certains travaux de comparaison ont des informations incomplètes
    • Absence de comparaison équitable sur la même plateforme
  2. Analyse insuffisante de la scalabilité :
    • Analyse insuffisante des solutions possibles pour surmonter le goulot d'étranglement mémoire
    • Discussion limitée des stratégies d'extension pour les systèmes quantiques à plus grande échelle
  3. Vérification insuffisante des scénarios d'application :
    • Absence de démonstration complète d'algorithmes quantiques concrets (comme l'algorithme de Shor, l'algorithme de Grover)
    • Analyse manquante des différences de performance pour différents types de circuits quantiques

Impact

  1. Contribution académique : Fournit de nouvelles idées de conception d'architecture pour l'émulation quantique FPGA
  2. Valeur pratique : Réduit le coût matériel et les barrières techniques pour la vérification des algorithmes quantiques
  3. Reproductibilité : Fournit des détails d'implémentation relativement détaillés, mais manque de code open source

Scénarios d'application

  1. Développement d'algorithmes quantiques : Approprié pour la vérification et le débogage rapides d'algorithmes quantiques de taille moyenne
  2. Applications éducatives : Fournit une plateforme matérielle économique et pratique pour l'enseignement du calcul quantique
  3. Vérification de prototype : Permet la vérification de prototype d'algorithme avant le déploiement sur matériel quantique réel

Références bibliographiques

L'article cite des travaux importants dans les domaines du calcul quantique, de la conception FPGA et du calcul numérique, incluant :

  • Les manuels classiques de Nielsen & Chuang sur le calcul quantique
  • Plusieurs travaux connexes sur l'émulation quantique FPGA
  • Les spécifications du langage OpenQASM
  • La littérature sur les techniques d'optimisation de conception FPGA

Évaluation générale : Cet article représente un travail d'une valeur pratique significative dans le domaine de l'émulation quantique FPGA. L'architecture AMARETTO réalise, grâce à une conception ingénieuse, des performances comparables aux solutions haut de gamme sur des FPGA bas de gamme, fournissant une solution économique et pratique pour la vérification des algorithmes quantiques. Bien qu'il y ait encore de la place pour l'amélioration en termes de scalabilité et d'analyse approfondie, son innovation technique et sa valeur pratique méritent d'être reconnues.