2025-11-16T09:34:12.542193

AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs

Conti, Volpe, Graziano et al.
Researchers and industries are increasingly drawn to quantum computing for its computational potential. However, validating new quantum algorithms is challenging due to the limitations of current quantum devices. Software simulators are time and memory-consuming, making hardware emulators an attractive alternative. This article introduces AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), designed for quantum computing emulation on low-tier Field-Programmable gate arrays (FPGAs), supporting Clifford+T and rotational gate sets. It simplifies and accelerates the verification of quantum algorithms using a Reduced-Instruction-Set-Computer (RISC)-like structure and efficient handling of sparse quantum gates. A dedicated compiler translates OpenQASM 2.0 into RISC-like instructions. AMARETTO is validated against the Qiskit simulators. Our results show successful emulation of sixteen qubits on a AMD Kria KV260 SoM. This approach rivals other works in emulated qubit capacity on a smaller, more affordable FPGA
academic

AMARETTO: निम्न-स्तरीय FPGAs पर कुशल क्वांटम एल्गोरिदम अनुकरण को सक्षम करना

मूल जानकारी

  • पेपर ID: 2411.09320
  • शीर्षक: AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs
  • लेखक: Christian Conti, Deborah Volpe, Mariagrazia Graziano, Maurizio Zamboni, Giovanna Turvani (Politecnico di Torino इटली)
  • वर्गीकरण: quant-ph cs.SY eess.SY
  • प्रकाशन तिथि: 14 नवंबर 2024 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2411.09320

सारांश

शोधकर्ताओं और उद्योग क्वांटम कंप्यूटिंग की कम्प्यूटेशनल क्षमता में बढ़ती रुचि दिखा रहे हैं। हालांकि, वर्तमान क्वांटम उपकरणों की सीमाओं के कारण नए क्वांटम एल्गोरिदम का सत्यापन चुनौतीपूर्ण है। सॉफ्टवेयर सिमुलेटर समय-गहन और मेमोरी-गहन हैं, जिससे हार्डवेयर एमुलेटर एक आकर्षक विकल्प बन जाते हैं। यह पेपर AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy) प्रस्तुत करता है, जो निम्न-स्तरीय फील्ड-प्रोग्रामेबल गेट एरे (FPGA) पर क्वांटम कंप्यूटिंग अनुकरण के लिए डिज़ाइन किया गया है, जो Clifford+T और रोटेशन गेट सेट का समर्थन करता है। यह RISC-जैसी आर्किटेक्चर और विरल क्वांटम गेट के कुशल प्रसंस्करण का उपयोग करके क्वांटम एल्गोरिदम सत्यापन को सरल और त्वरित करता है। एक समर्पित संकलक OpenQASM 2.0 को RISC-जैसी निर्देशों में परिवर्तित करता है। AMARETTO को Qiskit सिमुलेटर के विरुद्ध सत्यापित किया गया है। परिणाम AMD Kria KV260 SoM पर 16 क्वांटम बिट्स का सफल अनुकरण दिखाते हैं। यह दृष्टिकोण छोटे, अधिक किफायती FPGAs पर अन्य कार्यों के बराबर क्वांटम बिट क्षमता प्राप्त करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

  1. क्वांटम एल्गोरिदम सत्यापन कठिनाई: वर्तमान क्वांटम उपकरणों में शोर, कम निष्ठा जैसी समस्याएं हैं, जिससे नए क्वांटम एल्गोरिदम का विश्वसनीय सत्यापन मुश्किल है
  2. सॉफ्टवेयर सिमुलेटर सीमाएं: शास्त्रीय सॉफ्टवेयर सिमुलेटर लंबे निष्पादन समय और उच्च मेमोरी आवश्यकताओं का सामना करते हैं, जो स्केलेबिलिटी को सीमित करता है
  3. हार्डवेयर पहुंच प्रतिबंधित: क्वांटम हार्डवेयर का उत्पादन, प्रबंधन और रखरखाव बड़ी कंपनियों द्वारा एकाधिकृत है, आमतौर पर भुगतान-आधारित क्लाउड प्लेटफॉर्म के माध्यम से प्रदान किया जाता है

अनुसंधान महत्व

क्वांटम कंप्यूटिंग डेटा-गहन अनुप्रयोगों में विशाल संभावनाएं रखता है, लेकिन एल्गोरिदम विकास और सत्यापन के लिए विश्वसनीय अनुकरण प्लेटफॉर्म की आवश्यकता है। FPGA हार्डवेयर एमुलेटर क्वांटम कंप्यूटिंग की समानांतर विशेषताओं को अधिक सटीकता से दोहरा सकते हैं, जो सॉफ्टवेयर अनुकरण के प्रदर्शन को पार करने का वादा करते हैं।

मौजूदा विधियों की सीमाएं

  • कम्प्यूटेशनल जटिलता: n क्वांटम बिट सिस्टम को 2^n×2^n मैट्रिक्स और 2^n स्टेट वेक्टर के गुणनफल संचालन की आवश्यकता है
  • मेमोरी आवश्यकता: स्टेट वेक्टर स्टोरेज आवश्यकता क्वांटम बिट्स की संख्या के साथ घातीय रूप से बढ़ती है
  • खराब स्केलेबिलिटी: मौजूदा FPGA समाधान या तो सीमित क्वांटम बिट्स का समर्थन करते हैं, या महंगे उच्च-स्तरीय FPGAs की आवश्यकता है

मूल योगदान

  1. AMARETTO आर्किटेक्चर प्रस्ताव: निम्न-स्तरीय FPGA के लिए डिज़ाइन किया गया एक कुशल क्वांटम सिमुलेटर, RISC-जैसी संरचना के साथ
  2. बटरफ्लाई चयन तंत्र: क्वांटम गेट मैट्रिक्स की विरलता का लाभ उठाते हुए, केवल आवश्यक संभाव्यता आयाम युग्मन की गणना करता है, अनावश्यक संचालन से बचता है
  3. सार्वभौमिक गेट सेट समर्थन: Clifford+T और रोटेशन गेट सेट का समर्थन करता है, किसी भी प्रकार के क्वांटम सर्किट को निष्पादित कर सकता है
  4. अनुकूलित संख्यात्मक प्रतिनिधित्व: 20-बिट निश्चित-बिंदु संख्या प्रतिनिधित्व (2-बिट पूर्णांक, 18-बिट भिन्नात्मक) का उपयोग करता है, सटीकता और संसाधन खपत को संतुलित करता है
  5. संपूर्ण अनुकरण वातावरण: OpenQASM 2.0 को RISC-जैसी निर्देशों में परिवर्तित करने के लिए संकलक सहित, उपयोगकर्ता-अनुकूल इंटरफेस

विधि विवरण

कार्य परिभाषा

इनपुट: OpenQASM 2.0 प्रारूप में क्वांटम सर्किट विवरण आउटपुट: अंतिम स्टेट वेक्टर की संभाव्यता आयाम बाधाएं: निम्न-स्तरीय FPGA संसाधन सीमाओं के तहत कुशल अनुकरण प्राप्त करना

मॉडल आर्किटेक्चर

AMARETTO RISC-जैसी आर्किटेक्चर अपनाता है, जिसमें निम्नलिखित मुख्य घटक हैं:

  1. क्वांटम स्टेट रजिस्टर फाइल (QSRF):
    • स्टेट वेक्टर के वास्तविक और काल्पनिक भागों को संग्रहीत करता है
    • आकार 2^N तत्व (N क्वांटम बिट्स की संख्या है)
    • BRAM ब्लॉक के पंपिंग तकनीक का उपयोग करता है, प्रति चक्र दो संभाव्यता आयाम पढ़ने/लिखने के लिए दोहरी आवृत्ति संचालन
  2. क्वांटम स्टेट सिलेक्टर (QSS):
    • बटरफ्लाई चयन तंत्र को लागू करता है
    • परस्पर क्रिया करने वाली संभाव्यता आयाम जोड़ी की पहचान करता है
    • अनावश्यक गणना से बचने के लिए क्वांटम गेट मैट्रिक्स विरलता का लाभ उठाता है
  3. क्वांटम अंकगणित इकाई (QAU):
    • चार कम्प्यूटेशनल इकाइयां शामिल हैं (प्रत्येक संभाव्यता आयाम के वास्तविक और काल्पनिक भागों के लिए एक)
    • प्रत्येक इकाई में दो गुणक और एक योजक होता है
    • पाइपलाइन संचालन का समर्थन करता है
  4. त्रिकोणमितीय फंक्शन इकाई (TU):
    • लुकअप टेबल (LUT) और टेलर श्रृंखला पर आधारित
    • साइन और कोसाइन मान की गणना करता है
    • CORDIC एल्गोरिदम की तुलना में कम प्रसंस्करण इकाइयों की आवश्यकता है
  5. क्वांटम अनुकरण नियंत्रण इकाई (QECU):
    • सभी मॉड्यूल के सिंक्रोनाइज संचालन को समन्वित करता है
    • निर्देश निष्पादन प्रवाह का प्रबंधन करता है

निर्देश सेट आर्किटेक्चर

AMARETTO तीन निर्देश प्रकार परिभाषित करता है:

  • s-type: सर्किट में क्वांटम बिट्स की संख्या सेट करता है
  • g-type: क्वांटम गेट संचालन निष्पादित करता है, ऑपकोड, लक्ष्य और नियंत्रण क्वांटम बिट्स, तत्काल संख्या क्षेत्र शामिल है
  • r-type: स्टेट वेक्टर पढ़ता है

निर्देश लंबाई 32-बिट है: 5-बिट ऑपकोड + 8-बिट क्वांटम बिट पहचान + 19-बिट तत्काल संख्या

तकनीकी नवाचार बिंदु

  1. एकीकृत गेट संचालन प्रतिनिधित्व: सभी समर्थित गेट को एकीकृत रूप में प्रतिनिधित्व किया जा सकता है:
    c_i^out = α sin(θ) + β cos(θ) + i(γ sin(θ) + δ cos(θ))
    c_j^out = ε sin(θ) + ζ cos(θ) + i(η sin(θ) + ι cos(θ))
    
  2. पांच-स्तरीय पाइपलाइन:
    • निर्देश-स्तरीय समानांतरता का लाभ उठाता है
    • जब युग्मन संख्या ≥ पाइपलाइन स्तर हो तो अधिकतम दक्षता प्राप्त करता है
    • न्यूनतम क्वांटम बिट आवश्यकता: N_q ≥ ⌈log₂(N_pipe) + 2⌉
  3. निश्चित-बिंदु संख्यात्मक प्रतिनिधित्व:
    • 20-बिट निश्चित-बिंदु (2-बिट पूर्णांक + 18-बिट भिन्नात्मक)
    • निकटतम सम सन्निकटन तंत्र
    • फ्लोटिंग-बिंदु की तुलना में क्षेत्र और जटिलता में कमी

प्रयोगात्मक सेटअप

लक्ष्य प्लेटफॉर्म

  • FPGA: AMD Kria KV260 SoM
  • विकास उपकरण: Vivado 2023.1
  • संख्यात्मक सटीकता: 20-बिट निश्चित-बिंदु प्रतिनिधित्व

सत्यापन विधि

  • परीक्षण सर्किट: लगभग 50 OpenQASM 2.0 क्वांटम सर्किट
  • तुलना बेंचमार्क: Qiskit स्टेट वेक्टर सिमुलेटर
  • मूल्यांकन मेट्रिक्स: ग्रेट सर्कल दूरी (GCD), ध्रुवीय निर्देशांक रूप में स्टेट वेक्टर तत्वों पर विचार करता है
  • स्वीकार्य सीमा: GCD < 0.05

प्रदर्शन तुलना प्लेटफॉर्म

  • सॉफ्टवेयर अनुकरण: Intel Xeon Gold 6134 CPU @ 3.20 GHz, 103 GB मेमोरी
  • तुलना सिमुलेटर: Qiskit के QASM सिमुलेटर और स्टेट वेक्टर सिमुलेटर

प्रयोगात्मक परिणाम

संसाधन उपयोग दर

AMD Kria KV260 पर 16 क्वांटम बिट अनुकरण का सफल कार्यान्वयन:

  • BRAM: 2.62 MB (100% उपयोग दर, बाधा बन जाता है)
  • तार्किक संसाधन: 7751/117120 CLB
  • DSP: 11/1248
  • घड़ी आवृत्ति: 100 MHz

प्रदर्शन तुलना

आर्किटेक्चरAMARETTO23456
क्वांटम बिट संख्या162432169
FPGAAMD Kria KV260Intel Cyclone VIntel Arria 10Intel Arria 10Intel APEX 20KE1500Intel Stratix
सटीकता20-बिट निश्चित-बिंदु10-बिट निश्चित-बिंदु32-बिट फ्लोटिंग-बिंदु64-बिट फ्लोटिंग-बिंदु-18-बिट निश्चित-बिंदु
घड़ी आवृत्ति100MHz-233MHz233MHz60MHz-

निष्पादन समय विश्लेषण

  • समय जटिलता: O(N) घड़ी चक्र (N स्टेट वेक्टर लंबाई 2^Nq है), जबकि पारंपरिक विधि O(N²) है
  • वास्तविक प्रदर्शन: Qiskit सिमुलेटर की तुलना में लगभग दो परिमाण तेज़
  • विस्तार सूत्र: निष्पादन समय = (2^max(Nq,Nqmin)-1 × Ng(2-α)/2 + (Npipe-1)) × Tclock

कार्यात्मक सत्यापन परिणाम

  • सभी परीक्षण सर्किट के GCD मान 0.05 से कम हैं
  • आर्किटेक्चर की कार्यात्मक सटीकता का सफल सत्यापन
  • संपूर्ण सार्वभौमिक क्वांटम गेट सेट का समर्थन

संबंधित कार्य

मौजूदा FPGA क्वांटम अनुकरण योजनाएं

  1. मैट्रिक्स-वेक्टर गुणनफल विधि 2,3: परत मैट्रिक्स और स्टेट वेक्टर गुणनफल की समानांतर गणना, लेकिन स्केलेबिलिटी सीमित है
  2. बाहरी मेमोरी योजना 4: स्केलेबिलिटा बढ़ाने के लिए स्टेट वेक्टर को बाहरी मेमोरी में संग्रहीत करता है, लेकिन मेमोरी आवश्यकता अभी भी बहुत बड़ी है
  3. हाइपरक्यूब विधि 5: N-आयामी हाइपरक्यूब पर आधारित आधार अवस्था परस्पर क्रिया की गणना, 16 क्वांटम बिट्स तक पहुंचता है
  4. सीमित गेट सेट योजना 6: बटरफ्लाई तंत्र का उपयोग करता है लेकिन केवल सीमित गेट सेट (Pauli X, CNOT, Toffoli, Hadamard) का समर्थन करता है

AMARETTO के लाभ

  • सार्वभौमिकता: सार्वभौमिक क्वांटम गेट सेट का समर्थन करता है, अनुप्रयोग प्रकार द्वारा सीमित नहीं
  • दक्षता: O(N) समय जटिलता बनाम पारंपरिक O(N²)
  • लागत-प्रभावशीलता: छोटे, सस्ते FPGAs पर तुलनीय प्रदर्शन प्राप्त करता है
  • पुनः संश्लेषण की आवश्यकता नहीं: नए सर्किट निष्पादित करते समय हार्डवेयर पुनः संश्लेषण की आवश्यकता नहीं है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. AMARETTO ने निम्न-स्तरीय FPGA पर 16 क्वांटम बिट्स का कुशल अनुकरण सफलतापूर्वक प्राप्त किया है
  2. निष्पादन समय सॉफ्टवेयर सिमुलेटर की तुलना में लगभग दो परिमाण तेज़ है
  3. संसाधन उपयोग दक्षता अधिक है, तार्किक व्यवसाय तुलना योजनाओं में सबसे कम है
  4. सार्वभौमिक क्वांटम गेट सेट का समर्थन करता है, व्यापक प्रयोज्यता

सीमाएं

  1. मेमोरी बाधा: BRAM उपलब्धता मुख्य सीमित कारक है, O(N_bit × 2^Nq) विस्तार नियम का पालन करता है
  2. क्वांटम बिट संख्या सीमा: लक्ष्य FPGA मेमोरी क्षमता द्वारा सीमित
  3. निश्चित-बिंदु सटीकता: 20-बिट निश्चित-बिंदु प्रतिनिधित्व कुछ अनुप्रयोगों में सटीकता अपर्याप्त हो सकता है
  4. प्लेटफॉर्म निर्भरता: संचार इंटरफेस को विभिन्न प्लेटफॉर्म के लिए अनुकूलित करने की आवश्यकता है

भविष्य की दिशाएं

  1. मेमोरी अनुकूलन: स्टेट वेक्टर भंडारण और पहुंच के लिए अधिक कुशल रणनीतियों की खोज करता है
  2. सटीकता वृद्धि: प्रदर्शन और सटीकता को संतुलित करने के लिए कॉन्फ़िगरेबल सटीकता तंत्र का अनुसंधान करता है
  3. बहु-FPGA विस्तार: बड़े पैमाने पर क्वांटम सिस्टम अनुकरण के लिए कई FPGAs का लाभ उठाता है
  4. शोर मॉडल: वास्तविक क्वांटम उपकरणों का बेहतर अनुकरण करने के लिए शोर मॉडल को एकीकृत करता है

गहन मूल्यांकन

शक्तियां

  1. तकनीकी नवाचार:
    • बटरफ्लाई चयन तंत्र क्वांटम गेट विरलता को प्रभावी ढंग से लाभ उठाता है
    • एकीकृत गेट संचालन प्रतिनिधित्व हार्डवेयर कार्यान्वयन को सरल करता है
    • पाइपलाइन डिज़ाइन निर्देश-स्तरीय समानांतरता का पूर्ण उपयोग करता है
  2. व्यावहारिक मूल्य:
    • निम्न-स्तरीय FPGA के लिए डिज़ाइन उपयोग की बाधा को कम करता है
    • संपूर्ण टूलचेन (संकलक + सिमुलेटर) अंत-से-अंत समाधान प्रदान करता है
    • उपयोगकर्ता-अनुकूल इंटरफेस मुख्यधारा क्वांटम ढांचे का समर्थन करता है
  3. प्रयोगात्मक पूर्णता:
    • कई मौजूदा योजनाओं के साथ विस्तृत तुलना
    • कार्यात्मक सत्यापन लगभग 50 परीक्षण सर्किट को कवर करता है
    • प्रदर्शन विश्लेषण समय और संसाधन दोनों आयामों को शामिल करता है

कमियां

  1. तुलना सीमाएं:
    • विभिन्न योजनाएं विभिन्न FPGA विक्रेता उत्पादों का उपयोग करती हैं, सीधी तुलना में पूर्वाग्रह है
    • कुछ तुलना कार्य जानकारी अधूरी है
    • समान प्लेटफॉर्म पर निष्पक्ष तुलना की कमी है
  2. स्केलेबिलिटा विश्लेषण अपर्याप्त:
    • मेमोरी बाधा को तोड़ने के संभावित समाधानों का गहन विश्लेषण नहीं
    • बड़े पैमाने पर क्वांटम सिस्टम के लिए विस्तार रणनीति की चर्चा सीमित है
  3. अनुप्रयोग परिदृश्य सत्यापन:
    • विशिष्ट क्वांटम एल्गोरिदम (जैसे Shor एल्गोरिदम, Grover एल्गोरिदम) का संपूर्ण प्रदर्शन की कमी
    • विभिन्न प्रकार के क्वांटम सर्किट के प्रदर्शन अंतर का विश्लेषण नहीं

प्रभाव

  1. शैक्षणिक योगदान: FPGA क्वांटम अनुकरण के लिए नई आर्किटेक्चर डिज़ाइन सोच प्रदान करता है
  2. व्यावहारिक मूल्य: क्वांटम एल्गोरिदम सत्यापन की हार्डवेयर लागत और तकनीकी बाधा को कम करता है
  3. पुनरुत्पादनीयता: काफी विस्तृत कार्यान्वयन विवरण प्रदान करता है, लेकिन ओपन-सोर्स कोड की कमी है

उपयुक्त परिदृश्य

  1. क्वांटम एल्गोरिदम विकास: मध्यम-स्तरीय क्वांटम एल्गोरिदम के तेजी से सत्यापन और डिबगिंग के लिए उपयुक्त
  2. शैक्षणिक अनुप्रयोग: क्वांटम कंप्यूटिंग शिक्षण के लिए आर्थिक और व्यावहारिक हार्डवेयर प्लेटफॉर्म प्रदान करता है
  3. प्रोटोटाइप सत्यापन: वास्तविक क्वांटम हार्डवेयर तैनाती से पहले एल्गोरिदम प्रोटोटाइप सत्यापन

संदर्भ

पेपर क्वांटम कंप्यूटिंग, FPGA डिज़ाइन और संख्यात्मक कंप्यूटिंग के क्षेत्रों से महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:

  • Nielsen & Chuang की क्वांटम कंप्यूटिंग शास्त्रीय पाठ्यपुस्तक
  • FPGA क्वांटम अनुकरण के कई संबंधित कार्य
  • OpenQASM भाषा विनिर्देश
  • FPGA डिज़ाइन अनुकूलन तकनीक साहित्य

समग्र मूल्यांकन: यह FPGA क्वांटम अनुकरण क्षेत्र में व्यावहारिक मूल्य वाला कार्य है। AMARETTO आर्किटेक्चर चतुर डिज़ाइन के माध्यम से निम्न-स्तरीय FPGA पर उच्च-स्तरीय योजनाओं के बराबर प्रदर्शन प्राप्त करता है, क्वांटम एल्गोरिदम सत्यापन के लिए एक आर्थिक और व्यावहारिक समाधान प्रदान करता है। हालांकि स्केलेबिलिटा और गहन विश्लेषण में सुधार की गुंजाइश है, लेकिन इसकी तकनीकी नवाचार और व्यावहारिक मूल्य की सराहना की जानी चाहिए।