2025-11-16T09:34:12.542193

AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs

Conti, Volpe, Graziano et al.
Researchers and industries are increasingly drawn to quantum computing for its computational potential. However, validating new quantum algorithms is challenging due to the limitations of current quantum devices. Software simulators are time and memory-consuming, making hardware emulators an attractive alternative. This article introduces AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), designed for quantum computing emulation on low-tier Field-Programmable gate arrays (FPGAs), supporting Clifford+T and rotational gate sets. It simplifies and accelerates the verification of quantum algorithms using a Reduced-Instruction-Set-Computer (RISC)-like structure and efficient handling of sparse quantum gates. A dedicated compiler translates OpenQASM 2.0 into RISC-like instructions. AMARETTO is validated against the Qiskit simulators. Our results show successful emulation of sixteen qubits on a AMD Kria KV260 SoM. This approach rivals other works in emulated qubit capacity on a smaller, more affordable FPGA
academic

AMARETTO: تمكين محاكاة الخوارزميات الكمية الفعالة على معالجات FPGA منخفضة المستوى

المعلومات الأساسية

  • معرّف الورقة: 2411.09320
  • العنوان: AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs
  • المؤلفون: Christian Conti, Deborah Volpe, Mariagrazia Graziano, Maurizio Zamboni, Giovanna Turvani (جامعة بوليتكنيكو دي تورينو، إيطاليا)
  • التصنيف: quant-ph cs.SY eess.SY
  • تاريخ النشر: 14 نوفمبر 2024 (نسخة أولية على arXiv)
  • رابط الورقة: https://arxiv.org/abs/2411.09320

الملخص

يتزايد اهتمام الباحثين والصناعة بالإمكانات الحسابية للحوسبة الكمية. ومع ذلك، يشكل التحقق من الخوارزميات الكمية الجديدة تحديًا بسبب قيود الأجهزة الكمية الحالية. محاكاة البرامج تستغرق وقتًا طويلًا وتتطلب استهلاكًا كبيرًا للذاكرة، مما يجعل محاكاة الأجهزة بديلًا جذابًا. تقدم هذه الورقة AMARETTO (تقنية محاكاة العمارة الكمية)، المصممة خصيصًا لمحاكاة الحوسبة الكمية على معالجات FPGA منخفضة المستوى، مع دعم مجموعات بوابات Clifford+T والبوابات الدورانية. تستخدم بنية شبيهة بـ RISC ومعالجة فعالة للبوابات الكمية المتفرقة لتبسيط وتسريع التحقق من الخوارزميات الكمية. يحول المترجم المتخصص OpenQASM 2.0 إلى تعليمات شبيهة بـ RISC. تم التحقق من AMARETTO مقابل محاكي Qiskit. أظهرت النتائج محاكاة ناجحة لـ 16 كيوبت على AMD Kria KV260 SoM. يحقق هذا النهج سعة كيوبت مماثلة للأعمال الأخرى على معالجات FPGA أصغر وأكثر اقتصادية.

خلفية البحث والدافع

تعريف المشكلة

  1. صعوبة التحقق من الخوارزميات الكمية: تعاني أجهزة الكمية الحالية من الضوضاء وانخفاض الدقة، مما يجعل التحقق الموثوق من الخوارزميات الكمية الجديدة صعبًا
  2. قيود محاكاة البرامج الكلاسيكية: تواجه محاكيات البرامج الكلاسيكية مشاكل في وقت التنفيذ الطويل ومتطلبات الذاكرة العالية، مما يحد من قابلية التوسع
  3. الوصول المحدود للأجهزة: يتم احتكار إنتاج وإدارة وصيانة الأجهزة الكمية من قبل الشركات الكبرى، وعادة ما يتم توفير الوصول من خلال منصات سحابية مدفوعة

أهمية البحث

تتمتع الحوسبة الكمية بإمكانيات هائلة في التطبيقات كثيفة البيانات، لكن تطوير الخوارزميات والتحقق منها يتطلب منصة محاكاة موثوقة. يمكن لمحاكيات أجهزة FPGA أن تكرر خصائص الحوسبة الكمية المتوازية بشكل أكثر دقة، مما يعد بتجاوز أداء محاكيات البرامج.

قيود الطرق الموجودة

  • التعقيد الحسابي: يتطلب نظام n كيوبت عمليات ضرب مصفوفة 2^n × 2^n مع متجه حالة 2^n
  • متطلبات الذاكرة: ينمو متطلب تخزين متجه الحالة بشكل أسي مع عدد الكيوبتات
  • قابلية التوسع الضعيفة: إما أن تدعم الحلول الحالية على FPGA عددًا محدودًا من الكيوبتات أو تتطلب معالجات FPGA باهظة الثمن عالية المستوى

المساهمات الأساسية

  1. اقتراح معمارية AMARETTO: محاكي كمي فعال مصمم خصيصًا لمعالجات FPGA منخفضة المستوى، يستخدم بنية شبيهة بـ RISC
  2. آلية اختيار الفراشة: تستفيد من تفرق مصفوفات البوابات الكمية، وتحسب فقط اقترانات السعة الاحتمالية الضرورية، مما يتجنب العمليات الزائدة
  3. دعم مجموعة البوابات الشاملة: تدعم بوابات Clifford+T والبوابات الدورانية، وقادرة على تنفيذ أي نوع من الدوائر الكمية
  4. تمثيل رقمي محسّن: يستخدم تمثيل نقطة ثابتة 20 بت (عدد صحيح 2 بت، كسر 18 بت)، يوازن بين الدقة واستهلاك الموارد
  5. بيئة محاكاة كاملة: تتضمن مترجمًا يحول OpenQASM 2.0 إلى تعليمات شبيهة بـ RISC، مع واجهة سهلة الاستخدام

شرح الطريقة

تعريف المهمة

الإدخال: وصف الدائرة الكمية بصيغة OpenQASM 2.0 الإخراج: السعات الاحتمالية لمتجه الحالة النهائي القيود: تحقيق محاكاة فعالة ضمن قيود موارد FPGA منخفضة المستوى

معمارية النموذج

تستخدم AMARETTO بنية شبيهة بـ RISC، تتضمن المكونات الأساسية التالية:

  1. ملف سجلات الحالة الكمية (QSRF):
    • يخزن الأجزاء الحقيقية والخيالية لمتجه الحالة
    • الحجم 2^N عنصر (N هو عدد الكيوبتات)
    • يستخدم تقنية الضخ لكتل BRAM، التشغيل بتردد مضاعف لقراءة وكتابة سعتي احتمالية لكل دورة
  2. محدد الحالة الكمية (QSS):
    • ينفذ آلية اختيار الفراشة
    • يحدد أزواج السعات الاحتمالية التي تحتاج إلى التفاعل
    • يستفيد من تفرق مصفوفات البوابات الكمية لتجنب الحسابات غير الضرورية
  3. وحدة الحسابات الكمية (QAU):
    • تحتوي على أربع وحدات حسابية (واحدة لكل جزء حقيقي وخيالي من السعة الاحتمالية)
    • تحتوي كل وحدة على مضاعفين وجامع واحد
    • تدعم العمليات خطية الأنابيب
  4. وحدة الدوال المثلثية (TU):
    • تستند إلى جداول البحث (LUT) وسلسلة تايلور
    • تحسب قيم الجيب وجيب التمام
    • تتطلب وحدات معالجة أقل مقارنة بخوارزمية CORDIC
  5. وحدة التحكم في محاكاة الكم (QECU):
    • تنسق العمليات المتزامنة لجميع الوحدات
    • تدير تدفق تنفيذ التعليمات

معمارية مجموعة التعليمات

تحدد AMARETTO ثلاثة أنواع من التعليمات:

  • نوع s: تعيين عدد الكيوبتات في الدائرة
  • نوع g: تنفيذ عمليات البوابة الكمية، تتضمن رمز العملية والكيوبتات المستهدفة والمتحكم فيها وحقل الأرقام الفورية
  • نوع r: قراءة متجه الحالة

طول التعليمة 32 بت: 5 بت رمز العملية + 8 بت معرّف الكيوبت + 19 بت أرقام فورية

نقاط الابتكار التقني

  1. تمثيل موحد لعمليات البوابة: يمكن تمثيل جميع البوابات المدعومة بالشكل الموحد:
    c_i^out = α sin(θ) + β cos(θ) + i(γ sin(θ) + δ cos(θ))
    c_j^out = ε sin(θ) + ζ cos(θ) + i(η sin(θ) + ι cos(θ))
    
  2. خط أنابيب خماسي المراحل:
    • يستفيد من التوازي على مستوى التعليمات
    • يحقق أقصى كفاءة عندما يكون عدد الاقترانات ≥ عدد مراحل خط الأنابيب
    • الحد الأدنى لمتطلبات عدد الكيوبتات: N_q ≥ ⌈log₂(N_pipe) + 2⌉
  3. تمثيل رقمي بنقطة ثابتة:
    • 20 بت نقطة ثابتة (عدد صحيح 2 بت + كسر 18 بت)
    • آلية التقريب للعدد الزوجي الأقرب
    • يقلل المساحة والتعقيد مقارنة بالنقطة العائمة

إعداد التجارب

المنصة المستهدفة

  • FPGA: AMD Kria KV260 SoM
  • أدوات التطوير: Vivado 2023.1
  • دقة رقمية: تمثيل نقطة ثابتة 20 بت

طريقة التحقق

  • دوائر الاختبار: حوالي 50 دائرة كمية بصيغة OpenQASM 2.0
  • معيار المقارنة: محاكي متجه الحالة Qiskit
  • مؤشرات التقييم: مسافة الدائرة العظمى (GCD)، تأخذ في الاعتبار عناصر متجه الحالة بالشكل القطبي
  • عتبة القبول: GCD < 0.05

منصات مقارنة الأداء

  • محاكاة البرامج: معالج Intel Xeon Gold 6134 @ 3.20 GHz، ذاكرة 103 GB
  • محاكيات المقارنة: محاكي QASM ومحاكي متجه الحالة من Qiskit

نتائج التجارب

استخدام الموارد

تم تحقيق محاكاة 16 كيوبت بنجاح على AMD Kria KV260:

  • BRAM: 2.62 MB (معدل استخدام 100%، يشكل عنق الزجاجة)
  • موارد منطقية: 7751/117120 CLB
  • DSP: 11/1248
  • تردد الساعة: 100 MHz

مقارنة الأداء

المعماريةAMARETTO23456
عدد الكيوبتات162432169
FPGAAMD Kria KV260Intel Cyclone VIntel Arria 10Intel Arria 10Intel APEX 20KE1500Intel Stratix
الدقةنقطة ثابتة 20 بتنقطة ثابتة 10 بتنقطة عائمة 32 بتنقطة عائمة 64 بت-نقطة ثابتة 18 بت
تردد الساعة100 MHz-233 MHz233 MHz60 MHz-

تحليل وقت التنفيذ

  • التعقيد الزمني: O(N) دورة ساعة (N هو طول متجه الحالة 2^Nq)، بينما الطريقة التقليدية O(N²)
  • الأداء الفعلية: أسرع بحوالي رتبتين من حيث الحجم من محاكي Qiskit
  • صيغة التوسع: وقت التنفيذ = (2^max(Nq,Nqmin)-1 × Ng(2-α)/2 + (Npipe-1)) × Tclock

نتائج التحقق الوظيفي

  • جميع قيم GCD للدوائر المختبرة أقل من 0.05
  • التحقق الناجح من صحة المعمارية الوظيفية
  • دعم مجموعة البوابات الكمية الشاملة

الأعمال ذات الصلة

حلول محاكاة FPGA الكمية الموجودة

  1. طريقة ضرب المصفوفة-المتجه 2,3: حساب متوازي لضرب مصفوفة الطبقة بمتجه الحالة، لكن قابلية التوسع محدودة
  2. حلول الذاكرة الخارجية 4: تخزين متجه الحالة في الذاكرة الخارجية لتحسين قابلية التوسع، لكن متطلبات الذاكرة لا تزال كبيرة
  3. طريقة فوق المكعب 5: حساب قائم على تفاعل الحالة الأساسية في مكعب N الأبعاد، يحقق 16 كيوبت
  4. حلول مجموعة البوابات المحدودة 6: استخدام آلية الفراشة لكن يدعم فقط مجموعة بوابات محدودة (Pauli X, CNOT, Toffoli, Hadamard)

مزايا AMARETTO

  • الشمولية: تدعم مجموعة البوابات الكمية الشاملة، بدون تقييد نوع التطبيق
  • الكفاءة: تعقيد زمني O(N) مقابل O(N²) التقليدي
  • فعالية التكلفة: تحقيق أداء مماثلة على معالجات FPGA أصغر وأرخص
  • بدون إعادة تجميع: لا تحتاج إلى إعادة تجميع الأجهزة عند تنفيذ دوائر جديدة

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. حققت AMARETTO بنجاح محاكاة فعالة لـ 16 كيوبت على معالجات FPGA منخفضة المستوى
  2. وقت التنفيذ أسرع بحوالي رتبتين من محاكيات البرامج
  3. كفاءة استخدام الموارد عالية، مع أقل معدل استخدام منطقي بين الحلول المقارنة
  4. تدعم مجموعة البوابات الكمية الشاملة، مع قابلية تطبيق واسعة

القيود

  1. عنق الزجاجة في الذاكرة: توفر BRAM يشكل عامل التحديد الرئيسي، يتبع قانون التوسع O(N_bit × 2^Nq)
  2. تحديد عدد الكيوبتات: محدود بسعة الذاكرة في معالج FPGA المستهدف
  3. دقة النقطة الثابتة: قد لا يكون تمثيل النقطة الثابتة 20 بت دقيقًا كافيًا في بعض التطبيقات
  4. الاعتماد على المنصة: تحتاج واجهات الاتصال إلى التكيف مع منصات مختلفة

الاتجاهات المستقبلية

  1. تحسين الذاكرة: استكشاف استراتيجيات تخزين والوصول إلى متجه الحالة أكثر كفاءة
  2. تحسين الدقة: البحث عن آليات دقة قابلة للتكوين لموازنة الأداء والدقة
  3. توسع متعدد FPGA: استخدام معالجات FPGA متعددة لمحاكاة أنظمة كمية أكبر حجمًا
  4. نماذج الضوضاء: دمج نماذج الضوضاء لمحاكاة أفضل للأجهزة الكمية الحقيقية

التقييم المتعمق

المزايا

  1. الابتكار التقني:
    • آلية اختيار الفراشة تستفيد بفعالية من تفرق البوابات الكمية
    • تمثيل موحد لعمليات البوابة يبسط التنفيذ الأجهزة
    • تصميم خط الأنابيب يستفيد بالكامل من التوازي على مستوى التعليمات
  2. القيمة العملية:
    • التصميم الموجه نحو معالجات FPGA منخفضة المستوى يخفض حاجز الاستخدام
    • سلسلة أدوات كاملة (مترجم + محاكي) توفر حلًا شاملًا من البداية إلى النهاية
    • واجهة سهلة الاستخدام تدعم أطر عمل كمية سائدة
  3. كفاية التجارب:
    • مقارنة مفصلة مع حلول موجودة متعددة
    • التحقق الوظيفي يغطي حوالي 50 دائرة اختبار
    • تحليل الأداء يشمل البعد الزمني وموارد

أوجه القصور

  1. قيود المقارنة:
    • تستخدم الحلول المختلفة منتجات معالجات FPGA من موردين مختلفين، مما يؤدي إلى انحياز في المقارنة المباشرة
    • معلومات بعض الأعمال المقارنة غير كاملة
    • نقص مقارنة عادلة على نفس المنصة
  2. تحليل قابلية التوسع غير كافٍ:
    • لم يتم تحليل عميق للحلول الممكنة لتجاوز عنق الزجاجة في الذاكرة
    • نقاش محدود حول استراتيجيات التوسع لأنظمة كمية أكبر حجمًا
  3. التحقق من سيناريوهات التطبيق:
    • نقص عرض كامل لخوارزميات كمية محددة (مثل خوارزمية Shor وخوارزمية Grover)
    • عدم تحليل الفروقات في الأداء بين أنواع الدوائر الكمية المختلفة

التأثير

  1. المساهمة الأكاديمية: توفير أفكار تصميم معمارية جديدة لمحاكاة FPGA الكمية
  2. القيمة العملية: خفض تكاليف الأجهزة والحواجز التقنية للتحقق من الخوارزميات الكمية
  3. قابلية التكرار: توفير تفاصيل تنفيذ مفصلة نسبيًا، لكن نقص الكود مفتوح المصدر

السيناريوهات المناسبة

  1. تطوير الخوارزميات الكمية: مناسبة للتحقق السريع والتصحيح للخوارزميات الكمية متوسطة الحجم
  2. التطبيقات التعليمية: توفير منصة أجهزة اقتصادية وعملية لتعليم الحوسبة الكمية
  3. التحقق من النماذج الأولية: إجراء التحقق من نماذج الخوارزميات قبل النشر على أجهزة كمية حقيقية

المراجع

تستشهد الورقة بأدبيات مهمة في مجالات الحوسبة الكمية وتصميم FPGA والحسابات الرقمية، بما في ذلك:

  • الكتاب الكلاسيكي للحوسبة الكمية لـ Nielsen & Chuang
  • أعمال ذات صلة متعددة في محاكاة FPGA الكمية
  • مواصفات لغة OpenQASM
  • أدبيات تقنيات تحسين تصميم FPGA

التقييم الشامل: هذا عمل ذو قيمة عملية في مجال محاكاة FPGA الكمية. تحقق معمارية AMARETTO من خلال تصميم ذكي أداءً مماثلًا للحلول عالية المستوى على معالجات FPGA منخفضة المستوى، مما يوفر حلًا اقتصاديًا وعمليًا للتحقق من الخوارزميات الكمية. على الرغم من وجود مجال للتحسين في قابلية التوسع والتحليل المتعمق، فإن الابتكار التقني والقيمة العملية يستحقان الإشادة.