2025-11-16T09:34:12.542193

AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs

Conti, Volpe, Graziano et al.
Researchers and industries are increasingly drawn to quantum computing for its computational potential. However, validating new quantum algorithms is challenging due to the limitations of current quantum devices. Software simulators are time and memory-consuming, making hardware emulators an attractive alternative. This article introduces AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy), designed for quantum computing emulation on low-tier Field-Programmable gate arrays (FPGAs), supporting Clifford+T and rotational gate sets. It simplifies and accelerates the verification of quantum algorithms using a Reduced-Instruction-Set-Computer (RISC)-like structure and efficient handling of sparse quantum gates. A dedicated compiler translates OpenQASM 2.0 into RISC-like instructions. AMARETTO is validated against the Qiskit simulators. Our results show successful emulation of sixteen qubits on a AMD Kria KV260 SoM. This approach rivals other works in emulated qubit capacity on a smaller, more affordable FPGA
academic

AMARETTO: Обеспечение эффективной эмуляции квантовых алгоритмов на FPGA низкого уровня

Основная информация

  • ID статьи: 2411.09320
  • Название: AMARETTO: Enabling Efficient Quantum Algorithm Emulation on Low-Tier FPGAs
  • Авторы: Christian Conti, Deborah Volpe, Mariagrazia Graziano, Maurizio Zamboni, Giovanna Turvani (Politecnico di Torino, Италия)
  • Классификация: quant-ph cs.SY eess.SY
  • Дата публикации: 14 ноября 2024 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2411.09320

Аннотация

Исследователи и промышленность проявляют растущий интерес к вычислительному потенциалу квантовых вычислений. Однако из-за ограничений современных квантовых устройств проверка новых квантовых алгоритмов представляет собой сложную задачу. Программные симуляторы требуют значительных временных затрат и потребления памяти, что делает аппаратные эмуляторы привлекательной альтернативой. В данной статье представлена AMARETTO (quAntuM ARchitecture EmulaTion TechnOlogy) — технология, разработанная специально для эмуляции квантовых вычислений на FPGA низкого уровня с поддержкой набора вентилей Clifford+T и вентилей вращения. Она использует архитектуру типа RISC и эффективную обработку разреженных квантовых вентилей для упрощения и ускорения проверки квантовых алгоритмов. Специализированный компилятор преобразует OpenQASM 2.0 в инструкции типа RISC. AMARETTO была проверена на соответствие симулятору Qiskit. Результаты показывают успешную эмуляцию 16 квантовых битов на AMD Kria KV260 SoM. Этот подход обеспечивает емкость квантовых битов, сравнимую с другими работами, на более компактных и экономичных FPGA.

Исследовательский контекст и мотивация

Определение проблемы

  1. Сложность проверки квантовых алгоритмов: Современные квантовые устройства характеризуются шумом и низкой точностью, что затрудняет надежную проверку новых квантовых алгоритмов
  2. Ограничения программных симуляторов: Классические программные симуляторы сталкиваются с проблемами длительного времени выполнения и высоких требований к памяти, что ограничивает масштабируемость
  3. Ограниченный доступ к аппаратному обеспечению: Производство, управление и обслуживание квантового оборудования монополизированы крупными компаниями, обычно предоставляющими доступ через платные облачные платформы

Значимость исследования

Квантовые вычисления имеют огромный потенциал в приложениях с интенсивной обработкой данных, однако разработка и проверка алгоритмов требуют надежной платформы эмуляции. Аппаратные эмуляторы на базе FPGA способны более точно воспроизводить параллельные характеристики квантовых вычислений и обещают превзойти производительность программных эмуляторов.

Ограничения существующих подходов

  • Вычислительная сложность: Система с n квантовыми битами требует произведения матрицы размером 2^n×2^n и вектора состояния размером 2^n
  • Требования к памяти: Требования к хранению вектора состояния растут экспоненциально с количеством квантовых битов
  • Плохая масштабируемость: Существующие решения на FPGA либо поддерживают ограниченное количество квантовых битов, либо требуют дорогостоящих высокопроизводительных FPGA

Основные вклады

  1. Предложение архитектуры AMARETTO: Эффективный квантовый эмулятор, разработанный для FPGA низкого уровня с архитектурой типа RISC
  2. Механизм выбора бабочки: Использование разреженности матриц квантовых вентилей для вычисления только необходимых связей амплитуд вероятности, избегая избыточных операций
  3. Поддержка универсального набора вентилей: Поддержка наборов вентилей Clifford+T и вентилей вращения для выполнения любого типа квантовой схемы
  4. Оптимизированное числовое представление: Использование 20-битного представления с фиксированной точкой (2 бита целой части, 18 битов дробной части) для балансировки точности и потребления ресурсов
  5. Полная среда эмуляции: Включает компилятор для преобразования OpenQASM 2.0 в инструкции типа RISC и удобный пользовательский интерфейс

Подробное описание методики

Определение задачи

Входные данные: Описание квантовой схемы в формате OpenQASM 2.0 Выходные данные: Амплитуды вероятности вектора конечного состояния Ограничения: Реализация эффективной эмуляции в условиях ограниченных ресурсов FPGA низкого уровня

Архитектура модели

AMARETTO использует архитектуру типа RISC, содержащую следующие основные компоненты:

  1. Файл регистров квантового состояния (QSRF):
    • Хранит действительную и мнимую части вектора состояния
    • Размер составляет 2^N элементов (N — количество квантовых битов)
    • Использует технику pumping блоков BRAM для двойной частоты операций, обеспечивая чтение и запись двух амплитуд вероятности за цикл
  2. Селектор квантового состояния (QSS):
    • Реализует механизм выбора бабочки
    • Идентифицирует пары амплитуд вероятности, требующие взаимодействия
    • Использует разреженность матриц квантовых вентилей для избежания ненужных вычислений
  3. Квантовый арифметический модуль (QAU):
    • Содержит четыре вычислительных модуля (по одному для действительной и мнимой части каждой амплитуды вероятности)
    • Каждый модуль содержит два умножителя и один сумматор
    • Поддерживает конвейерные операции
  4. Модуль тригонометрических функций (TU):
    • Основан на таблицах поиска (LUT) и рядах Тейлора
    • Вычисляет значения синуса и косинуса
    • Требует меньше обрабатывающих элементов по сравнению с алгоритмом CORDIC
  5. Модуль управления квантовой эмуляцией (QECU):
    • Координирует синхронизированные операции всех модулей
    • Управляет потоком выполнения инструкций

Архитектура набора инструкций

AMARETTO определяет три типа инструкций:

  • s-type: Установка количества квантовых битов в схеме
  • g-type: Выполнение операций квантовых вентилей, содержащих поле кода операции, целевые и управляющие квантовые биты, поле непосредственного значения
  • r-type: Чтение вектора состояния

Длина инструкции составляет 32 бита: 5 битов кода операции + 8 битов идентификаторов квантовых битов + 19 битов непосредственного значения

Ключевые технические инновации

  1. Унифицированное представление операций вентилей: Все поддерживаемые вентили могут быть представлены в унифицированной форме:
    c_i^out = α sin(θ) + β cos(θ) + i(γ sin(θ) + δ cos(θ))
    c_j^out = ε sin(θ) + ζ cos(θ) + i(η sin(θ) + ι cos(θ))
    
  2. Пятиступенчатый конвейер:
    • Использует параллелизм на уровне инструкций
    • Достигает максимальной эффективности при количестве связей ≥ количеству ступеней конвейера
    • Минимальное требуемое количество квантовых битов: N_q ≥ ⌈log₂(N_pipe) + 2⌉
  3. Числовое представление с фиксированной точкой:
    • 20-битное представление с фиксированной точкой (2 бита целой части + 18 битов дробной части)
    • Механизм округления до ближайшего четного
    • Уменьшение площади и сложности по сравнению с плавающей точкой

Экспериментальная установка

Целевая платформа

  • FPGA: AMD Kria KV260 SoM
  • Инструменты разработки: Vivado 2023.1
  • Числовая точность: 20-битное представление с фиксированной точкой

Методология проверки

  • Тестовые схемы: Примерно 50 квантовых схем OpenQASM 2.0
  • Эталонная база: Симулятор вектора состояния Qiskit
  • Метрики оценки: Большое круговое расстояние (GCD), учитывающее элементы вектора состояния в полярной форме
  • Приемлемый порог: GCD < 0,05

Платформы для сравнения производительности

  • Программная эмуляция: Intel Xeon Gold 6134 CPU @ 3,20 ГГц, 103 ГБ памяти
  • Сравниваемые симуляторы: Симулятор QASM и симулятор вектора состояния Qiskit

Результаты экспериментов

Использование ресурсов

Успешная реализация эмуляции 16 квантовых битов на AMD Kria KV260:

  • BRAM: 2,62 МБ (100% использование, становится узким местом)
  • Логические ресурсы: 7751/117120 CLB
  • DSP: 11/1248
  • Тактовая частота: 100 МГц

Сравнение производительности

АрхитектураAMARETTO23456
Количество квантовых битов162432169
FPGAAMD Kria KV260Intel Cyclone VIntel Arria 10Intel Arria 10Intel APEX 20KE1500Intel Stratix
Точность20-бит фиксированная точка10-бит фиксированная точка32-бит плавающая точка64-бит плавающая точка18-бит фиксированная точка
Тактовая частота100 МГц233 МГц233 МГц60 МГц

Анализ времени выполнения

  • Временная сложность: O(N) тактовых циклов (N — длина вектора состояния 2^Nq), в то время как традиционные методы требуют O(N²)
  • Фактическая производительность: Примерно на два порядка быстрее симулятора Qiskit
  • Формула масштабирования: Время выполнения = (2^max(Nq,Nqmin)-1 × Ng(2-α)/2 + (Npipe-1)) × Tclock

Результаты функциональной проверки

  • Значения GCD для всех тестовых схем меньше 0,05
  • Успешная проверка функциональной корректности архитектуры
  • Поддержка полного универсального набора квантовых вентилей

Связанные работы

Существующие решения для эмуляции квантовых вычислений на FPGA

  1. Метод произведения матрица-вектор 2,3: Параллельное вычисление произведения матрицы слоя и вектора состояния, но с ограниченной масштабируемостью
  2. Решения с внешней памятью 4: Хранение вектора состояния во внешней памяти для повышения масштабируемости, но требования к памяти остаются значительными
  3. Метод гиперкуба 5: Вычисление взаимодействия базовых состояний на основе N-мерного гиперкуба, достигающее 16 квантовых битов
  4. Решения с ограниченным набором вентилей 6: Использование механизма бабочки, но поддержка только ограниченного набора вентилей (Pauli X, CNOT, Toffoli, Hadamard)

Преимущества AMARETTO

  • Универсальность: Поддержка универсального набора квантовых вентилей без ограничений на типы приложений
  • Эффективность: Временная сложность O(N) против традиционной O(N²)
  • Экономичность: Реализация сравнимой производительности на более компактных и дешевых FPGA
  • Отсутствие необходимости пересинтеза: При выполнении новых схем не требуется переконфигурация аппаратного обеспечения

Выводы и обсуждение

Основные выводы

  1. AMARETTO успешно реализует эффективную эмуляцию 16 квантовых битов на FPGA низкого уровня
  2. Время выполнения примерно на два порядка быстрее программного симулятора
  3. Высокая эффективность использования ресурсов с наименьшим логическим занимаемым пространством среди сравниваемых решений
  4. Поддержка универсального набора квантовых вентилей обеспечивает широкую применимость

Ограничения

  1. Узкое место памяти: Доступность BRAM становится основным ограничивающим фактором, следуя закону масштабирования O(N_bit × 2^Nq)
  2. Ограничение количества квантовых битов: Ограничено емкостью памяти целевого FPGA
  3. Точность фиксированной точки: 20-битное представление с фиксированной точкой может быть недостаточным для некоторых приложений
  4. Зависимость от платформы: Интерфейсы связи требуют адаптации для различных платформ

Направления будущих исследований

  1. Оптимизация памяти: Исследование более эффективных стратегий хранения и доступа к вектору состояния
  2. Повышение точности: Разработка механизмов настраиваемой точности для балансировки производительности и точности
  3. Расширение на несколько FPGA: Использование нескольких FPGA для эмуляции более крупных квантовых систем
  4. Модели шума: Интеграция моделей шума для лучшего моделирования реальных квантовых устройств

Глубокая оценка

Сильные стороны

  1. Техническая инновативность:
    • Механизм выбора бабочки эффективно использует разреженность квантовых вентилей
    • Унифицированное представление операций вентилей упрощает аппаратную реализацию
    • Конвейерная архитектура полностью использует параллелизм на уровне инструкций
  2. Практическая ценность:
    • Разработка для FPGA низкого уровня снижает барьер входа
    • Полная цепочка инструментов (компилятор + эмулятор) обеспечивает сквозное решение
    • Удобный пользовательский интерфейс поддерживает основные квантовые фреймворки
  3. Достаточность экспериментов:
    • Детальное сравнение с несколькими существующими решениями
    • Функциональная проверка охватывает примерно 50 тестовых схем
    • Анализ производительности включает временные и ресурсные измерения

Недостатки

  1. Ограничения сравнения:
    • Различные решения используют продукты FPGA разных производителей, что вносит смещение в прямое сравнение
    • Информация о некоторых сравниваемых работах неполная
    • Отсутствует справедливое сравнение на одной и той же платформе
  2. Недостаточный анализ масштабируемости:
    • Отсутствует глубокий анализ возможных решений для преодоления узкого места памяти
    • Ограниченное обсуждение стратегий расширения для более крупных квантовых систем
  3. Недостаточная проверка на практических приложениях:
    • Отсутствует полная демонстрация конкретных квантовых алгоритмов (таких как алгоритм Шора или алгоритм Гровера)
    • Не проведен анализ различий в производительности для различных типов квантовых схем

Влияние

  1. Академический вклад: Предоставляет новые идеи архитектурного проектирования для эмуляции квантовых вычислений на FPGA
  2. Практическая ценность: Снижает аппаратные затраты и технические барьеры для проверки квантовых алгоритмов
  3. Воспроизводимость: Предоставляет достаточно подробные детали реализации, но отсутствует открытый исходный код

Применимые сценарии

  1. Разработка квантовых алгоритмов: Подходит для быстрой проверки и отладки квантовых алгоритмов среднего масштаба
  2. Образовательные приложения: Предоставляет экономичную и практичную аппаратную платформу для обучения квантовым вычислениям
  3. Проверка прототипов: Позволяет проверить прототипы алгоритмов перед развертыванием на реальном квантовом оборудовании

Библиография

Статья цитирует важные работы в области квантовых вычислений, проектирования FPGA и численных вычислений, включая:

  • Классический учебник по квантовым вычислениям Nielsen & Chuang
  • Связанные работы по эмуляции квантовых вычислений на FPGA
  • Спецификацию языка OpenQASM
  • Литературу по методам оптимизации проектирования FPGA

Общая оценка: Это практически ценная работа в области эмуляции квантовых вычислений на FPGA. Архитектура AMARETTO благодаря умному проектированию достигает производительности, сравнимой с высокопроизводительными решениями, на FPGA низкого уровня, предоставляя экономичное и практичное решение для проверки квантовых алгоритмов. Хотя есть место для улучшения в области масштабируемости и углубленного анализа, техническая инновативность и практическая ценность работы заслуживают признания.