2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic

TReCiM: Маломощный и устойчивый к температуре многобитный дизайн вычислений в памяти 2FeFET-1T

Основная информация

  • ID статьи: 2501.01052
  • Название: TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
  • Авторы: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
  • Классификация: cs.ET (Развивающиеся технологии)
  • Дата публикации: Январь 2025
  • Ссылка на статью: https://arxiv.org/abs/2501.01052

Аннотация

Вычисления в памяти (Compute-in-Memory, CiM) представляют собой перспективное решение для преодоления аппаратных вызовов в области искусственного интеллекта и интернета вещей, особенно для решения проблемы "стены памяти". Благодаря использованию устройств энергонезависимой памяти (NVM) в архитектуре кроссбара, CiM обеспечивает эффективное ускорение критических операций в нейронных сетях — операций умножения-накопления (MAC). Среди различных устройств NVM транзисторы с сегнетоэлектрическим эффектом (FeFET) особенно хорошо подходят для сверхмаломощных массивов CiM благодаря совместимости с КМОП, механизму записи/чтения, управляемому напряжением, и высокому отношению ION/IOFF. Работа FeFET в подпороговом режиме может дополнительно минимизировать потребление энергии, однако она подвержена дрейфу температуры, что приводит к снижению точности вычислений. В данной работе предлагается TReCiM — сверхмаломощный, устойчивый к температуре многобитный дизайн CiM на основе 2FeFET-1T, обеспечивающий надежное выполнение операций MAC в диапазоне температур от 0°C до 85°C. Тестирование на основе фреймворка NeuroSim на нейронной сети VGG-8 и наборе данных CIFAR-10 показывает, что с учетом влияния температурного дрейфа массив TReCiM достигает точности 91,31%, что на 1,86% выше, чем существующие одноразрядные массивы CiM типа 2T-1FeFET. Кроме того, дизайн достигает энергоэффективности 48,03 TOPS/W на системном уровне, что сопоставимо с существующими дизайнами с меньшими технологическими нормами.

Исследовательский контекст и мотивация

Проблемный контекст

  1. Проблема стены памяти: Традиционная архитектура фон Неймана сталкивается с высоким энергопотреблением и узкими местами производительности из-за частой передачи данных между процессорными и запоминающими устройствами
  2. Требования граничного ИИ: Приложения ИИ и IoT требуют большого количества операций MAC с экстремальными требованиями к энергоэффективности
  3. Ограничения существующих CiM: Хотя технология вычислений в памяти решает проблему стены памяти, существующие дизайны имеют недостатки в устойчивости к температуре и многобитном хранении

Исследовательская мотивация

  1. Преимущества FeFET: FeFET обладает совместимостью с КМОП, низким током утечки, высоким отношением ION/IOFF и другими преимуществами, подходящими для сверхмаломощных приложений
  2. Подпороговая работа: Работа в подпороговой области может значительно снизить потребление энергии, но увеличивает температурную чувствительность
  3. Ограничения существующих решений:
    • Существующие устойчивые к температуре дизайны плохо работают при больших размерах массива
    • Поддерживают только одноразрядное хранение, что ограничивает плотность хранения
    • Дизайны 2T-1FeFET требуют дополнительного времени разряда, увеличивая задержку

Основные вклады

  1. Предложена архитектура TReCiM: Первый устойчивый к температуре многобитный дизайн CiM типа 2FeFET-1T, поддерживающий диапазон температур 0°C-85°C
  2. Инновационная структура зажима 2FeFET: Использование дополнительных характеристик абсолютной температуры (CTAT) для реализации температурной компенсации
  3. Возможность многобитного хранения: Использование характеристик многоуровневых ячеек (MLC) FeFET для реализации хранения 2 бит и выше
  4. Системная верификация: Полная оценка на системном уровне и тестирование на основе фреймворка NeuroSim
  5. Повышение производительности: Трехкратное улучшение устойчивости к температуре по сравнению с существующими решениями, энергоэффективность 48,03 TOPS/W

Подробное описание методологии

Определение задачи

Разработать сверхмаломощный многобитный массив CiM, способный стабильно работать в широком диапазоне температур (0°C-85°C), поддерживающий операции MAC нейронных сетей при сохранении высокой точности и энергоэффективности.

Архитектура модели

Дизайн ячейки 2FeFET-1T

![Структура ячейки](на основе описания рисунка 2 из статьи)

Основные компоненты:

  • M1, M2: Два устройства FeFET, образующие структуру зажима
  • M3: Транзистор NMOS, служащий управлением выходом
  • Управляющие сигналы: WL1, WL2 (линии слова), DL (линия данных), BL (линия бита), SL (линия источника)

Принцип работы:

  1. Операция записи: Применение различных напряжений (±4V) через WL1 и WL2 для установки состояния FeFET
  2. Операция чтения: Управление напряжением WL для реализации операции MAC
  3. Температурная компенсация: Использование характеристик CTAT MOSFET и механизма обратной связи

Реализация многобитного хранения

  • Состояние '0': M2 в состоянии VTH1, M1 в состоянии VTH0
  • Состояние '1': M1 и M2 оба в состоянии VTH1 (конфигурация зажима)
  • Состояния '2' и выше: M1 в различных состояниях VTH, M2 отключен

Технические инновации

1. Структура зажима 2FeFET

При хранении состояния '1':
- M1 и M2 образуют делитель напряжения
- Напряжение промежуточного узла VS стабилизируется и зажимается
- Значительно снижается влияние температурного дрейфа

2. Механизм температурной компенсации CTAT

Формула тока утечки MOSFET в подпороговой области:

ID = I0 * exp(Vgs / (ξVT))
где VT = kT/q

Механизм обратной связи по температуре:

  • Повышение температуры → увеличение тока утечки M1 → повышение напряжения VS → увеличение выходного тока M3
  • Однако благодаря характеристикам CTAT увеличение тока подавляется, снижая колебания выхода

3. Дизайн на уровне массива

  • Структура 8 строк × несколько столбцов: Поддержка параллельных операций MAC
  • Flash ADC: Использование усилителя с чувствительностью к току для снижения задержки восприятия
  • Общий ADC: 8 столбцов совместно используют один 3-битный АЦП, балансируя площадь и производительность

Экспериментальная установка

Среда моделирования

  • SPICE моделирование: Использование модели Intel FinFET и компактной модели Preisach FeFET
  • Фреймворк NeuroSim: Модифицирован для поддержки подпорогового FeFET и температурных эффектов
  • Технологический узел: 45 нм
  • Напряжение питания: Подпороговой дизайн Vdd=0,8В, насыщенный дизайн Vdd=1,0В

Наборы данных

  • Нейронная сеть: Архитектура VGG-8
  • Набор данных: CIFAR-10
  • Структура сети: 6 сверточных слоев + 2 полносвязных слоя
  • Квантизация: Использование модели WAGE для аппаратной квантизации

Показатели оценки

  1. Устойчивость к температуре: Коэффициент допуска шума (NMR) и минимальное значение NMR
  2. Точность: Точность вывода нейронной сети
  3. Энергоэффективность: TOPS/W (триллионы операций в секунду на ватт)
  4. Площадь: Использование площади кристалла
  5. Пропускная способность: Скорость вычислений

Методы сравнения

  • 1FeFET-1R: Базовый дизайн с одиночным FeFET
  • 2T-1FeFET: Существующий устойчивый к температуре дизайн
  • Другие NVM: Технологии RRAM, PCM и т.д.

Результаты экспериментов

Основные результаты

Верификация устойчивости к температуре

  • 1-битный TReCiM: NMRmin = 0,291 (0-85°C), NMRmin = 2,6 (20-85°C)
  • Улучшение устойчивости к температуре: Трехкратное улучшение по сравнению с дизайном 1FeFET-1R
  • По сравнению с 2T-1FeFET: Улучшение в 1,06 раза

Производительность нейронной сети

ДизайнТочностьЭнергоэффективность (TOPS/W)Разрядность
TReCiM (1-bit)92,00%26,061
TReCiM (2-bit)91,31%48,032
2T-1FeFET~89,45%~21,01
1FeFET-1R (подпороговой)<85%~15,01

Абляционные эксперименты

Влияние технологических вариаций

  • Моделирование Монте-Карло: 500 прогонов, σVT = 54 мВ
  • Состояние '1': 100% точность, вариация только 3,89%
  • Состояние '2': Вариация 20,8%
  • Состояние '3': Вариация 17,1%

Анализ температурных характеристик

Температурная чувствительность различных состояний хранения:

  • Состояние '1': Температурный дрейф пренебрежимо мал (эффект зажима)
  • Состояние '2': Максимальное колебание 32,9%
  • Состояния '3' и выше: С понижением VTH температурная чувствительность снижается

Анализ примеров

В сети VGG-8 распределение весов:

  • Вес '0': 27,2%
  • Вес '1': 24,1%
  • Вес '2': 23,5%
  • Вес '3': 25,2%

Комбинированный коэффициент вариации составляет 13,9%, итоговая точность вывода достигает 91,31%.

Связанные работы

Развитие технологии CiM

  1. Технологии NVM: Применение ReRAM, PCM, FeFET и других в CiM
  2. Подпороговые вычисления: Снижение энергопотребления, но увеличение температурной чувствительности
  3. Устойчивые к температуре дизайны: Существующие решения в основном ориентированы на TCAM и простые структуры CiM

Современное состояние исследований FeFET

  1. Моделирование устройств: Модели NCFET, Preisach, Монте-Карло и другие
  2. Схемные приложения: Сосредоточены в основном на памяти и простых вычислительных ячейках
  3. Температурные эффекты: Немногие исследования сосредоточены на влиянии температуры на производительность FeFET

Преимущества данной работы

По сравнению с существующими работами, данная статья впервые реализует:

  • Устойчивый к температуре дизайн CiM с многобитным хранением
  • Системное моделирование и верификацию температурных эффектов
  • Полную оценку в приложениях нейронных сетей

Выводы и обсуждение

Основные выводы

  1. Техническая осуществимость: Структура 2FeFET-1T успешно реализует устойчивость к температуре и многобитное хранение
  2. Преимущества производительности: Значительное улучшение устойчивости к температуре при сохранении низкого энергопотребления
  3. Системная ценность: Верификация эффективности дизайна в приложениях реальных нейронных сетей

Ограничения

  1. Чувствительность некоторых состояний: Состояния хранения '2' и выше все еще имеют определенную температурную чувствительность
  2. Зависимость от технологии: Производительность зависит от зрелости технологии устройств FeFET
  3. Затраты на АЦП: Многобитный дизайн требует АЦП более высокой точности, увеличивая площадь и энергопотребление
  4. Диапазон температур: Хотя охватывает 0-85°C, производительность при экстремальных температурах все еще снижается

Направления будущих исследований

  1. Оптимизация устройств: Дальнейшая оптимизация характеристик устройств FeFET для снижения температурной чувствительности
  2. Улучшение схемы: Исследование устойчивых к температуре дизайнов с более высокой разрядностью
  3. Системная интеграция: Интеграция с датчиками температуры на кристалле для реализации динамической компенсации
  4. Расширение приложений: Верификация эффективности дизайна в большем количестве сценариев приложений ИИ

Глубокая оценка

Преимущества

  1. Высокая инновационность: Впервые предложен многобитный устойчивый к температуре дизайн FeFET CiM, технологический маршрут является новаторским
  2. Прочная теоретическая база: Механизм температурной компенсации на основе характеристик CTAT имеет прочную физическую основу
  3. Полная верификация: Полная цепь верификации от уровня устройства до системного уровня
  4. Практическая ценность: Доказана ценность дизайна в приложениях реальных нейронных сетей
  5. Отличная производительность: Энергоэффективность и точность достигают передовых уровней

Недостатки

  1. Ограниченная температурная компенсация: Для состояний хранения высокой разрядности эффект температурной компенсации ограничен
  2. Увеличенная сложность: Структура 2FeFET увеличивает сложность дизайна по сравнению с одиночным FeFET
  3. Требования к технологии: Высокие требования к согласованности устройств FeFET
  4. Масштабируемость: Производительность при больших размерах массива требует дальнейшей верификации

Влияние

  1. Академическая ценность: Предоставляет новый технологический путь для проектирования устойчивого к температуре CiM
  2. Промышленное значение: Имеет важное справочное значение для проектирования граничных ИИ-чипов
  3. Технологический прогресс: Продвигает развитие технологии FeFET в приложениях CiM

Применимые сценарии

  1. Граничный ИИ: Приложения граничного вывода, чувствительные к энергопотреблению
  2. Устройства IoT: Окружение интернета вещей с большими колебаниями температуры
  3. Мобильные вычисления: Мобильные устройства с экстремальными требованиями к энергоэффективности
  4. Промышленное управление: Промышленные приложения, требующие работы в широком диапазоне температур

Библиография

Статья цитирует 42 связанные работы, охватывающие технологию CiM, устройства FeFET, температурные эффекты, ускорители нейронных сетей и другие аспекты, обеспечивая прочную теоретическую основу для исследования. Ключевые цитируемые работы включают фреймворк NeuroSim, моделирование FeFET и связанные работы по дизайну CiM.


Общая оценка: Это высококачественная техническая статья, которая вносит важный вклад в область проектирования устойчивого к температуре CiM. Технологический маршрут статьи ясен, экспериментальная верификация полна, и она имеет важное значение для продвижения применения FeFET в ускорителях ИИ. Хотя в некоторых аспектах остается место для улучшения, в целом работа представляет важный прогресс в данной области.