2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, KÃ¤mpfe, Ni et al.

Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.

academic

TReCiM: Маломощный и устойчивый к температуре многобитный дизайн вычислений в памяти 2FeFET-1T

Основная информация

ID статьи: 2501.01052
Название: TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
Авторы: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
Классификация: cs.ET (Развивающиеся технологии)
Дата публикации: Январь 2025
Ссылка на статью: https://arxiv.org/abs/2501.01052

Аннотация

Вычисления в памяти (Compute-in-Memory, CiM) представляют собой перспективное решение для преодоления аппаратных вызовов в области искусственного интеллекта и интернета вещей, особенно для решения проблемы "стены памяти". Благодаря использованию устройств энергонезависимой памяти (NVM) в архитектуре кроссбара, CiM обеспечивает эффективное ускорение критических операций в нейронных сетях — операций умножения-накопления (MAC). Среди различных устройств NVM транзисторы с сегнетоэлектрическим эффектом (FeFET) особенно хорошо подходят для сверхмаломощных массивов CiM благодаря совместимости с КМОП, механизму записи/чтения, управляемому напряжением, и высокому отношению ION/IOFF. Работа FeFET в подпороговом режиме может дополнительно минимизировать потребление энергии, однако она подвержена дрейфу температуры, что приводит к снижению точности вычислений. В данной работе предлагается TReCiM — сверхмаломощный, устойчивый к температуре многобитный дизайн CiM на основе 2FeFET-1T, обеспечивающий надежное выполнение операций MAC в диапазоне температур от 0°C до 85°C. Тестирование на основе фреймворка NeuroSim на нейронной сети VGG-8 и наборе данных CIFAR-10 показывает, что с учетом влияния температурного дрейфа массив TReCiM достигает точности 91,31%, что на 1,86% выше, чем существующие одноразрядные массивы CiM типа 2T-1FeFET. Кроме того, дизайн достигает энергоэффективности 48,03 TOPS/W на системном уровне, что сопоставимо с существующими дизайнами с меньшими технологическими нормами.

Исследовательский контекст и мотивация

Проблемный контекст

Проблема стены памяти: Традиционная архитектура фон Неймана сталкивается с высоким энергопотреблением и узкими местами производительности из-за частой передачи данных между процессорными и запоминающими устройствами
Требования граничного ИИ: Приложения ИИ и IoT требуют большого количества операций MAC с экстремальными требованиями к энергоэффективности
Ограничения существующих CiM: Хотя технология вычислений в памяти решает проблему стены памяти, существующие дизайны имеют недостатки в устойчивости к температуре и многобитном хранении

Исследовательская мотивация

Преимущества FeFET: FeFET обладает совместимостью с КМОП, низким током утечки, высоким отношением ION/IOFF и другими преимуществами, подходящими для сверхмаломощных приложений
Подпороговая работа: Работа в подпороговой области может значительно снизить потребление энергии, но увеличивает температурную чувствительность
Ограничения существующих решений:
- Существующие устойчивые к температуре дизайны плохо работают при больших размерах массива
- Поддерживают только одноразрядное хранение, что ограничивает плотность хранения
- Дизайны 2T-1FeFET требуют дополнительного времени разряда, увеличивая задержку

Основные вклады

Предложена архитектура TReCiM: Первый устойчивый к температуре многобитный дизайн CiM типа 2FeFET-1T, поддерживающий диапазон температур 0°C-85°C
Инновационная структура зажима 2FeFET: Использование дополнительных характеристик абсолютной температуры (CTAT) для реализации температурной компенсации
Возможность многобитного хранения: Использование характеристик многоуровневых ячеек (MLC) FeFET для реализации хранения 2 бит и выше
Системная верификация: Полная оценка на системном уровне и тестирование на основе фреймворка NeuroSim
Повышение производительности: Трехкратное улучшение устойчивости к температуре по сравнению с существующими решениями, энергоэффективность 48,03 TOPS/W

Подробное описание методологии

Определение задачи

Разработать сверхмаломощный многобитный массив CiM, способный стабильно работать в широком диапазоне температур (0°C-85°C), поддерживающий операции MAC нейронных сетей при сохранении высокой точности и энергоэффективности.

Архитектура модели

Дизайн ячейки 2FeFET-1T

![Структура ячейки](на основе описания рисунка 2 из статьи)

Основные компоненты:

M1, M2: Два устройства FeFET, образующие структуру зажима
M3: Транзистор NMOS, служащий управлением выходом
Управляющие сигналы: WL1, WL2 (линии слова), DL (линия данных), BL (линия бита), SL (линия источника)

Принцип работы:

Операция записи: Применение различных напряжений (±4V) через WL1 и WL2 для установки состояния FeFET
Операция чтения: Управление напряжением WL для реализации операции MAC
Температурная компенсация: Использование характеристик CTAT MOSFET и механизма обратной связи

Реализация многобитного хранения

Состояние '0': M2 в состоянии VTH1, M1 в состоянии VTH0
Состояние '1': M1 и M2 оба в состоянии VTH1 (конфигурация зажима)
Состояния '2' и выше: M1 в различных состояниях VTH, M2 отключен

Технические инновации

1. Структура зажима 2FeFET

При хранении состояния '1':
- M1 и M2 образуют делитель напряжения
- Напряжение промежуточного узла VS стабилизируется и зажимается
- Значительно снижается влияние температурного дрейфа

2. Механизм температурной компенсации CTAT

Формула тока утечки MOSFET в подпороговой области:

ID = I0 * exp(Vgs / (ξVT))
где VT = kT/q

Механизм обратной связи по температуре:

Повышение температуры → увеличение тока утечки M1 → повышение напряжения VS → увеличение выходного тока M3
Однако благодаря характеристикам CTAT увеличение тока подавляется, снижая колебания выхода

3. Дизайн на уровне массива

Структура 8 строк × несколько столбцов: Поддержка параллельных операций MAC
Flash ADC: Использование усилителя с чувствительностью к току для снижения задержки восприятия
Общий ADC: 8 столбцов совместно используют один 3-битный АЦП, балансируя площадь и производительность

Экспериментальная установка

Среда моделирования

SPICE моделирование: Использование модели Intel FinFET и компактной модели Preisach FeFET
Фреймворк NeuroSim: Модифицирован для поддержки подпорогового FeFET и температурных эффектов
Технологический узел: 45 нм
Напряжение питания: Подпороговой дизайн Vdd=0,8В, насыщенный дизайн Vdd=1,0В

Наборы данных

Нейронная сеть: Архитектура VGG-8
Набор данных: CIFAR-10
Структура сети: 6 сверточных слоев + 2 полносвязных слоя
Квантизация: Использование модели WAGE для аппаратной квантизации

Показатели оценки

Устойчивость к температуре: Коэффициент допуска шума (NMR) и минимальное значение NMR
Точность: Точность вывода нейронной сети
Энергоэффективность: TOPS/W (триллионы операций в секунду на ватт)
Площадь: Использование площади кристалла
Пропускная способность: Скорость вычислений

Методы сравнения

1FeFET-1R: Базовый дизайн с одиночным FeFET
2T-1FeFET: Существующий устойчивый к температуре дизайн
Другие NVM: Технологии RRAM, PCM и т.д.

Результаты экспериментов

Основные результаты

Верификация устойчивости к температуре

1-битный TReCiM: NMRmin = 0,291 (0-85°C), NMRmin = 2,6 (20-85°C)
Улучшение устойчивости к температуре: Трехкратное улучшение по сравнению с дизайном 1FeFET-1R
По сравнению с 2T-1FeFET: Улучшение в 1,06 раза

Производительность нейронной сети

Дизайн	Точность	Энергоэффективность (TOPS/W)	Разрядность
TReCiM (1-bit)	92,00%	26,06	1
TReCiM (2-bit)	91,31%	48,03	2
2T-1FeFET	~89,45%	~21,0	1
1FeFET-1R (подпороговой)	<85%	~15,0	1

Абляционные эксперименты

Влияние технологических вариаций

Моделирование Монте-Карло: 500 прогонов, σVT = 54 мВ
Состояние '1': 100% точность, вариация только 3,89%
Состояние '2': Вариация 20,8%
Состояние '3': Вариация 17,1%

Анализ температурных характеристик

Температурная чувствительность различных состояний хранения:

Состояние '1': Температурный дрейф пренебрежимо мал (эффект зажима)
Состояние '2': Максимальное колебание 32,9%
Состояния '3' и выше: С понижением VTH температурная чувствительность снижается

Анализ примеров

В сети VGG-8 распределение весов:

Вес '0': 27,2%
Вес '1': 24,1%
Вес '2': 23,5%
Вес '3': 25,2%

Комбинированный коэффициент вариации составляет 13,9%, итоговая точность вывода достигает 91,31%.

Связанные работы

Развитие технологии CiM

Технологии NVM: Применение ReRAM, PCM, FeFET и других в CiM
Подпороговые вычисления: Снижение энергопотребления, но увеличение температурной чувствительности
Устойчивые к температуре дизайны: Существующие решения в основном ориентированы на TCAM и простые структуры CiM

Современное состояние исследований FeFET

Моделирование устройств: Модели NCFET, Preisach, Монте-Карло и другие
Схемные приложения: Сосредоточены в основном на памяти и простых вычислительных ячейках
Температурные эффекты: Немногие исследования сосредоточены на влиянии температуры на производительность FeFET

Преимущества данной работы

По сравнению с существующими работами, данная статья впервые реализует:

Устойчивый к температуре дизайн CiM с многобитным хранением
Системное моделирование и верификацию температурных эффектов
Полную оценку в приложениях нейронных сетей

Выводы и обсуждение

Основные выводы

Техническая осуществимость: Структура 2FeFET-1T успешно реализует устойчивость к температуре и многобитное хранение
Преимущества производительности: Значительное улучшение устойчивости к температуре при сохранении низкого энергопотребления
Системная ценность: Верификация эффективности дизайна в приложениях реальных нейронных сетей

Ограничения

Чувствительность некоторых состояний: Состояния хранения '2' и выше все еще имеют определенную температурную чувствительность
Зависимость от технологии: Производительность зависит от зрелости технологии устройств FeFET
Затраты на АЦП: Многобитный дизайн требует АЦП более высокой точности, увеличивая площадь и энергопотребление
Диапазон температур: Хотя охватывает 0-85°C, производительность при экстремальных температурах все еще снижается

Направления будущих исследований

Оптимизация устройств: Дальнейшая оптимизация характеристик устройств FeFET для снижения температурной чувствительности
Улучшение схемы: Исследование устойчивых к температуре дизайнов с более высокой разрядностью
Системная интеграция: Интеграция с датчиками температуры на кристалле для реализации динамической компенсации
Расширение приложений: Верификация эффективности дизайна в большем количестве сценариев приложений ИИ

Глубокая оценка

Преимущества

Высокая инновационность: Впервые предложен многобитный устойчивый к температуре дизайн FeFET CiM, технологический маршрут является новаторским
Прочная теоретическая база: Механизм температурной компенсации на основе характеристик CTAT имеет прочную физическую основу
Полная верификация: Полная цепь верификации от уровня устройства до системного уровня
Практическая ценность: Доказана ценность дизайна в приложениях реальных нейронных сетей
Отличная производительность: Энергоэффективность и точность достигают передовых уровней

Недостатки

Ограниченная температурная компенсация: Для состояний хранения высокой разрядности эффект температурной компенсации ограничен
Увеличенная сложность: Структура 2FeFET увеличивает сложность дизайна по сравнению с одиночным FeFET
Требования к технологии: Высокие требования к согласованности устройств FeFET
Масштабируемость: Производительность при больших размерах массива требует дальнейшей верификации

Влияние

Академическая ценность: Предоставляет новый технологический путь для проектирования устойчивого к температуре CiM
Промышленное значение: Имеет важное справочное значение для проектирования граничных ИИ-чипов
Технологический прогресс: Продвигает развитие технологии FeFET в приложениях CiM

Применимые сценарии

Граничный ИИ: Приложения граничного вывода, чувствительные к энергопотреблению
Устройства IoT: Окружение интернета вещей с большими колебаниями температуры
Мобильные вычисления: Мобильные устройства с экстремальными требованиями к энергоэффективности
Промышленное управление: Промышленные приложения, требующие работы в широком диапазоне температур

Библиография

Статья цитирует 42 связанные работы, охватывающие технологию CiM, устройства FeFET, температурные эффекты, ускорители нейронных сетей и другие аспекты, обеспечивая прочную теоретическую основу для исследования. Ключевые цитируемые работы включают фреймворк NeuroSim, моделирование FeFET и связанные работы по дизайну CiM.

Общая оценка: Это высококачественная техническая статья, которая вносит важный вклад в область проектирования устойчивого к температуре CiM. Технологический маршрут статьи ясен, экспериментальная верификация полна, и она имеет важное значение для продвижения применения FeFET в ускорителях ИИ. Хотя в некоторых аспектах остается место для улучшения, в целом работа представляет важный прогресс в данной области.