TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic
TReCiM: Маломощный и устойчивый к температуре многобитный дизайн вычислений в памяти 2FeFET-1T
Вычисления в памяти (Compute-in-Memory, CiM) представляют собой перспективное решение для преодоления аппаратных вызовов в области искусственного интеллекта и интернета вещей, особенно для решения проблемы "стены памяти". Благодаря использованию устройств энергонезависимой памяти (NVM) в архитектуре кроссбара, CiM обеспечивает эффективное ускорение критических операций в нейронных сетях — операций умножения-накопления (MAC). Среди различных устройств NVM транзисторы с сегнетоэлектрическим эффектом (FeFET) особенно хорошо подходят для сверхмаломощных массивов CiM благодаря совместимости с КМОП, механизму записи/чтения, управляемому напряжением, и высокому отношению ION/IOFF. Работа FeFET в подпороговом режиме может дополнительно минимизировать потребление энергии, однако она подвержена дрейфу температуры, что приводит к снижению точности вычислений. В данной работе предлагается TReCiM — сверхмаломощный, устойчивый к температуре многобитный дизайн CiM на основе 2FeFET-1T, обеспечивающий надежное выполнение операций MAC в диапазоне температур от 0°C до 85°C. Тестирование на основе фреймворка NeuroSim на нейронной сети VGG-8 и наборе данных CIFAR-10 показывает, что с учетом влияния температурного дрейфа массив TReCiM достигает точности 91,31%, что на 1,86% выше, чем существующие одноразрядные массивы CiM типа 2T-1FeFET. Кроме того, дизайн достигает энергоэффективности 48,03 TOPS/W на системном уровне, что сопоставимо с существующими дизайнами с меньшими технологическими нормами.
Проблема стены памяти: Традиционная архитектура фон Неймана сталкивается с высоким энергопотреблением и узкими местами производительности из-за частой передачи данных между процессорными и запоминающими устройствами
Требования граничного ИИ: Приложения ИИ и IoT требуют большого количества операций MAC с экстремальными требованиями к энергоэффективности
Ограничения существующих CiM: Хотя технология вычислений в памяти решает проблему стены памяти, существующие дизайны имеют недостатки в устойчивости к температуре и многобитном хранении
Преимущества FeFET: FeFET обладает совместимостью с КМОП, низким током утечки, высоким отношением ION/IOFF и другими преимуществами, подходящими для сверхмаломощных приложений
Подпороговая работа: Работа в подпороговой области может значительно снизить потребление энергии, но увеличивает температурную чувствительность
Ограничения существующих решений:
Существующие устойчивые к температуре дизайны плохо работают при больших размерах массива
Поддерживают только одноразрядное хранение, что ограничивает плотность хранения
Дизайны 2T-1FeFET требуют дополнительного времени разряда, увеличивая задержку
Предложена архитектура TReCiM: Первый устойчивый к температуре многобитный дизайн CiM типа 2FeFET-1T, поддерживающий диапазон температур 0°C-85°C
Инновационная структура зажима 2FeFET: Использование дополнительных характеристик абсолютной температуры (CTAT) для реализации температурной компенсации
Возможность многобитного хранения: Использование характеристик многоуровневых ячеек (MLC) FeFET для реализации хранения 2 бит и выше
Системная верификация: Полная оценка на системном уровне и тестирование на основе фреймворка NeuroSim
Повышение производительности: Трехкратное улучшение устойчивости к температуре по сравнению с существующими решениями, энергоэффективность 48,03 TOPS/W
Разработать сверхмаломощный многобитный массив CiM, способный стабильно работать в широком диапазоне температур (0°C-85°C), поддерживающий операции MAC нейронных сетей при сохранении высокой точности и энергоэффективности.
При хранении состояния '1':
- M1 и M2 образуют делитель напряжения
- Напряжение промежуточного узла VS стабилизируется и зажимается
- Значительно снижается влияние температурного дрейфа
Статья цитирует 42 связанные работы, охватывающие технологию CiM, устройства FeFET, температурные эффекты, ускорители нейронных сетей и другие аспекты, обеспечивая прочную теоретическую основу для исследования. Ключевые цитируемые работы включают фреймворк NeuroSim, моделирование FeFET и связанные работы по дизайну CiM.
Общая оценка: Это высококачественная техническая статья, которая вносит важный вклад в область проектирования устойчивого к температуре CiM. Технологический маршрут статьи ясен, экспериментальная верификация полна, и она имеет важное значение для продвижения применения FeFET в ускорителях ИИ. Хотя в некоторых аспектах остается место для улучшения, в целом работа представляет важный прогресс в данной области.