TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic
TReCiM: Diseño de Compute-in-Memory Multibit 2FeFET-1T de Menor Potencia y Resiliente a la Temperatura
La computación en memoria (Compute-in-Memory, CiM) se presenta como una solución prometedora para abordar los desafíos de hardware en inteligencia artificial e Internet de las Cosas, particularmente para resolver el "cuello de botella de memoria". Mediante el uso de dispositivos de memoria no volátil (NVM) en estructuras de matriz cruzada, CiM puede acelerar eficientemente operaciones críticas en redes neuronales: las operaciones de multiplicación-acumulación (MAC). Entre diversos dispositivos NVM, los transistores de efecto de campo ferroeléctricas (FeFET) son particularmente adecuados para matrices CiM de potencia ultra baja debido a su compatibilidad CMOS, mecanismo de escritura/lectura impulsado por voltaje y alta relación ION/IOFF. La operación en subumbral de FeFET puede minimizar aún más el consumo de potencia, pero es susceptible a la deriva de temperatura que reduce la precisión computacional. Este artículo propone TReCiM, un diseño CiM multibit 2FeFET-1T de ultra baja potencia y resiliente a la temperatura, que ejecuta operaciones MAC de manera confiable en el rango de temperatura de 0°C a 85°C. Las pruebas de referencia utilizando el marco NeuroSim en la red neuronal VGG-8 y el conjunto de datos CIFAR-10 muestran que TReCiM alcanza una precisión del 91.31% considerando los efectos de la deriva de temperatura, mejorando en un 1.86% en comparación con la matriz CiM 1bit 2T-1FeFET existente. Además, el diseño logra una eficiencia energética de 48.03 TOPS/W a nivel de sistema, comparable con diseños existentes de tamaños de características tecnológicas más pequeños.
Cuello de botella de memoria: La arquitectura tradicional de von Neumann enfrenta alto consumo de potencia y cuellos de botella de rendimiento debido a transferencias frecuentes de datos entre unidades de procesamiento y almacenamiento
Demandas de IA en el borde: Las aplicaciones de IA e IoT requieren una gran cantidad de operaciones MAC con requisitos extremadamente altos de eficiencia energética
Limitaciones de CiM existentes: Aunque la tecnología de computación en memoria resuelve el cuello de botella de memoria, los diseños existentes presentan deficiencias en resiliencia a la temperatura y almacenamiento multibit
Ventajas de FeFET: FeFET posee compatibilidad CMOS, bajo consumo de corriente de fuga, alta relación ION/IOFF y otras ventajas, adecuadas para aplicaciones de ultra baja potencia
Operación en subumbral: La operación en la región de subumbral puede reducir significativamente el consumo de potencia, pero aumenta la sensibilidad a la temperatura
Limitaciones de soluciones existentes:
Los diseños de resiliencia a la temperatura existentes funcionan mal en escalas de matriz grandes
Solo soportan almacenamiento de 1 bit, limitando la densidad de almacenamiento
El diseño 2T-1FeFET requiere tiempo de descarga adicional, aumentando la latencia
Propuesta de la arquitectura TReCiM: Primer diseño CiM multibit 2FeFET-1T resiliente a la temperatura, soportando rango de temperatura 0°C-85°C
Estructura de sujeción 2FeFET innovadora: Utiliza características de temperatura complementaria absoluta (CTAT) para implementar compensación de temperatura
Capacidad de almacenamiento multibit: Aprovecha características de celdas multinivel (MLC) de FeFET para implementar almacenamiento de 2 bits o superior
Verificación a nivel de sistema: Evaluación y pruebas de referencia completas a nivel de sistema basadas en el marco NeuroSim
Mejora de rendimiento: Mejora de 3 veces en resiliencia a la temperatura en comparación con soluciones existentes, alcanzando eficiencia energética de 48.03 TOPS/W
Diseñar una matriz CiM multibit de ultra baja potencia que funcione de manera estable en un amplio rango de temperatura (0°C-85°C), soportando operaciones MAC de redes neuronales, manteniendo simultáneamente alta precisión y eficiencia energética.
Cuando el estado de almacenamiento es '1':
- M1 y M2 forman un divisor de voltaje
- El voltaje del nodo intermedio VS se estabiliza mediante sujeción
- Reduce significativamente los efectos de la deriva de temperatura
El artículo cita 42 referencias relacionadas, cubriendo tecnología CiM, dispositivos FeFET, efectos de temperatura, aceleradores de redes neuronales y otros aspectos múltiples, proporcionando base teórica sólida para la investigación. Las referencias clave incluyen marco NeuroSim, modelado de FeFET y trabajos de diseño CiM relacionados.
Evaluación General: Este es un artículo técnico de alta calidad que realiza contribuciones importantes en diseño CiM resiliente a la temperatura. La ruta técnica del artículo es clara, la verificación experimental es suficiente, y tiene importancia significativa para promover la aplicación de FeFET en aceleradores de IA. Aunque aún hay espacio para mejora en ciertos aspectos, en general representa un progreso importante en este campo.