2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic

TReCiM: Diseño de Compute-in-Memory Multibit 2FeFET-1T de Menor Potencia y Resiliente a la Temperatura

Información Básica

  • ID del Artículo: 2501.01052
  • Título: TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
  • Autores: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
  • Clasificación: cs.ET (Tecnologías Emergentes)
  • Fecha de Publicación: Enero de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2501.01052

Resumen

La computación en memoria (Compute-in-Memory, CiM) se presenta como una solución prometedora para abordar los desafíos de hardware en inteligencia artificial e Internet de las Cosas, particularmente para resolver el "cuello de botella de memoria". Mediante el uso de dispositivos de memoria no volátil (NVM) en estructuras de matriz cruzada, CiM puede acelerar eficientemente operaciones críticas en redes neuronales: las operaciones de multiplicación-acumulación (MAC). Entre diversos dispositivos NVM, los transistores de efecto de campo ferroeléctricas (FeFET) son particularmente adecuados para matrices CiM de potencia ultra baja debido a su compatibilidad CMOS, mecanismo de escritura/lectura impulsado por voltaje y alta relación ION/IOFF. La operación en subumbral de FeFET puede minimizar aún más el consumo de potencia, pero es susceptible a la deriva de temperatura que reduce la precisión computacional. Este artículo propone TReCiM, un diseño CiM multibit 2FeFET-1T de ultra baja potencia y resiliente a la temperatura, que ejecuta operaciones MAC de manera confiable en el rango de temperatura de 0°C a 85°C. Las pruebas de referencia utilizando el marco NeuroSim en la red neuronal VGG-8 y el conjunto de datos CIFAR-10 muestran que TReCiM alcanza una precisión del 91.31% considerando los efectos de la deriva de temperatura, mejorando en un 1.86% en comparación con la matriz CiM 1bit 2T-1FeFET existente. Además, el diseño logra una eficiencia energética de 48.03 TOPS/W a nivel de sistema, comparable con diseños existentes de tamaños de características tecnológicas más pequeños.

Antecedentes de Investigación y Motivación

Contexto del Problema

  1. Cuello de botella de memoria: La arquitectura tradicional de von Neumann enfrenta alto consumo de potencia y cuellos de botella de rendimiento debido a transferencias frecuentes de datos entre unidades de procesamiento y almacenamiento
  2. Demandas de IA en el borde: Las aplicaciones de IA e IoT requieren una gran cantidad de operaciones MAC con requisitos extremadamente altos de eficiencia energética
  3. Limitaciones de CiM existentes: Aunque la tecnología de computación en memoria resuelve el cuello de botella de memoria, los diseños existentes presentan deficiencias en resiliencia a la temperatura y almacenamiento multibit

Motivación de la Investigación

  1. Ventajas de FeFET: FeFET posee compatibilidad CMOS, bajo consumo de corriente de fuga, alta relación ION/IOFF y otras ventajas, adecuadas para aplicaciones de ultra baja potencia
  2. Operación en subumbral: La operación en la región de subumbral puede reducir significativamente el consumo de potencia, pero aumenta la sensibilidad a la temperatura
  3. Limitaciones de soluciones existentes:
    • Los diseños de resiliencia a la temperatura existentes funcionan mal en escalas de matriz grandes
    • Solo soportan almacenamiento de 1 bit, limitando la densidad de almacenamiento
    • El diseño 2T-1FeFET requiere tiempo de descarga adicional, aumentando la latencia

Contribuciones Principales

  1. Propuesta de la arquitectura TReCiM: Primer diseño CiM multibit 2FeFET-1T resiliente a la temperatura, soportando rango de temperatura 0°C-85°C
  2. Estructura de sujeción 2FeFET innovadora: Utiliza características de temperatura complementaria absoluta (CTAT) para implementar compensación de temperatura
  3. Capacidad de almacenamiento multibit: Aprovecha características de celdas multinivel (MLC) de FeFET para implementar almacenamiento de 2 bits o superior
  4. Verificación a nivel de sistema: Evaluación y pruebas de referencia completas a nivel de sistema basadas en el marco NeuroSim
  5. Mejora de rendimiento: Mejora de 3 veces en resiliencia a la temperatura en comparación con soluciones existentes, alcanzando eficiencia energética de 48.03 TOPS/W

Explicación Detallada del Método

Definición de la Tarea

Diseñar una matriz CiM multibit de ultra baja potencia que funcione de manera estable en un amplio rango de temperatura (0°C-85°C), soportando operaciones MAC de redes neuronales, manteniendo simultáneamente alta precisión y eficiencia energética.

Arquitectura del Modelo

Diseño de Celda 2FeFET-1T

![Estructura de Celda](Basado en la descripción de la Figura 2 del artículo)

Componentes principales:

  • M1, M2: Dos dispositivos FeFET, formando estructura de sujeción
  • M3: Transistor NMOS, actuando como control de salida
  • Señales de control: WL1, WL2 (líneas de palabra), DL (línea de datos), BL (línea de bit), SL (línea de fuente)

Principio de funcionamiento:

  1. Operación de escritura: Aplicar diferentes voltajes (±4V) a través de WL1 y WL2 para establecer el estado de FeFET
  2. Operación de lectura: Controlar voltaje WL para realizar operaciones MAC
  3. Compensación de temperatura: Utilizar características CTAT de MOSFET y mecanismo de retroalimentación

Implementación de Almacenamiento Multibit

  • Estado '0': M2 en estado VTH1, M1 en estado VTH0
  • Estado '1': M1 y M2 ambos en estado VTH1 (configuración de sujeción)
  • Estado '2' y superior: M1 en diferentes estados VTH, M2 apagado

Puntos de Innovación Técnica

1. Estructura de Sujeción 2FeFET

Cuando el estado de almacenamiento es '1':
- M1 y M2 forman un divisor de voltaje
- El voltaje del nodo intermedio VS se estabiliza mediante sujeción
- Reduce significativamente los efectos de la deriva de temperatura

2. Mecanismo de Compensación de Temperatura CTAT

Fórmula de corriente de fuga de MOSFET en región de subumbral:

ID = I0 * exp(Vgs / (ξVT))
donde VT = kT/q

Mecanismo de retroalimentación de temperatura:

  • Aumento de temperatura → Aumento de corriente de fuga de M1 → Aumento de voltaje VS → Aumento de corriente de salida de M3
  • Pero debido a características CTAT, el incremento de corriente se suprime, reduciendo fluctuaciones de salida

3. Diseño a Nivel de Matriz

  • Estructura 8 filas × múltiples columnas: Soporta operaciones MAC paralelas
  • ADC tipo Flash: Utiliza amplificador de sensado de corriente para reducir latencia de sensado
  • ADC compartido: 8 columnas comparten un ADC de 3 bits, equilibrando área y rendimiento

Configuración Experimental

Entorno de Simulación

  • Simulación SPICE: Utilizando modelo Intel FinFET y modelo compacto FeFET Preisach
  • Marco NeuroSim: Modificado para soportar FeFET en subumbral y efectos de temperatura
  • Nodo de tecnología: Tecnología de 45nm
  • Voltaje de alimentación: Diseño en subumbral Vdd=0.8V, diseño en saturación Vdd=1.0V

Conjunto de Datos

  • Red neuronal: Arquitectura VGG-8
  • Conjunto de datos: CIFAR-10
  • Estructura de red: 6 capas convolucionales + 2 capas completamente conectadas
  • Cuantización: Utilizando modelo WAGE para cuantización de hardware

Indicadores de Evaluación

  1. Resiliencia a la temperatura: Tasa de margen de ruido (NMR) y valor NMR mínimo
  2. Precisión: Precisión de inferencia de red neuronal
  3. Eficiencia energética: TOPS/W (operaciones de billones por vatio)
  4. Área: Utilización de área de chip
  5. Rendimiento: Velocidad de operación

Métodos de Comparación

  • 1FeFET-1R: Diseño básico de FeFET único
  • 2T-1FeFET: Diseño de resiliencia a la temperatura existente
  • Otras tecnologías NVM: RRAM, PCM, etc.

Resultados Experimentales

Resultados Principales

Verificación de Resiliencia a la Temperatura

  • TReCiM de 1 bit: NMRmin = 0.291 (0-85°C), NMRmin = 2.6 (20-85°C)
  • Mejora de resiliencia a la temperatura: Mejora de 3 veces en comparación con diseño 1FeFET-1R
  • Comparado con 2T-1FeFET: Mejora de 1.06 veces

Rendimiento de Red Neuronal

Esquema de DiseñoPrecisiónEficiencia (TOPS/W)Ancho de Bit
TReCiM (1-bit)92.00%26.061
TReCiM (2-bit)91.31%48.032
2T-1FeFET~89.45%~21.01
1FeFET-1R (subumbral)<85%~15.01

Experimentos de Ablación

Impacto de Variabilidad de Proceso

  • Simulación de Monte Carlo: 500 ejecuciones, σVT = 54mV
  • Estado '1': Precisión del 100%, variabilidad solo 3.89%
  • Estado '2': Variabilidad 20.8%
  • Estado '3': Variabilidad 17.1%

Análisis de Características de Temperatura

Sensibilidad a la temperatura de diferentes estados de almacenamiento:

  • Estado '1': Deriva de temperatura despreciable (efecto de sujeción)
  • Estado '2': Fluctuación máxima 32.9%
  • Estado '3' y superior: Con disminución de VTH, sensibilidad a la temperatura se reduce

Análisis de Casos

En la red VGG-8, la distribución de pesos es:

  • Peso '0': 27.2%
  • Peso '1': 24.1%
  • Peso '2': 23.5%
  • Peso '3': 25.2%

La tasa de variabilidad combinada es 13.9%, alcanzando precisión de inferencia final del 91.31%.

Trabajo Relacionado

Desarrollo de Tecnología CiM

  1. Tecnologías NVM: Aplicaciones de ReRAM, PCM, FeFET en CiM
  2. Computación en subumbral: Reducción de potencia pero aumento de sensibilidad a la temperatura
  3. Diseño resiliente a la temperatura: Esquemas existentes principalmente enfocados en TCAM y estructuras CiM simples

Estado Actual de Investigación en FeFET

  1. Modelado de dispositivos: Modelos NCFET, Preisach, Monte Carlo, etc.
  2. Aplicaciones de circuitos: Principalmente concentradas en memoria y unidades de cálculo simples
  3. Efectos de temperatura: Pocas investigaciones abordan el impacto de la temperatura en el rendimiento de FeFET

Ventajas de Este Artículo

Comparado con trabajos existentes, este artículo implementa por primera vez:

  • Diseño CiM de almacenamiento multibit resiliente a la temperatura
  • Modelado y verificación de efectos de temperatura a nivel de sistema
  • Evaluación completa en aplicaciones de redes neuronales

Conclusiones y Discusión

Conclusiones Principales

  1. Viabilidad técnica: La estructura 2FeFET-1T implementa exitosamente resiliencia a la temperatura y almacenamiento multibit
  2. Ventajas de rendimiento: Mejora significativa de resiliencia a la temperatura mientras se mantiene bajo consumo de potencia
  3. Valor del sistema: Verifica la efectividad del diseño en aplicaciones de redes neuronales prácticas

Limitaciones

  1. Sensibilidad de estados parciales: Los estados de almacenamiento '2' y superior aún presentan cierta sensibilidad a la temperatura
  2. Dependencia de proceso: El rendimiento depende de la madurez del proceso de dispositivos FeFET
  3. Sobrecarga de ADC: El diseño multibit requiere ADC de mayor precisión, aumentando área y consumo de potencia
  4. Rango de temperatura: Aunque cubre 0-85°C, el rendimiento aún disminuye en temperaturas extremas

Direcciones Futuras

  1. Optimización de dispositivos: Optimizar aún más características de dispositivos FeFET para reducir sensibilidad a la temperatura
  2. Mejora de circuitos: Explorar diseños de resiliencia a la temperatura para almacenamiento de mayor ancho de bit
  3. Integración del sistema: Combinación con sensores de temperatura en chip para implementar compensación dinámica
  4. Extensión de aplicaciones: Verificar efectos de diseño en más escenarios de aplicaciones de IA

Evaluación Profunda

Fortalezas

  1. Alta innovación: Primer diseño FeFET CiM multibit resiliente a la temperatura, ruta técnica novedosa
  2. Teoría sólida: Mecanismo de compensación de temperatura basado en características CTAT con fundamento físico sólido
  3. Verificación suficiente: Cadena de verificación completa desde dispositivo a nivel de sistema
  4. Valor práctico: Demuestra valor de diseño en aplicaciones de redes neuronales prácticas
  5. Rendimiento excelente: Eficiencia energética y precisión alcanzan niveles avanzados

Deficiencias

  1. Compensación de temperatura limitada: Para estados de almacenamiento de alto bit, el efecto de compensación de temperatura es limitado
  2. Aumento de complejidad: La estructura 2FeFET aumenta la complejidad de diseño en comparación con FeFET único
  3. Requisitos de proceso: Requisitos relativamente altos para consistencia de dispositivos FeFET
  4. Escalabilidad: El rendimiento en escalas de matriz más grandes requiere verificación adicional

Impacto

  1. Valor académico: Proporciona nueva ruta técnica para diseño CiM resiliente a la temperatura
  2. Significado industrial: Tiene importante valor de referencia para diseño de chips de IA en el borde
  3. Impulso tecnológico: Promueve desarrollo tecnológico de FeFET en aplicaciones CiM

Escenarios Aplicables

  1. IA en el borde: Aplicaciones de inferencia sensibles a potencia en el borde
  2. Dispositivos IoT: Entornos de Internet de las Cosas con cambios de temperatura significativos
  3. Computación móvil: Dispositivos móviles con requisitos extremadamente altos de eficiencia energética
  4. Control industrial: Aplicaciones industriales que requieren funcionamiento en amplio rango de temperatura

Referencias

El artículo cita 42 referencias relacionadas, cubriendo tecnología CiM, dispositivos FeFET, efectos de temperatura, aceleradores de redes neuronales y otros aspectos múltiples, proporcionando base teórica sólida para la investigación. Las referencias clave incluyen marco NeuroSim, modelado de FeFET y trabajos de diseño CiM relacionados.


Evaluación General: Este es un artículo técnico de alta calidad que realiza contribuciones importantes en diseño CiM resiliente a la temperatura. La ruta técnica del artículo es clara, la verificación experimental es suficiente, y tiene importancia significativa para promover la aplicación de FeFET en aceleradores de IA. Aunque aún hay espacio para mejora en ciertos aspectos, en general representa un progreso importante en este campo.