2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, KÃ¤mpfe, Ni et al.

Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.

academic

TReCiM : Conception de Calcul-en-Mémoire Multibit 2FeFET-1T Résiliente à la Température et à Faible Puissance

Informations Fondamentales

ID de l'article : 2501.01052
Titre : TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
Auteurs : Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
Classification : cs.ET (Technologies Émergentes)
Date de publication : Janvier 2025
Lien de l'article : https://arxiv.org/abs/2501.01052

Résumé

Le calcul-en-mémoire (CiM) représente une solution prometteuse pour résoudre les défis matériels de l'intelligence artificielle et de l'Internet des objets, en particulier le problème du « mur mémoire ». En utilisant des dispositifs de mémoire non-volatile (NVM) dans des structures de matrices croisées, le CiM peut accélérer efficacement les opérations critiques des réseaux de neurones — les opérations de multiplication-accumulation (MAC). Parmi les différents dispositifs NVM, les transistors à effet de champ ferroélectriques (FeFET) sont particulièrement adaptés aux matrices CiM ultra-basse consommation en raison de leur compatibilité CMOS, de leurs mécanismes d'écriture/lecture commandés en tension et de leur excellent rapport ION/IOFF. L'exploitation de la région de fonctionnement sous-seuil des FeFET permet de minimiser davantage la consommation d'énergie, mais elle rend le système sensible aux dérives de température, ce qui dégrade la précision du calcul. Cet article propose TReCiM, une conception CiM multibit 2FeFET-1T ultra-basse consommation et résiliente à la température, capable d'exécuter de manière fiable les opérations MAC dans une plage de température de 0°C à 85°C. Les tests de référence utilisant le cadre NeuroSim sur le réseau de neurones VGG-8 et l'ensemble de données CIFAR-10 montrent que, en tenant compte des effets de dérive thermique, la matrice TReCiM atteint une précision de 91,31 %, soit une amélioration de 1,86 % par rapport aux matrices CiM 1-bit 2T-1FeFET existantes. De plus, cette conception atteint une efficacité énergétique de 48,03 TOPS/W au niveau du système, ce qui est comparable aux conceptions existantes utilisant des nœuds technologiques plus petits.

Contexte et Motivation de la Recherche

Contexte Problématique

Problème du mur mémoire : L'architecture de von Neumann traditionnelle fait face à des goulots d'étranglement de performance et à une consommation d'énergie élevée en raison des transferts de données fréquents entre les unités de traitement et les unités de stockage
Besoins de l'IA embarquée : Les applications d'IA et d'IoT nécessitent un grand nombre d'opérations MAC avec des exigences extrêmement élevées en matière d'efficacité énergétique
Limitations des conceptions CiM existantes : Bien que la technologie CiM puisse résoudre le problème du mur mémoire, les conceptions existantes présentent des lacunes en matière de résilience thermique et de stockage multibit

Motivation de la Recherche

Avantages des FeFET : Les FeFET possèdent des avantages tels que la compatibilité CMOS, les fuites faibles, un excellent rapport ION/IOFF, ce qui les rend adaptés aux applications ultra-basse consommation
Fonctionnement sous-seuil : L'exploitation de la région sous-seuil peut réduire considérablement la consommation d'énergie, mais augmente la sensibilité à la température
Limitations des solutions existantes :
- Les conceptions résilientes à la température existantes ne fonctionnent pas bien à grande échelle de matrice
- Elles ne supportent que le stockage 1-bit, ce qui limite la densité de stockage
- Les conceptions 2T-1FeFET nécessitent un temps de décharge supplémentaire, augmentant la latence

Contributions Principales

Architecture TReCiM proposée : Première conception CiM multibit 2FeFET-1T résiliente à la température, supportant une plage de température de 0°C à 85°C
Structure d'écrêtage 2FeFET innovante : Utilisation des caractéristiques de température absolue complémentaire (CTAT) pour la compensation thermique
Capacité de stockage multibit : Exploitation des caractéristiques de cellules multi-niveaux (MLC) des FeFET pour le stockage 2-bit et supérieur
Vérification au niveau du système : Évaluation complète au niveau du système et tests de référence basés sur le cadre NeuroSim
Amélioration des performances : Amélioration de 3 fois en matière de résilience thermique par rapport aux solutions existantes, avec une efficacité énergétique de 48,03 TOPS/W

Détails de la Méthode

Définition de la Tâche

Concevoir une matrice CiM multibit ultra-basse consommation capable de fonctionner de manière stable dans une large plage de température (0°C-85°C), supportant les opérations MAC des réseaux de neurones, tout en maintenant une haute précision et une efficacité énergétique.

Architecture du Modèle

Conception de la Cellule 2FeFET-1T

![Structure de la cellule](Basée sur la description de la figure 2 de l'article)

Composants principaux :

M1, M2 : Deux dispositifs FeFET formant une structure d'écrêtage
M3 : Transistor NMOS servant de contrôle de sortie
Signaux de contrôle : WL1, WL2 (lignes de mot), DL (ligne de données), BL (ligne de bit), SL (ligne de source)

Principe de fonctionnement :

Opération d'écriture : Application de tensions différentes (±4V) via WL1 et WL2 pour définir l'état du FeFET
Opération de lecture : Réalisation des opérations MAC par contrôle de la tension WL
Compensation thermique : Utilisation des caractéristiques CTAT du MOSFET et d'un mécanisme de rétroaction

Implémentation du Stockage Multibit

État '0' : M2 à l'état VTH1, M1 à l'état VTH0
État '1' : M1 et M2 tous deux à l'état VTH1 (configuration d'écrêtage)
État '2' et supérieur : M1 à différents états VTH, M2 désactivé

Points d'Innovation Technique

1. Structure d'Écrêtage 2FeFET

Lorsque l'état de stockage est '1' :
- M1 et M2 forment un diviseur de tension
- La tension du nœud intermédiaire VS est stabilisée et écrêtée
- Réduction significative de l'impact de la dérive thermique

2. Mécanisme de Compensation Thermique CTAT

Formule du courant de fuite MOSFET en région sous-seuil :

ID = I0 * exp(Vgs / (ξVT))
où VT = kT/q

Mécanisme de rétroaction thermique :

Augmentation de la température → Augmentation du courant de fuite de M1 → Augmentation de la tension VS → Augmentation du courant de sortie de M3
Cependant, en raison de la caractéristique CTAT, l'ampleur de l'augmentation du courant est supprimée, réduisant les fluctuations de sortie

3. Conception au Niveau de la Matrice

Structure 8 lignes × colonnes multiples : Support du calcul MAC parallèle
ADC Flash : Utilisation d'amplificateurs de détection de courant pour réduire la latence de détection
ADC partagé : 8 colonnes partageant un ADC 3-bit, équilibrant surface et performance

Configuration Expérimentale

Environnement de Simulation

Simulation SPICE : Utilisation du modèle Intel FinFET et du modèle compact FeFET de Preisach
Cadre NeuroSim : Modification pour supporter les FeFET sous-seuil et les effets thermiques
Nœud technologique : Nœud technologique 45nm
Tension d'alimentation : Conception sous-seuil Vdd=0,8V, conception en saturation Vdd=1,0V

Ensemble de Données

Réseau de neurones : Architecture VGG-8
Ensemble de données : CIFAR-10
Structure du réseau : 6 couches de convolution + 2 couches entièrement connectées
Quantification : Utilisation du modèle WAGE pour la quantification matérielle

Indicateurs d'Évaluation

Résilience thermique : Taux de marge de bruit (NMR) et valeur NMR minimale
Précision : Précision d'inférence du réseau de neurones
Efficacité énergétique : TOPS/W (opérations de billions par watt)
Surface : Utilisation de la surface de la puce
Débit : Vitesse de calcul

Méthodes de Comparaison

1FeFET-1R : Conception de base avec un seul FeFET
2T-1FeFET : Conception résiliente à la température existante
Autres NVM : Technologies RRAM, PCM, etc.

Résultats Expérimentaux

Résultats Principaux

Vérification de la Résilience Thermique

TReCiM 1-bit : NMRmin = 0,291 (0-85°C), NMRmin = 2,6 (20-85°C)
Amélioration de la résilience thermique : Amélioration de 3 fois par rapport à la conception 1FeFET-1R
Par rapport à 2T-1FeFET : Amélioration de 1,06 fois

Performance du Réseau de Neurones

Schéma de conception	Précision	Efficacité énergétique (TOPS/W)	Largeur de bit
TReCiM (1-bit)	92,00%	26,06	1
TReCiM (2-bit)	91,31%	48,03	2
2T-1FeFET	~89,45%	~21,0	1
1FeFET-1R (sous-seuil)	<85%	~15,0	1

Expériences d'Ablation

Impact des Variations de Procédé

Simulation de Monte-Carlo : 500 exécutions, σVT = 54mV
État '1' : Précision de 100 %, variation de seulement 3,89 %
État '2' : Variation de 20,8 %
État '3' : Variation de 17,1 %

Analyse des Caractéristiques Thermiques

Sensibilité thermique des différents états de stockage :

État '1' : Dérive thermique négligeable (effet d'écrêtage)
État '2' : Fluctuation maximale de 32,9 %
État '3' et supérieur : Avec la diminution de VTH, la sensibilité thermique diminue

Étude de Cas

Dans le réseau VGG-8, la distribution des poids est :

Poids '0' : 27,2 %
Poids '1' : 24,1 %
Poids '2' : 23,5 %
Poids '3' : 25,2 %

Le taux de variation combiné est de 13,9 %, et la précision d'inférence finale atteint 91,31 %.

Travaux Connexes

Développement de la Technologie CiM

Technologie NVM : Applications de ReRAM, PCM, FeFET dans le CiM
Calcul sous-seuil : Réduction de la consommation d'énergie mais augmentation de la sensibilité à la température
Conception résiliente à la température : Les solutions existantes se concentrent principalement sur les TCAM et les structures CiM simples

État Actuel de la Recherche sur les FeFET

Modélisation des dispositifs : Modèles NCFET, Preisach, Monte-Carlo, etc.
Applications de circuits : Principalement concentrées sur les mémoires et les unités de calcul simples
Effets thermiques : Peu d'études se concentrent sur l'impact de la température sur les performances des FeFET

Avantages de cet Article

Par rapport aux travaux existants, cet article réalise pour la première fois :

Une conception CiM multibit résiliente à la température avec des FeFET
Une modélisation et une vérification des effets thermiques au niveau du système
Une évaluation complète dans les applications de réseaux de neurones

Conclusion et Discussion

Conclusions Principales

Faisabilité technique : La structure 2FeFET-1T réalise avec succès la résilience thermique et le stockage multibit
Avantages de performance : Amélioration significative de la résilience thermique tout en maintenant une faible consommation d'énergie
Valeur système : Vérification de l'efficacité de la conception dans les applications de réseaux de neurones pratiques

Limitations

Sensibilité de certains états : Les états de stockage '2' et supérieur présentent encore une certaine sensibilité à la température
Dépendance au procédé : Les performances dépendent de la maturité du procédé des dispositifs FeFET
Surcharge ADC : Les conceptions multibit nécessitent des ADC de plus haute précision, augmentant la surface et la consommation d'énergie
Plage de température : Bien que couvrant 0-85°C, les performances diminuent toujours aux températures extrêmes

Directions Futures

Optimisation des dispositifs : Optimisation supplémentaire des caractéristiques des dispositifs FeFET pour réduire la sensibilité à la température
Amélioration des circuits : Exploration de conceptions CiM résilientes à la température avec une largeur de bit plus élevée
Intégration système : Combinaison avec des capteurs de température sur puce pour une compensation dynamique
Extension d'application : Vérification de l'efficacité de la conception dans plus de scénarios d'application d'IA

Évaluation Approfondie

Points Forts

Forte innovativité : Première conception CiM FeFET multibit résiliente à la température, approche technique novatrice
Théorie solide : Le mécanisme de compensation thermique basé sur les caractéristiques CTAT repose sur une base physique solide
Vérification complète : Chaîne de vérification complète du niveau des dispositifs au niveau du système
Valeur pratique : Démonstration de la valeur de la conception dans les applications de réseaux de neurones pratiques
Performance excellente : Efficacité énergétique et précision atteignant des niveaux avancés

Insuffisances

Compensation thermique limitée : Pour les états de stockage à bit élevé, l'effet de la compensation thermique est limité
Augmentation de la complexité : La structure 2FeFET augmente la complexité de conception par rapport aux FeFET simples
Exigences de procédé : Exigences élevées pour la cohérence des dispositifs FeFET
Extensibilité : Les performances à plus grande échelle de matrice nécessitent une vérification supplémentaire

Impact

Valeur académique : Fournit une nouvelle voie technologique pour la conception CiM résiliente à la température
Signification industrielle : Valeur de référence importante pour la conception de puces d'IA embarquée
Promotion technologique : Favorise le développement technologique des FeFET dans les applications CiM

Scénarios d'Application

IA embarquée : Applications d'inférence embarquée sensibles à la consommation d'énergie
Dispositifs IoT : Environnements IoT avec des variations de température importantes
Calcul mobile : Dispositifs mobiles avec des exigences extrêmement élevées en matière d'efficacité énergétique
Contrôle industriel : Applications industrielles nécessitant un fonctionnement dans une large plage de température

Références

L'article cite 42 références connexes, couvrant la technologie CiM, les dispositifs FeFET, les effets thermiques, les accélérateurs de réseaux de neurones et d'autres domaines, fournissant une base théorique solide pour la recherche. Les références clés incluent le cadre NeuroSim, la modélisation des FeFET et les travaux de conception CiM connexes.

Évaluation Globale : Cet article est un travail technique de haute qualité qui apporte des contributions importantes à la conception CiM résiliente à la température. La ligne technique est claire, la vérification expérimentale est complète, et elle a une importance significative pour promouvoir l'application des FeFET dans les accélérateurs d'IA. Bien qu'il y ait encore des domaines d'amélioration, dans l'ensemble, il représente un progrès important dans ce domaine.