2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic

TReCiM : Conception de Calcul-en-Mémoire Multibit 2FeFET-1T Résiliente à la Température et à Faible Puissance

Informations Fondamentales

  • ID de l'article : 2501.01052
  • Titre : TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
  • Auteurs : Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
  • Classification : cs.ET (Technologies Émergentes)
  • Date de publication : Janvier 2025
  • Lien de l'article : https://arxiv.org/abs/2501.01052

Résumé

Le calcul-en-mémoire (CiM) représente une solution prometteuse pour résoudre les défis matériels de l'intelligence artificielle et de l'Internet des objets, en particulier le problème du « mur mémoire ». En utilisant des dispositifs de mémoire non-volatile (NVM) dans des structures de matrices croisées, le CiM peut accélérer efficacement les opérations critiques des réseaux de neurones — les opérations de multiplication-accumulation (MAC). Parmi les différents dispositifs NVM, les transistors à effet de champ ferroélectriques (FeFET) sont particulièrement adaptés aux matrices CiM ultra-basse consommation en raison de leur compatibilité CMOS, de leurs mécanismes d'écriture/lecture commandés en tension et de leur excellent rapport ION/IOFF. L'exploitation de la région de fonctionnement sous-seuil des FeFET permet de minimiser davantage la consommation d'énergie, mais elle rend le système sensible aux dérives de température, ce qui dégrade la précision du calcul. Cet article propose TReCiM, une conception CiM multibit 2FeFET-1T ultra-basse consommation et résiliente à la température, capable d'exécuter de manière fiable les opérations MAC dans une plage de température de 0°C à 85°C. Les tests de référence utilisant le cadre NeuroSim sur le réseau de neurones VGG-8 et l'ensemble de données CIFAR-10 montrent que, en tenant compte des effets de dérive thermique, la matrice TReCiM atteint une précision de 91,31 %, soit une amélioration de 1,86 % par rapport aux matrices CiM 1-bit 2T-1FeFET existantes. De plus, cette conception atteint une efficacité énergétique de 48,03 TOPS/W au niveau du système, ce qui est comparable aux conceptions existantes utilisant des nœuds technologiques plus petits.

Contexte et Motivation de la Recherche

Contexte Problématique

  1. Problème du mur mémoire : L'architecture de von Neumann traditionnelle fait face à des goulots d'étranglement de performance et à une consommation d'énergie élevée en raison des transferts de données fréquents entre les unités de traitement et les unités de stockage
  2. Besoins de l'IA embarquée : Les applications d'IA et d'IoT nécessitent un grand nombre d'opérations MAC avec des exigences extrêmement élevées en matière d'efficacité énergétique
  3. Limitations des conceptions CiM existantes : Bien que la technologie CiM puisse résoudre le problème du mur mémoire, les conceptions existantes présentent des lacunes en matière de résilience thermique et de stockage multibit

Motivation de la Recherche

  1. Avantages des FeFET : Les FeFET possèdent des avantages tels que la compatibilité CMOS, les fuites faibles, un excellent rapport ION/IOFF, ce qui les rend adaptés aux applications ultra-basse consommation
  2. Fonctionnement sous-seuil : L'exploitation de la région sous-seuil peut réduire considérablement la consommation d'énergie, mais augmente la sensibilité à la température
  3. Limitations des solutions existantes :
    • Les conceptions résilientes à la température existantes ne fonctionnent pas bien à grande échelle de matrice
    • Elles ne supportent que le stockage 1-bit, ce qui limite la densité de stockage
    • Les conceptions 2T-1FeFET nécessitent un temps de décharge supplémentaire, augmentant la latence

Contributions Principales

  1. Architecture TReCiM proposée : Première conception CiM multibit 2FeFET-1T résiliente à la température, supportant une plage de température de 0°C à 85°C
  2. Structure d'écrêtage 2FeFET innovante : Utilisation des caractéristiques de température absolue complémentaire (CTAT) pour la compensation thermique
  3. Capacité de stockage multibit : Exploitation des caractéristiques de cellules multi-niveaux (MLC) des FeFET pour le stockage 2-bit et supérieur
  4. Vérification au niveau du système : Évaluation complète au niveau du système et tests de référence basés sur le cadre NeuroSim
  5. Amélioration des performances : Amélioration de 3 fois en matière de résilience thermique par rapport aux solutions existantes, avec une efficacité énergétique de 48,03 TOPS/W

Détails de la Méthode

Définition de la Tâche

Concevoir une matrice CiM multibit ultra-basse consommation capable de fonctionner de manière stable dans une large plage de température (0°C-85°C), supportant les opérations MAC des réseaux de neurones, tout en maintenant une haute précision et une efficacité énergétique.

Architecture du Modèle

Conception de la Cellule 2FeFET-1T

![Structure de la cellule](Basée sur la description de la figure 2 de l'article)

Composants principaux :

  • M1, M2 : Deux dispositifs FeFET formant une structure d'écrêtage
  • M3 : Transistor NMOS servant de contrôle de sortie
  • Signaux de contrôle : WL1, WL2 (lignes de mot), DL (ligne de données), BL (ligne de bit), SL (ligne de source)

Principe de fonctionnement :

  1. Opération d'écriture : Application de tensions différentes (±4V) via WL1 et WL2 pour définir l'état du FeFET
  2. Opération de lecture : Réalisation des opérations MAC par contrôle de la tension WL
  3. Compensation thermique : Utilisation des caractéristiques CTAT du MOSFET et d'un mécanisme de rétroaction

Implémentation du Stockage Multibit

  • État '0' : M2 à l'état VTH1, M1 à l'état VTH0
  • État '1' : M1 et M2 tous deux à l'état VTH1 (configuration d'écrêtage)
  • État '2' et supérieur : M1 à différents états VTH, M2 désactivé

Points d'Innovation Technique

1. Structure d'Écrêtage 2FeFET

Lorsque l'état de stockage est '1' :
- M1 et M2 forment un diviseur de tension
- La tension du nœud intermédiaire VS est stabilisée et écrêtée
- Réduction significative de l'impact de la dérive thermique

2. Mécanisme de Compensation Thermique CTAT

Formule du courant de fuite MOSFET en région sous-seuil :

ID = I0 * exp(Vgs / (ξVT))
où VT = kT/q

Mécanisme de rétroaction thermique :

  • Augmentation de la température → Augmentation du courant de fuite de M1 → Augmentation de la tension VS → Augmentation du courant de sortie de M3
  • Cependant, en raison de la caractéristique CTAT, l'ampleur de l'augmentation du courant est supprimée, réduisant les fluctuations de sortie

3. Conception au Niveau de la Matrice

  • Structure 8 lignes × colonnes multiples : Support du calcul MAC parallèle
  • ADC Flash : Utilisation d'amplificateurs de détection de courant pour réduire la latence de détection
  • ADC partagé : 8 colonnes partageant un ADC 3-bit, équilibrant surface et performance

Configuration Expérimentale

Environnement de Simulation

  • Simulation SPICE : Utilisation du modèle Intel FinFET et du modèle compact FeFET de Preisach
  • Cadre NeuroSim : Modification pour supporter les FeFET sous-seuil et les effets thermiques
  • Nœud technologique : Nœud technologique 45nm
  • Tension d'alimentation : Conception sous-seuil Vdd=0,8V, conception en saturation Vdd=1,0V

Ensemble de Données

  • Réseau de neurones : Architecture VGG-8
  • Ensemble de données : CIFAR-10
  • Structure du réseau : 6 couches de convolution + 2 couches entièrement connectées
  • Quantification : Utilisation du modèle WAGE pour la quantification matérielle

Indicateurs d'Évaluation

  1. Résilience thermique : Taux de marge de bruit (NMR) et valeur NMR minimale
  2. Précision : Précision d'inférence du réseau de neurones
  3. Efficacité énergétique : TOPS/W (opérations de billions par watt)
  4. Surface : Utilisation de la surface de la puce
  5. Débit : Vitesse de calcul

Méthodes de Comparaison

  • 1FeFET-1R : Conception de base avec un seul FeFET
  • 2T-1FeFET : Conception résiliente à la température existante
  • Autres NVM : Technologies RRAM, PCM, etc.

Résultats Expérimentaux

Résultats Principaux

Vérification de la Résilience Thermique

  • TReCiM 1-bit : NMRmin = 0,291 (0-85°C), NMRmin = 2,6 (20-85°C)
  • Amélioration de la résilience thermique : Amélioration de 3 fois par rapport à la conception 1FeFET-1R
  • Par rapport à 2T-1FeFET : Amélioration de 1,06 fois

Performance du Réseau de Neurones

Schéma de conceptionPrécisionEfficacité énergétique (TOPS/W)Largeur de bit
TReCiM (1-bit)92,00%26,061
TReCiM (2-bit)91,31%48,032
2T-1FeFET~89,45%~21,01
1FeFET-1R (sous-seuil)<85%~15,01

Expériences d'Ablation

Impact des Variations de Procédé

  • Simulation de Monte-Carlo : 500 exécutions, σVT = 54mV
  • État '1' : Précision de 100 %, variation de seulement 3,89 %
  • État '2' : Variation de 20,8 %
  • État '3' : Variation de 17,1 %

Analyse des Caractéristiques Thermiques

Sensibilité thermique des différents états de stockage :

  • État '1' : Dérive thermique négligeable (effet d'écrêtage)
  • État '2' : Fluctuation maximale de 32,9 %
  • État '3' et supérieur : Avec la diminution de VTH, la sensibilité thermique diminue

Étude de Cas

Dans le réseau VGG-8, la distribution des poids est :

  • Poids '0' : 27,2 %
  • Poids '1' : 24,1 %
  • Poids '2' : 23,5 %
  • Poids '3' : 25,2 %

Le taux de variation combiné est de 13,9 %, et la précision d'inférence finale atteint 91,31 %.

Travaux Connexes

Développement de la Technologie CiM

  1. Technologie NVM : Applications de ReRAM, PCM, FeFET dans le CiM
  2. Calcul sous-seuil : Réduction de la consommation d'énergie mais augmentation de la sensibilité à la température
  3. Conception résiliente à la température : Les solutions existantes se concentrent principalement sur les TCAM et les structures CiM simples

État Actuel de la Recherche sur les FeFET

  1. Modélisation des dispositifs : Modèles NCFET, Preisach, Monte-Carlo, etc.
  2. Applications de circuits : Principalement concentrées sur les mémoires et les unités de calcul simples
  3. Effets thermiques : Peu d'études se concentrent sur l'impact de la température sur les performances des FeFET

Avantages de cet Article

Par rapport aux travaux existants, cet article réalise pour la première fois :

  • Une conception CiM multibit résiliente à la température avec des FeFET
  • Une modélisation et une vérification des effets thermiques au niveau du système
  • Une évaluation complète dans les applications de réseaux de neurones

Conclusion et Discussion

Conclusions Principales

  1. Faisabilité technique : La structure 2FeFET-1T réalise avec succès la résilience thermique et le stockage multibit
  2. Avantages de performance : Amélioration significative de la résilience thermique tout en maintenant une faible consommation d'énergie
  3. Valeur système : Vérification de l'efficacité de la conception dans les applications de réseaux de neurones pratiques

Limitations

  1. Sensibilité de certains états : Les états de stockage '2' et supérieur présentent encore une certaine sensibilité à la température
  2. Dépendance au procédé : Les performances dépendent de la maturité du procédé des dispositifs FeFET
  3. Surcharge ADC : Les conceptions multibit nécessitent des ADC de plus haute précision, augmentant la surface et la consommation d'énergie
  4. Plage de température : Bien que couvrant 0-85°C, les performances diminuent toujours aux températures extrêmes

Directions Futures

  1. Optimisation des dispositifs : Optimisation supplémentaire des caractéristiques des dispositifs FeFET pour réduire la sensibilité à la température
  2. Amélioration des circuits : Exploration de conceptions CiM résilientes à la température avec une largeur de bit plus élevée
  3. Intégration système : Combinaison avec des capteurs de température sur puce pour une compensation dynamique
  4. Extension d'application : Vérification de l'efficacité de la conception dans plus de scénarios d'application d'IA

Évaluation Approfondie

Points Forts

  1. Forte innovativité : Première conception CiM FeFET multibit résiliente à la température, approche technique novatrice
  2. Théorie solide : Le mécanisme de compensation thermique basé sur les caractéristiques CTAT repose sur une base physique solide
  3. Vérification complète : Chaîne de vérification complète du niveau des dispositifs au niveau du système
  4. Valeur pratique : Démonstration de la valeur de la conception dans les applications de réseaux de neurones pratiques
  5. Performance excellente : Efficacité énergétique et précision atteignant des niveaux avancés

Insuffisances

  1. Compensation thermique limitée : Pour les états de stockage à bit élevé, l'effet de la compensation thermique est limité
  2. Augmentation de la complexité : La structure 2FeFET augmente la complexité de conception par rapport aux FeFET simples
  3. Exigences de procédé : Exigences élevées pour la cohérence des dispositifs FeFET
  4. Extensibilité : Les performances à plus grande échelle de matrice nécessitent une vérification supplémentaire

Impact

  1. Valeur académique : Fournit une nouvelle voie technologique pour la conception CiM résiliente à la température
  2. Signification industrielle : Valeur de référence importante pour la conception de puces d'IA embarquée
  3. Promotion technologique : Favorise le développement technologique des FeFET dans les applications CiM

Scénarios d'Application

  1. IA embarquée : Applications d'inférence embarquée sensibles à la consommation d'énergie
  2. Dispositifs IoT : Environnements IoT avec des variations de température importantes
  3. Calcul mobile : Dispositifs mobiles avec des exigences extrêmement élevées en matière d'efficacité énergétique
  4. Contrôle industriel : Applications industrielles nécessitant un fonctionnement dans une large plage de température

Références

L'article cite 42 références connexes, couvrant la technologie CiM, les dispositifs FeFET, les effets thermiques, les accélérateurs de réseaux de neurones et d'autres domaines, fournissant une base théorique solide pour la recherche. Les références clés incluent le cadre NeuroSim, la modélisation des FeFET et les travaux de conception CiM connexes.


Évaluation Globale : Cet article est un travail technique de haute qualité qui apporte des contributions importantes à la conception CiM résiliente à la température. La ligne technique est claire, la vérification expérimentale est complète, et elle a une importance significative pour promouvoir l'application des FeFET dans les accélérateurs d'IA. Bien qu'il y ait encore des domaines d'amélioration, dans l'ensemble, il représente un progrès important dans ce domaine.