2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, KÃ¤mpfe, Ni et al.

Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.

academic

TReCiM: Energieeffiziente und temperaturresistente Multibit-2FeFET-1T-Compute-in-Memory-Architektur

Grundlegende Informationen

Paper-ID: 2501.01052
Titel: TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
Autoren: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
Klassifizierung: cs.ET (Emerging Technologies)
Veröffentlichungsdatum: Januar 2025
Paper-Link: https://arxiv.org/abs/2501.01052

Zusammenfassung

Compute-in-Memory (CiM) stellt eine vielversprechende Lösung dar, um Hardwareherausforderungen in künstlicher Intelligenz und dem Internet der Dinge zu bewältigen, insbesondere das „Memory-Wall"-Problem zu adressieren. Durch die Verwendung von nichtflüchtigen Speichergeräten (NVM) in Crossbar-Array-Strukturen kann CiM kritische Operationen in neuronalen Netzen – Multiply-Accumulate (MAC)-Operationen – effizient beschleunigen. Unter verschiedenen NVM-Geräten sind Ferroelectric Field-Effect Transistoren (FeFET) aufgrund ihrer CMOS-Kompatibilität, spannungsgesteuerten Schreib-/Lesemechanismen und hohen ION/IOFF-Verhältnissen besonders geeignet für ultraenergieffiziente CiM-Arrays. Der Betrieb von FeFETs im Subthreshold-Bereich kann den Energieverbrauch weiter minimieren, ist jedoch anfällig für Temperaturdrift, die zu verminderter Rechengenauigkeit führt. Dieser Artikel präsentiert TReCiM, ein ultraenergieffizientes, temperaturresistentes Multibit-2FeFET-1T-CiM-Design, das zuverlässig MAC-Operationen im Temperaturbereich von 0°C bis 85°C ausführt. Benchmarks mit dem NeuroSim-Framework auf dem VGG-8-Netzwerk und dem CIFAR-10-Datensatz zeigen, dass das TReCiM-Array unter Berücksichtigung von Temperaturdrift eine Genauigkeit von 91,31% erreicht, was eine Verbesserung von 1,86% gegenüber bestehenden 1-Bit-2T-1FeFET-CiM-Arrays darstellt. Darüber hinaus erreicht das Design auf Systemebene eine Energieeffizienz von 48,03 TOPS/W, die mit bestehenden Designs mit kleineren Technologieknoten vergleichbar ist.

Forschungshintergrund und Motivation

Problemstellung

Memory-Wall-Problem: Die traditionelle Von-Neumann-Architektur sieht sich häufigen Datentransfers zwischen Verarbeitungs- und Speichereinheiten gegenüber, was zu hohem Energieverbrauch und Leistungsengpässen führt
Edge-AI-Anforderungen: KI- und IoT-Anwendungen erfordern umfangreiche MAC-Operationen mit extremen Energieeffizienzanforderungen
Bestehende CiM-Limitierungen: Obwohl Compute-in-Memory-Technologie das Memory-Wall-Problem löst, weisen bestehende Designs Mängel in Temperaturresistenz und Multibit-Speicherung auf

Forschungsmotivation

FeFET-Vorteile: FeFETs bieten CMOS-Kompatibilität, niedrige Leckströme und hohes ION/IOFF-Verhältnis, was sie für ultraenergieffiziente Anwendungen geeignet macht
Subthreshold-Betrieb: Der Betrieb im Subthreshold-Bereich kann den Energieverbrauch erheblich senken, erhöht aber die Temperaturempfindlichkeit
Einschränkungen bestehender Lösungen:
- Bestehende temperaturresistente Designs zeigen schlechte Leistung bei großen Array-Größen
- Unterstützen nur 1-Bit-Speicherung, was die Speicherdichte begrenzt
- 2T-1FeFET-Designs erfordern zusätzliche Entladezeiten, was die Latenz erhöht

Kernbeiträge

Vorschlag der TReCiM-Architektur: Erstes temperaturresistentes Multibit-2FeFET-1T-CiM-Design mit Unterstützung für den Temperaturbereich 0°C-85°C
Innovative 2FeFET-Clamping-Struktur: Nutzt komplementäre absolute Temperatur (CTAT)-Charakteristiken zur Temperaturkompensation
Multibit-Speicherfähigkeit: Nutzt Multi-Level-Cell (MLC)-Eigenschaften von FeFETs für 2-Bit und höhere Speicherung
Systemebenen-Validierung: Vollständige Systemebenen-Bewertung und Benchmarking basierend auf dem NeuroSim-Framework
Leistungssteigerung: 3-fache Verbesserung der Temperaturresistenz gegenüber bestehenden Lösungen, Energieeffizienz von 48,03 TOPS/W

Methodische Erläuterung

Aufgabendefinition

Entwurf eines ultraenergieffizienten Multibit-CiM-Arrays, das in einem breiten Temperaturbereich (0°C-85°C) stabil arbeitet, MAC-Operationen in neuronalen Netzen unterstützt und gleichzeitig hohe Genauigkeit und Energieeffizienz beibehält.

Modellarchitektur

2FeFET-1T-Zellendesign

![Zellenstruktur](Beschreibung basierend auf Abbildung 2 des Papers)

Kernkomponenten:

M1, M2: Zwei FeFET-Geräte, die eine Clamping-Struktur bilden
M3: NMOS-Transistor als Ausgangskontrolle
Steuersignale: WL1, WL2 (Wortleitungen), DL (Datenleitungen), BL (Bitleitungen), SL (Quellleitungen)

Funktionsprinzip:

Schreiboperation: Unterschiedliche Spannungen (±4V) werden über WL1 und WL2 angelegt, um den FeFET-Zustand einzustellen
Leseoperation: MAC-Operationen werden durch Steuerung der WL-Spannung realisiert
Temperaturkompensation: Nutzt CTAT-Charakteristiken von MOSFETs und Rückkopplungsmechanismen

Multibit-Speicherimplementierung

Zustand '0': M2 im VTH1-Zustand, M1 im VTH0-Zustand
Zustand '1': M1 und M2 beide im VTH1-Zustand (Clamping-Konfiguration)
Zustand '2' und höher: M1 in verschiedenen VTH-Zuständen, M2 ausgeschaltet

Technische Innovationen

1. 2FeFET-Clamping-Struktur

Wenn Speicherzustand '1' vorliegt:
- M1 und M2 bilden einen Spannungsteiler
- Mittlere Knotenspannung VS wird stabil geklemmt
- Temperaturdrift-Auswirkungen werden erheblich reduziert

2. CTAT-Temperaturkompensationsmechanismus

Leckstromformel im Subthreshold-Bereich für MOSFETs:

ID = I0 * exp(Vgs / (ξVT))
wobei VT = kT/q

Temperatur-Rückkopplungsmechanismus:

Temperaturanstieg → Leckstrom von M1 erhöht sich → VS-Spannung steigt → Ausgangsstrom von M3 erhöht sich
Aufgrund von CTAT-Charakteristiken wird die Stromsteigerung jedoch unterdrückt, was Ausgangsschwankungen reduziert

3. Array-Level-Design

8-Zeilen-×-Mehrere-Spalten-Struktur: Unterstützt parallele MAC-Operationen
Flash-ADC: Verwendet Stromempfindungsverstärker zur Reduzierung der Erfassungsverzögerung
Gemeinsamer ADC: 8 Spalten teilen sich einen 3-Bit-ADC, um Fläche und Leistung auszugleichen

Experimentelle Einrichtung

Simulationsumgebung

SPICE-Simulation: Verwendet Intel-FinFET-Modell und Preisach-FeFET-Kompaktmodell
NeuroSim-Framework: Modifiziert zur Unterstützung von Subthreshold-FeFET und Temperatureffekten
Technologieknoten: 45-nm-Technologieknoten
Versorgungsspannung: Subthreshold-Design Vdd=0,8V, Sättigungsdesign Vdd=1,0V

Datensätze

Neuronales Netzwerk: VGG-8-Architektur
Datensatz: CIFAR-10
Netzwerkstruktur: 6 Faltungsschichten + 2 vollständig verbundene Schichten
Quantisierung: Verwendet WAGE-Modell für Hardware-Quantisierung

Bewertungsmetriken

Temperaturresistenz: Noise Margin Ratio (NMR) und minimale NMR-Werte
Genauigkeit: Genauigkeit der neuronalen Netzwerk-Inferenz
Energieeffizienz: TOPS/W (Billionen Operationen pro Watt)
Fläche: Chipflächenauslastung
Durchsatz: Rechengeschwindigkeit

Vergleichsmethoden

1FeFET-1R: Grundlegendes Single-FeFET-Design
2T-1FeFET: Bestehendes temperaturresistentes Design
Andere NVM: RRAM-, PCM- und andere Technologien

Experimentelle Ergebnisse

Hauptergebnisse

Temperaturresistenz-Validierung

1-Bit-TReCiM: NMRmin = 0,291 (0-85°C), NMRmin = 2,6 (20-85°C)
Temperaturresistenz-Verbesserung: 3-fache Verbesserung gegenüber 1FeFET-1R-Design
Gegenüber 2T-1FeFET: 1,06-fache Verbesserung

Neuronale Netzwerk-Leistung

Design-Lösung	Genauigkeit	Energieeffizienz (TOPS/W)	Bitbreite
TReCiM (1-Bit)	92,00%	26,06	1
TReCiM (2-Bit)	91,31%	48,03	2
2T-1FeFET	~89,45%	~21,0	1
1FeFET-1R (Subthreshold)	<85%	~15,0	1

Ablationsstudien

Prozessvariations-Auswirkungen

Monte-Carlo-Simulation: 500 Durchläufe, σVT = 54mV
Zustand '1': 100% Genauigkeit, Variation nur 3,89%
Zustand '2': Variation 20,8%
Zustand '3': Variation 17,1%

Temperaturcharakteristik-Analyse

Temperaturempfindlichkeit verschiedener Speicherzustände:

Zustand '1': Temperaturdrift vernachlässigbar (Clamping-Effekt)
Zustand '2': Maximale Schwankung 32,9%
Zustand '3' und höher: Mit sinkendem VTH nimmt die Temperaturempfindlichkeit ab

Fallstudie

In dem VGG-8-Netzwerk ist die Gewichtsverteilung:

Gewicht '0': 27,2%
Gewicht '1': 24,1%
Gewicht '2': 23,5%
Gewicht '3': 25,2%

Die kombinierte Variationsrate beträgt 13,9%, wobei die endgültige Inferenzgenauigkeit 91,31% erreicht.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Technische Machbarkeit: 2FeFET-1T-Struktur realisiert erfolgreich Temperaturresistenz und Multibit-Speicherung
Leistungsvorteile: Signifikante Verbesserung der Temperaturresistenz bei Beibehaltung niedriger Energieaufnahme
Systemwert: Validiert die Wirksamkeit des Designs in praktischen neuronalen Netzwerk-Anwendungen

Limitierungen

Teilweise Zustandsempfindlichkeit: Speicherzustände '2' und höher zeigen noch gewisse Temperaturempfindlichkeit
Prozessabhängigkeit: Leistung hängt von der Reife der FeFET-Gerätetechnologie ab
ADC-Overhead: Multibit-Designs erfordern ADCs mit höherer Präzision, was Fläche und Energieverbrauch erhöht
Temperaturbereich: Obwohl 0-85°C abgedeckt werden, zeigt die Leistung bei extremen Temperaturen noch Rückgang

Zukünftige Richtungen

Geräteoptimierung: Weitere Optimierung von FeFET-Geräte-Charakteristiken zur Reduzierung der Temperaturempfindlichkeit
Schaltungsverbesserungen: Erforschung temperaturresistenter Designs für höhere Bitbreiten-Speicherung
Systemintegration: Integration mit On-Chip-Temperatursensoren für dynamische Kompensation
Anwendungserweiterung: Validierung des Designs in mehr KI-Anwendungsszenarien

Tiefgreifende Bewertung

Stärken

Hohe Innovativität: Erstes Multibit-temperaturresistentes FeFET-CiM-Design mit neuartiger technischer Route
Solide Theorie: Temperaturkompensationsmechanismus basierend auf CTAT-Charakteristiken hat solide physikalische Grundlagen
Umfassende Validierung: Vollständige Validierungskette von Geräte- bis Systemebene
Praktischer Wert: Beweis des Designwerts in praktischen neuronalen Netzwerk-Anwendungen
Hervorragende Leistung: Energieeffizienz und Genauigkeit erreichen fortgeschrittenes Niveau

Mängel

Begrenzte Temperaturkompensation: Temperaturkompensationseffekt ist für hochwertige Speicherzustände begrenzt
Erhöhte Komplexität: 2FeFET-Struktur erhöht Designkomplexität gegenüber Single-FeFET
Prozessanforderungen: Erfordert hohe Konsistenz der FeFET-Geräte
Skalierbarkeit: Leistung bei größeren Array-Größen erfordert weitere Validierung

Einfluss

Akademischer Wert: Bietet neue technische Route für temperaturresistentes CiM-Design
Industrielle Bedeutung: Wichtige Referenz für Edge-AI-Chipdesign
Technologischer Fortschritt: Fördert technologische Entwicklung von FeFET in CiM-Anwendungen

Anwendungsszenarien

Edge-AI: Energiesensitive Edge-Inferenz-Anwendungen
IoT-Geräte: IoT-Umgebungen mit großen Temperaturschwankungen
Mobile Berechnung: Mobile Geräte mit extremen Energieeffizienzanforderungen
Industrielle Steuerung: Industrielle Anwendungen, die in breiten Temperaturbereichen arbeiten müssen

Literaturverzeichnis

Das Paper zitiert 42 relevante Referenzen, die CiM-Technologie, FeFET-Geräte, Temperatureffekte, neuronale Netzwerk-Beschleuniger und andere Aspekte abdecken und eine solide theoretische Grundlage für die Forschung bieten. Wichtige Referenzen umfassen das NeuroSim-Framework, FeFET-Modellierung und verwandte CiM-Designarbeiten.

Gesamtbewertung: Dies ist ein hochqualitatives technisches Paper, das wichtige Beiträge zum temperaturresistenten CiM-Design leistet. Die technische Route ist klar, die experimentelle Validierung ist umfassend und das Paper hat wichtige Bedeutung für die Förderung der Anwendung von FeFET in KI-Beschleunigern. Obwohl in einigen Aspekten noch Verbesserungspotenzial besteht, stellt es insgesamt einen wichtigen Fortschritt in diesem Forschungsbereich dar.