2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic

TReCiM: Energieeffiziente und temperaturresistente Multibit-2FeFET-1T-Compute-in-Memory-Architektur

Grundlegende Informationen

  • Paper-ID: 2501.01052
  • Titel: TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
  • Autoren: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
  • Klassifizierung: cs.ET (Emerging Technologies)
  • Veröffentlichungsdatum: Januar 2025
  • Paper-Link: https://arxiv.org/abs/2501.01052

Zusammenfassung

Compute-in-Memory (CiM) stellt eine vielversprechende Lösung dar, um Hardwareherausforderungen in künstlicher Intelligenz und dem Internet der Dinge zu bewältigen, insbesondere das „Memory-Wall"-Problem zu adressieren. Durch die Verwendung von nichtflüchtigen Speichergeräten (NVM) in Crossbar-Array-Strukturen kann CiM kritische Operationen in neuronalen Netzen – Multiply-Accumulate (MAC)-Operationen – effizient beschleunigen. Unter verschiedenen NVM-Geräten sind Ferroelectric Field-Effect Transistoren (FeFET) aufgrund ihrer CMOS-Kompatibilität, spannungsgesteuerten Schreib-/Lesemechanismen und hohen ION/IOFF-Verhältnissen besonders geeignet für ultraenergieffiziente CiM-Arrays. Der Betrieb von FeFETs im Subthreshold-Bereich kann den Energieverbrauch weiter minimieren, ist jedoch anfällig für Temperaturdrift, die zu verminderter Rechengenauigkeit führt. Dieser Artikel präsentiert TReCiM, ein ultraenergieffizientes, temperaturresistentes Multibit-2FeFET-1T-CiM-Design, das zuverlässig MAC-Operationen im Temperaturbereich von 0°C bis 85°C ausführt. Benchmarks mit dem NeuroSim-Framework auf dem VGG-8-Netzwerk und dem CIFAR-10-Datensatz zeigen, dass das TReCiM-Array unter Berücksichtigung von Temperaturdrift eine Genauigkeit von 91,31% erreicht, was eine Verbesserung von 1,86% gegenüber bestehenden 1-Bit-2T-1FeFET-CiM-Arrays darstellt. Darüber hinaus erreicht das Design auf Systemebene eine Energieeffizienz von 48,03 TOPS/W, die mit bestehenden Designs mit kleineren Technologieknoten vergleichbar ist.

Forschungshintergrund und Motivation

Problemstellung

  1. Memory-Wall-Problem: Die traditionelle Von-Neumann-Architektur sieht sich häufigen Datentransfers zwischen Verarbeitungs- und Speichereinheiten gegenüber, was zu hohem Energieverbrauch und Leistungsengpässen führt
  2. Edge-AI-Anforderungen: KI- und IoT-Anwendungen erfordern umfangreiche MAC-Operationen mit extremen Energieeffizienzanforderungen
  3. Bestehende CiM-Limitierungen: Obwohl Compute-in-Memory-Technologie das Memory-Wall-Problem löst, weisen bestehende Designs Mängel in Temperaturresistenz und Multibit-Speicherung auf

Forschungsmotivation

  1. FeFET-Vorteile: FeFETs bieten CMOS-Kompatibilität, niedrige Leckströme und hohes ION/IOFF-Verhältnis, was sie für ultraenergieffiziente Anwendungen geeignet macht
  2. Subthreshold-Betrieb: Der Betrieb im Subthreshold-Bereich kann den Energieverbrauch erheblich senken, erhöht aber die Temperaturempfindlichkeit
  3. Einschränkungen bestehender Lösungen:
    • Bestehende temperaturresistente Designs zeigen schlechte Leistung bei großen Array-Größen
    • Unterstützen nur 1-Bit-Speicherung, was die Speicherdichte begrenzt
    • 2T-1FeFET-Designs erfordern zusätzliche Entladezeiten, was die Latenz erhöht

Kernbeiträge

  1. Vorschlag der TReCiM-Architektur: Erstes temperaturresistentes Multibit-2FeFET-1T-CiM-Design mit Unterstützung für den Temperaturbereich 0°C-85°C
  2. Innovative 2FeFET-Clamping-Struktur: Nutzt komplementäre absolute Temperatur (CTAT)-Charakteristiken zur Temperaturkompensation
  3. Multibit-Speicherfähigkeit: Nutzt Multi-Level-Cell (MLC)-Eigenschaften von FeFETs für 2-Bit und höhere Speicherung
  4. Systemebenen-Validierung: Vollständige Systemebenen-Bewertung und Benchmarking basierend auf dem NeuroSim-Framework
  5. Leistungssteigerung: 3-fache Verbesserung der Temperaturresistenz gegenüber bestehenden Lösungen, Energieeffizienz von 48,03 TOPS/W

Methodische Erläuterung

Aufgabendefinition

Entwurf eines ultraenergieffizienten Multibit-CiM-Arrays, das in einem breiten Temperaturbereich (0°C-85°C) stabil arbeitet, MAC-Operationen in neuronalen Netzen unterstützt und gleichzeitig hohe Genauigkeit und Energieeffizienz beibehält.

Modellarchitektur

2FeFET-1T-Zellendesign

![Zellenstruktur](Beschreibung basierend auf Abbildung 2 des Papers)

Kernkomponenten:

  • M1, M2: Zwei FeFET-Geräte, die eine Clamping-Struktur bilden
  • M3: NMOS-Transistor als Ausgangskontrolle
  • Steuersignale: WL1, WL2 (Wortleitungen), DL (Datenleitungen), BL (Bitleitungen), SL (Quellleitungen)

Funktionsprinzip:

  1. Schreiboperation: Unterschiedliche Spannungen (±4V) werden über WL1 und WL2 angelegt, um den FeFET-Zustand einzustellen
  2. Leseoperation: MAC-Operationen werden durch Steuerung der WL-Spannung realisiert
  3. Temperaturkompensation: Nutzt CTAT-Charakteristiken von MOSFETs und Rückkopplungsmechanismen

Multibit-Speicherimplementierung

  • Zustand '0': M2 im VTH1-Zustand, M1 im VTH0-Zustand
  • Zustand '1': M1 und M2 beide im VTH1-Zustand (Clamping-Konfiguration)
  • Zustand '2' und höher: M1 in verschiedenen VTH-Zuständen, M2 ausgeschaltet

Technische Innovationen

1. 2FeFET-Clamping-Struktur

Wenn Speicherzustand '1' vorliegt:
- M1 und M2 bilden einen Spannungsteiler
- Mittlere Knotenspannung VS wird stabil geklemmt
- Temperaturdrift-Auswirkungen werden erheblich reduziert

2. CTAT-Temperaturkompensationsmechanismus

Leckstromformel im Subthreshold-Bereich für MOSFETs:

ID = I0 * exp(Vgs / (ξVT))
wobei VT = kT/q

Temperatur-Rückkopplungsmechanismus:

  • Temperaturanstieg → Leckstrom von M1 erhöht sich → VS-Spannung steigt → Ausgangsstrom von M3 erhöht sich
  • Aufgrund von CTAT-Charakteristiken wird die Stromsteigerung jedoch unterdrückt, was Ausgangsschwankungen reduziert

3. Array-Level-Design

  • 8-Zeilen-×-Mehrere-Spalten-Struktur: Unterstützt parallele MAC-Operationen
  • Flash-ADC: Verwendet Stromempfindungsverstärker zur Reduzierung der Erfassungsverzögerung
  • Gemeinsamer ADC: 8 Spalten teilen sich einen 3-Bit-ADC, um Fläche und Leistung auszugleichen

Experimentelle Einrichtung

Simulationsumgebung

  • SPICE-Simulation: Verwendet Intel-FinFET-Modell und Preisach-FeFET-Kompaktmodell
  • NeuroSim-Framework: Modifiziert zur Unterstützung von Subthreshold-FeFET und Temperatureffekten
  • Technologieknoten: 45-nm-Technologieknoten
  • Versorgungsspannung: Subthreshold-Design Vdd=0,8V, Sättigungsdesign Vdd=1,0V

Datensätze

  • Neuronales Netzwerk: VGG-8-Architektur
  • Datensatz: CIFAR-10
  • Netzwerkstruktur: 6 Faltungsschichten + 2 vollständig verbundene Schichten
  • Quantisierung: Verwendet WAGE-Modell für Hardware-Quantisierung

Bewertungsmetriken

  1. Temperaturresistenz: Noise Margin Ratio (NMR) und minimale NMR-Werte
  2. Genauigkeit: Genauigkeit der neuronalen Netzwerk-Inferenz
  3. Energieeffizienz: TOPS/W (Billionen Operationen pro Watt)
  4. Fläche: Chipflächenauslastung
  5. Durchsatz: Rechengeschwindigkeit

Vergleichsmethoden

  • 1FeFET-1R: Grundlegendes Single-FeFET-Design
  • 2T-1FeFET: Bestehendes temperaturresistentes Design
  • Andere NVM: RRAM-, PCM- und andere Technologien

Experimentelle Ergebnisse

Hauptergebnisse

Temperaturresistenz-Validierung

  • 1-Bit-TReCiM: NMRmin = 0,291 (0-85°C), NMRmin = 2,6 (20-85°C)
  • Temperaturresistenz-Verbesserung: 3-fache Verbesserung gegenüber 1FeFET-1R-Design
  • Gegenüber 2T-1FeFET: 1,06-fache Verbesserung

Neuronale Netzwerk-Leistung

Design-LösungGenauigkeitEnergieeffizienz (TOPS/W)Bitbreite
TReCiM (1-Bit)92,00%26,061
TReCiM (2-Bit)91,31%48,032
2T-1FeFET~89,45%~21,01
1FeFET-1R (Subthreshold)<85%~15,01

Ablationsstudien

Prozessvariations-Auswirkungen

  • Monte-Carlo-Simulation: 500 Durchläufe, σVT = 54mV
  • Zustand '1': 100% Genauigkeit, Variation nur 3,89%
  • Zustand '2': Variation 20,8%
  • Zustand '3': Variation 17,1%

Temperaturcharakteristik-Analyse

Temperaturempfindlichkeit verschiedener Speicherzustände:

  • Zustand '1': Temperaturdrift vernachlässigbar (Clamping-Effekt)
  • Zustand '2': Maximale Schwankung 32,9%
  • Zustand '3' und höher: Mit sinkendem VTH nimmt die Temperaturempfindlichkeit ab

Fallstudie

In dem VGG-8-Netzwerk ist die Gewichtsverteilung:

  • Gewicht '0': 27,2%
  • Gewicht '1': 24,1%
  • Gewicht '2': 23,5%
  • Gewicht '3': 25,2%

Die kombinierte Variationsrate beträgt 13,9%, wobei die endgültige Inferenzgenauigkeit 91,31% erreicht.

Verwandte Arbeiten

CiM-Technologieentwicklung

  1. NVM-Technologien: Anwendung von ReRAM, PCM, FeFET und anderen in CiM
  2. Subthreshold-Berechnung: Energieverbrauchsreduktion bei erhöhter Temperaturempfindlichkeit
  3. Temperaturresistente Designs: Bestehende Lösungen konzentrieren sich hauptsächlich auf TCAM und einfache CiM-Strukturen

Aktueller Stand der FeFET-Forschung

  1. Gerätemodellierung: NCFET-, Preisach- und Monte-Carlo-Modelle
  2. Schaltungsanwendungen: Hauptsächlich konzentriert auf Speicher und einfache Recheneinheiten
  3. Temperatureffekte: Wenige Arbeiten befassen sich mit Temperaturauswirkungen auf FeFET-Leistung

Vorteile dieser Arbeit

Im Vergleich zu bestehenden Arbeiten realisiert dieser Artikel erstmals:

  • Temperaturresistentes CiM-Design mit Multibit-Speicherung
  • Systemebenen-Modellierung und Validierung von Temperatureffekten
  • Vollständige Bewertung in neuronalen Netzwerk-Anwendungen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Technische Machbarkeit: 2FeFET-1T-Struktur realisiert erfolgreich Temperaturresistenz und Multibit-Speicherung
  2. Leistungsvorteile: Signifikante Verbesserung der Temperaturresistenz bei Beibehaltung niedriger Energieaufnahme
  3. Systemwert: Validiert die Wirksamkeit des Designs in praktischen neuronalen Netzwerk-Anwendungen

Limitierungen

  1. Teilweise Zustandsempfindlichkeit: Speicherzustände '2' und höher zeigen noch gewisse Temperaturempfindlichkeit
  2. Prozessabhängigkeit: Leistung hängt von der Reife der FeFET-Gerätetechnologie ab
  3. ADC-Overhead: Multibit-Designs erfordern ADCs mit höherer Präzision, was Fläche und Energieverbrauch erhöht
  4. Temperaturbereich: Obwohl 0-85°C abgedeckt werden, zeigt die Leistung bei extremen Temperaturen noch Rückgang

Zukünftige Richtungen

  1. Geräteoptimierung: Weitere Optimierung von FeFET-Geräte-Charakteristiken zur Reduzierung der Temperaturempfindlichkeit
  2. Schaltungsverbesserungen: Erforschung temperaturresistenter Designs für höhere Bitbreiten-Speicherung
  3. Systemintegration: Integration mit On-Chip-Temperatursensoren für dynamische Kompensation
  4. Anwendungserweiterung: Validierung des Designs in mehr KI-Anwendungsszenarien

Tiefgreifende Bewertung

Stärken

  1. Hohe Innovativität: Erstes Multibit-temperaturresistentes FeFET-CiM-Design mit neuartiger technischer Route
  2. Solide Theorie: Temperaturkompensationsmechanismus basierend auf CTAT-Charakteristiken hat solide physikalische Grundlagen
  3. Umfassende Validierung: Vollständige Validierungskette von Geräte- bis Systemebene
  4. Praktischer Wert: Beweis des Designwerts in praktischen neuronalen Netzwerk-Anwendungen
  5. Hervorragende Leistung: Energieeffizienz und Genauigkeit erreichen fortgeschrittenes Niveau

Mängel

  1. Begrenzte Temperaturkompensation: Temperaturkompensationseffekt ist für hochwertige Speicherzustände begrenzt
  2. Erhöhte Komplexität: 2FeFET-Struktur erhöht Designkomplexität gegenüber Single-FeFET
  3. Prozessanforderungen: Erfordert hohe Konsistenz der FeFET-Geräte
  4. Skalierbarkeit: Leistung bei größeren Array-Größen erfordert weitere Validierung

Einfluss

  1. Akademischer Wert: Bietet neue technische Route für temperaturresistentes CiM-Design
  2. Industrielle Bedeutung: Wichtige Referenz für Edge-AI-Chipdesign
  3. Technologischer Fortschritt: Fördert technologische Entwicklung von FeFET in CiM-Anwendungen

Anwendungsszenarien

  1. Edge-AI: Energiesensitive Edge-Inferenz-Anwendungen
  2. IoT-Geräte: IoT-Umgebungen mit großen Temperaturschwankungen
  3. Mobile Berechnung: Mobile Geräte mit extremen Energieeffizienzanforderungen
  4. Industrielle Steuerung: Industrielle Anwendungen, die in breiten Temperaturbereichen arbeiten müssen

Literaturverzeichnis

Das Paper zitiert 42 relevante Referenzen, die CiM-Technologie, FeFET-Geräte, Temperatureffekte, neuronale Netzwerk-Beschleuniger und andere Aspekte abdecken und eine solide theoretische Grundlage für die Forschung bieten. Wichtige Referenzen umfassen das NeuroSim-Framework, FeFET-Modellierung und verwandte CiM-Designarbeiten.


Gesamtbewertung: Dies ist ein hochqualitatives technisches Paper, das wichtige Beiträge zum temperaturresistenten CiM-Design leistet. Die technische Route ist klar, die experimentelle Validierung ist umfassend und das Paper hat wichtige Bedeutung für die Förderung der Anwendung von FeFET in KI-Beschleunigern. Obwohl in einigen Aspekten noch Verbesserungspotenzial besteht, stellt es insgesamt einen wichtigen Fortschritt in diesem Forschungsbereich dar.