TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design
Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic
TReCiM: Energieeffiziente und temperaturresistente Multibit-2FeFET-1T-Compute-in-Memory-Architektur
Compute-in-Memory (CiM) stellt eine vielversprechende Lösung dar, um Hardwareherausforderungen in künstlicher Intelligenz und dem Internet der Dinge zu bewältigen, insbesondere das „Memory-Wall"-Problem zu adressieren. Durch die Verwendung von nichtflüchtigen Speichergeräten (NVM) in Crossbar-Array-Strukturen kann CiM kritische Operationen in neuronalen Netzen – Multiply-Accumulate (MAC)-Operationen – effizient beschleunigen. Unter verschiedenen NVM-Geräten sind Ferroelectric Field-Effect Transistoren (FeFET) aufgrund ihrer CMOS-Kompatibilität, spannungsgesteuerten Schreib-/Lesemechanismen und hohen ION/IOFF-Verhältnissen besonders geeignet für ultraenergieffiziente CiM-Arrays. Der Betrieb von FeFETs im Subthreshold-Bereich kann den Energieverbrauch weiter minimieren, ist jedoch anfällig für Temperaturdrift, die zu verminderter Rechengenauigkeit führt. Dieser Artikel präsentiert TReCiM, ein ultraenergieffizientes, temperaturresistentes Multibit-2FeFET-1T-CiM-Design, das zuverlässig MAC-Operationen im Temperaturbereich von 0°C bis 85°C ausführt. Benchmarks mit dem NeuroSim-Framework auf dem VGG-8-Netzwerk und dem CIFAR-10-Datensatz zeigen, dass das TReCiM-Array unter Berücksichtigung von Temperaturdrift eine Genauigkeit von 91,31% erreicht, was eine Verbesserung von 1,86% gegenüber bestehenden 1-Bit-2T-1FeFET-CiM-Arrays darstellt. Darüber hinaus erreicht das Design auf Systemebene eine Energieeffizienz von 48,03 TOPS/W, die mit bestehenden Designs mit kleineren Technologieknoten vergleichbar ist.
Memory-Wall-Problem: Die traditionelle Von-Neumann-Architektur sieht sich häufigen Datentransfers zwischen Verarbeitungs- und Speichereinheiten gegenüber, was zu hohem Energieverbrauch und Leistungsengpässen führt
Edge-AI-Anforderungen: KI- und IoT-Anwendungen erfordern umfangreiche MAC-Operationen mit extremen Energieeffizienzanforderungen
Bestehende CiM-Limitierungen: Obwohl Compute-in-Memory-Technologie das Memory-Wall-Problem löst, weisen bestehende Designs Mängel in Temperaturresistenz und Multibit-Speicherung auf
FeFET-Vorteile: FeFETs bieten CMOS-Kompatibilität, niedrige Leckströme und hohes ION/IOFF-Verhältnis, was sie für ultraenergieffiziente Anwendungen geeignet macht
Subthreshold-Betrieb: Der Betrieb im Subthreshold-Bereich kann den Energieverbrauch erheblich senken, erhöht aber die Temperaturempfindlichkeit
Einschränkungen bestehender Lösungen:
Bestehende temperaturresistente Designs zeigen schlechte Leistung bei großen Array-Größen
Unterstützen nur 1-Bit-Speicherung, was die Speicherdichte begrenzt
2T-1FeFET-Designs erfordern zusätzliche Entladezeiten, was die Latenz erhöht
Entwurf eines ultraenergieffizienten Multibit-CiM-Arrays, das in einem breiten Temperaturbereich (0°C-85°C) stabil arbeitet, MAC-Operationen in neuronalen Netzen unterstützt und gleichzeitig hohe Genauigkeit und Energieeffizienz beibehält.
Wenn Speicherzustand '1' vorliegt:
- M1 und M2 bilden einen Spannungsteiler
- Mittlere Knotenspannung VS wird stabil geklemmt
- Temperaturdrift-Auswirkungen werden erheblich reduziert
Das Paper zitiert 42 relevante Referenzen, die CiM-Technologie, FeFET-Geräte, Temperatureffekte, neuronale Netzwerk-Beschleuniger und andere Aspekte abdecken und eine solide theoretische Grundlage für die Forschung bieten. Wichtige Referenzen umfassen das NeuroSim-Framework, FeFET-Modellierung und verwandte CiM-Designarbeiten.
Gesamtbewertung: Dies ist ein hochqualitatives technisches Paper, das wichtige Beiträge zum temperaturresistenten CiM-Design leistet. Die technische Route ist klar, die experimentelle Validierung ist umfassend und das Paper hat wichtige Bedeutung für die Förderung der Anwendung von FeFET in KI-Beschleunigern. Obwohl in einigen Aspekten noch Verbesserungspotenzial besteht, stellt es insgesamt einen wichtigen Fortschritt in diesem Forschungsbereich dar.