2025-11-18T11:22:13.563574

TReCiM: Lower Power and Temperature-Resilient Multibit 2FeFET-1T Compute-in-Memory Design

Zhou, Kämpfe, Ni et al.
Compute-in-memory (CiM) emerges as a promising solution to solve hardware challenges in artificial intelligence (AI) and the Internet of Things (IoT), particularly addressing the "memory wall" issue. By utilizing nonvolatile memory (NVM) devices in a crossbar structure, CiM efficiently accelerates multiply-accumulate (MAC) computations, the crucial operations in neural networks and other AI models. Among various NVM devices, Ferroelectric FET (FeFET) is particularly appealing for ultra-low-power CiM arrays due to its CMOS compatibility, voltage-driven write/read mechanisms and high ION/IOFF ratio. Moreover, subthreshold-operated FeFETs, which operate at scaling voltages in the subthreshold region, can further minimize the power consumption of CiM array. However, subthreshold-FeFETs are susceptible to temperature drift, resulting in computation accuracy degradation. Existing solutions exhibit weak temperature resilience at larger array size and only support 1-bit. In this paper, we propose TReCiM, an ultra-low-power temperature-resilient multibit 2FeFET-1T CiM design that reliably performs MAC operations in the subthreshold-FeFET region with temperature ranging from 0 to 85 degrees Celcius at scale. We benchmark our design using NeuroSim framework in the context of VGG-8 neural network architecture running the CIFAR-10 dataset. Benchmarking results suggest that when considering temperature drift impact, our proposed TReCiM array achieves 91.31% accuracy, with 1.86% accuracy improvement compared to existing 1-bit 2T-1FeFET CiM array. Furthermore, our proposed design achieves 48.03 TOPS/W energy efficiency at system level, comparable to existing designs with smaller technology feature sizes.
academic

TReCiM: تصميم حساب في الذاكرة متعدد البتات منخفض الطاقة وقابل للصمود في درجات الحرارة 2FeFET-1T

المعلومات الأساسية

  • معرّف الورقة: 2501.01052
  • العنوان: TReCiM: تصميم حساب في الذاكرة متعدد البتات منخفض الطاقة وقابل للصمود في درجات الحرارة 2FeFET-1T
  • المؤلفون: Yifei Zhou, Thomas Kämpfe, Kai Ni, Hussam Amrouch, Cheng Zhuo, Xunzhao Yin
  • التصنيف: cs.ET (التقنيات الناشئة)
  • تاريخ النشر: يناير 2025
  • رابط الورقة: https://arxiv.org/abs/2501.01052

الملخص

يعتبر الحساب في الذاكرة (Compute-in-Memory, CiM) حلاً واعداً لمعالجة تحديات الأجهزة في الذكاء الاصطناعي وإنترنت الأشياء، خاصة لحل مشكلة "جدار الذاكرة". من خلال استخدام أجهزة الذاكرة غير المتطايرة (NVM) في بنية المصفوفة المتقاطعة، يمكن لـ CiM تسريع العمليات الحرجة في الشبكات العصبية - عمليات الضرب والتراكم (MAC). من بين أجهزة NVM المختلفة، تتمتع晶体الترانزستور ذو التأثير الحقلي الحديدي (FeFET) بملاءمة خاصة لمصفوفات CiM فائقة منخفضة الطاقة بسبب توافقيتها مع CMOS وآليات الكتابة/القراءة المدفوعة بالجهد ونسبة ION/IOFF العالية. يمكن لتشغيل FeFET في منطقة ما تحت العتبة أن يقلل الطاقة بشكل أكبر، لكنه عرضة للانجراف الحراري مما يؤدي إلى انخفاض دقة الحساب. تقترح هذه الورقة TReCiM، وهو تصميم CiM متعدد البتات 2FeFET-1T فائق منخفض الطاقة وقابل للصمود في درجات الحرارة، يمكنه تنفيذ عمليات MAC بموثوقية في نطاق درجات الحرارة من 0°C إلى 85°C. تُظهر الاختبارات المعيارية باستخدام إطار عمل NeuroSim على شبكة VGG-8 ومجموعة بيانات CIFAR-10 أن مصفوفة TReCiM تحقق دقة 91.31% عند الأخذ في الاعتبار تأثيرات الانجراف الحراري، محسّنة بنسبة 1.86% مقارنة بمصفوفات CiM الحالية 1-بت 2T-1FeFET. علاوة على ذلك، يحقق التصميم كفاءة طاقة تبلغ 48.03 TOPS/W على مستوى النظام، وهو ما يضاهي التصاميم الحالية ذات أحجام الميزات التكنولوجية الأصغر.

الخلفية البحثية والدافع

خلفية المشكلة

  1. مشكلة جدار الذاكرة: تواجه البنية المعمارية التقليدية von Neumann اختناقات عالية الطاقة والأداء بسبب نقل البيانات المتكرر بين وحدات المعالجة والتخزين
  2. متطلبات الذكاء الاصطناعي على الحافة: تتطلب تطبيقات الذكاء الاصطناعي وإنترنت الأشياء عدداً كبيراً من عمليات MAC مع متطلبات كفاءة طاقة عالية جداً
  3. قيود CiM الحالية: بينما تحل تقنية الحساب في الذاكرة مشكلة جدار الذاكرة، فإن التصاميم الحالية تفتقر إلى الصمود في درجات الحرارة والتخزين متعدد البتات

دافع البحث

  1. مزايا FeFET: يتمتع FeFET بمزايا التوافقية مع CMOS والتسرب الحالي المنخفض ونسبة ION/IOFF العالية، مما يجعله مناسباً للتطبيقات فائقة منخفضة الطاقة
  2. التشغيل في منطقة ما تحت العتبة: يمكن للتشغيل في المنطقة دون العتبة أن يقلل الطاقة بشكل كبير، لكن الحساسية للحرارة تزداد
  3. قيود الحلول الحالية:
    • التصاميم الحالية القابلة للصمود في درجات الحرارة تؤدي أداءً سيئاً في أحجام المصفوفات الكبيرة
    • تدعم فقط التخزين 1-بت، مما يحد من كثافة التخزين
    • يتطلب التصميم 2T-1FeFET وقت تفريغ إضافي، مما يزيد من التأخير

المساهمات الأساسية

  1. اقتراح معمارية TReCiM: أول تصميم CiM متعدد البتات قابل للصمود في درجات الحرارة 2FeFET-1T، يدعم نطاق درجات الحرارة 0°C-85°C
  2. هيكل تثبيت 2FeFET مبتكر: يستخدم خصائص درجة الحرارة المطلقة المكملة (CTAT) لتحقيق التعويض الحراري
  3. القدرة على التخزين متعدد البتات: يستفيد من خصائص الخلايا متعددة المستويات (MLC) لـ FeFET لتحقيق التخزين 2-بت وما فوق
  4. التحقق على مستوى النظام: تقييم شامل على مستوى النظام واختبارات معيارية بناءً على إطار عمل NeuroSim
  5. تحسن الأداء: تحسن بمعامل 3 مرات في الصمود في درجات الحرارة مقارنة بالحلول الحالية، مع كفاءة طاقة تبلغ 48.03 TOPS/W

شرح الطريقة

تعريف المهمة

تصميم مصفوفة CiM متعددة البتات فائقة منخفضة الطاقة يمكنها العمل بثبات في نطاق درجات حرارة واسع (0°C-85°C)، تدعم عمليات MAC للشبكات العصبية، مع الحفاظ على دقة وكفاءة طاقة عالية.

معمارية النموذج

تصميم الخلية 2FeFET-1T

![بنية الخلية](بناءً على وصف الشكل 2 من الورقة)

المكونات الأساسية:

  • M1, M2: جهازا FeFET يشكلان هيكل التثبيت
  • M3: ترانزستور NMOS، يعمل كتحكم في الإخراج
  • إشارات التحكم: WL1, WL2 (خطوط الكلمات)، DL (خط البيانات)، BL (خط البت)، SL (خط المصدر)

مبدأ العمل:

  1. عملية الكتابة: تطبيق جهود مختلفة (±4V) عبر WL1 و WL2 لتعيين حالة FeFET
  2. عملية القراءة: التحكم في جهد WL لتحقيق عمليات MAC
  3. التعويض الحراري: استخدام خصائص CTAT للترانزستور والآليات الراجعة

تحقيق التخزين متعدد البتات

  • الحالة '0': M2 في حالة VTH1، M1 في حالة VTH0
  • الحالة '1': كل من M1 و M2 في حالة VTH1 (تكوين التثبيت)
  • الحالة '2' وما فوق: M1 في حالات VTH مختلفة، M2 مغلق

نقاط الابتكار التقني

1. هيكل تثبيت 2FeFET

عند حالة التخزين '1':
- M1 و M2 يشكلان مقسم جهد
- جهد العقدة الوسيطة VS يتم تثبيته بثبات
- تقليل كبير في تأثيرات الانجراف الحراري

2. آلية التعويض الحراري CTAT

معادلة تسرب التيار في منطقة ما تحت العتبة:

ID = I0 * exp(Vgs / (ξVT))
حيث VT = kT/q

آلية التغذية الراجعة الحرارية:

  • ارتفاع درجة الحرارة → زيادة تسرب التيار في M1 → ارتفاع جهد VS → زيادة تيار الإخراج M3
  • لكن بسبب خصائص CTAT، يتم كبح زيادة التيار، مما يقلل من تذبذب الإخراج

3. تصميم المصفوفة

  • بنية 8 صفوف × أعمدة متعددة: تدعم عمليات MAC متوازية
  • ADC فلاش: استخدام مضخم استشعار التيار لتقليل تأخير الاستشعار
  • ADC مشترك: 8 أعمدة تشترك في ADC 3-بت واحد، توازن بين المساحة والأداء

إعداد التجارب

بيئة المحاكاة

  • محاكاة SPICE: استخدام نموذج Intel FinFET ونموذج Preisach المدمج لـ FeFET
  • إطار عمل NeuroSim: تعديل يدعم FeFET تحت العتبة وتأثيرات درجات الحرارة
  • عقدة العملية: عقدة تكنولوجية 45nm
  • جهد الإمداد: تصميم تحت العتبة Vdd=0.8V، تصميم التشبع Vdd=1.0V

مجموعات البيانات

  • الشبكة العصبية: معمارية VGG-8
  • مجموعة البيانات: CIFAR-10
  • بنية الشبكة: 6 طبقات التفافية + طبقتا متصلتان بالكامل
  • التكميم: استخدام نموذج WAGE للتكميم على مستوى الأجهزة

مؤشرات التقييم

  1. الصمود في درجات الحرارة: معدل هامش الضوضاء (NMR) والحد الأدنى من NMR
  2. الدقة: دقة استدلال الشبكة العصبية
  3. كفاءة الطاقة: TOPS/W (تريليون عملية لكل واط)
  4. المساحة: معدل استخدام مساحة الرقاقة
  5. الإنتاجية: سرعة العملية الحسابية

الطرق المقارنة

  • 1FeFET-1R: تصميم FeFET أساسي واحد
  • 2T-1FeFET: تصميم قابل للصمود في درجات الحرارة الحالي
  • تقنيات NVM أخرى: RRAM وPCM وغيرها

نتائج التجارب

النتائج الرئيسية

التحقق من الصمود في درجات الحرارة

  • TReCiM 1-بت: NMRmin = 0.291 (0-85°C)، NMRmin = 2.6 (20-85°C)
  • تحسن الصمود في درجات الحرارة: تحسن بمعامل 3 مرات مقارنة بتصميم 1FeFET-1R
  • مقارنة مع 2T-1FeFET: تحسن بمعامل 1.06 مرات

أداء الشبكة العصبية

خطة التصميمالدقةكفاءة الطاقة (TOPS/W)عرض البت
TReCiM (1-بت)92.00%26.061
TReCiM (2-بت)91.31%48.032
2T-1FeFET~89.45%~21.01
1FeFET-1R (تحت العتبة)<85%~15.01

التجارب الاستئصالية

تأثير تباين العملية

  • محاكاة مونت كارلو: 500 عملية تشغيل، σVT = 54mV
  • الحالة '1': دقة 100%، التباين فقط 3.89%
  • الحالة '2': التباين 20.8%
  • الحالة '3': التباين 17.1%

تحليل الخصائص الحرارية

حساسية درجة الحرارة لحالات التخزين المختلفة:

  • الحالة '1': انجراف درجة الحرارة مهمل (تأثير التثبيت)
  • الحالة '2': أقصى تذبذب 32.9%
  • الحالة '3' وما فوق: مع انخفاض VTH، تقل حساسية درجة الحرارة

دراسة الحالة

في شبكة VGG-8، توزيع الأوزان هو:

  • الوزن '0': 27.2%
  • الوزن '1': 24.1%
  • الوزن '2': 23.5%
  • الوزن '3': 25.2%

معدل التباين المدمج 13.9%، مع دقة استدلال نهائية تبلغ 91.31%.

الأعمال ذات الصلة

تطور تقنية CiM

  1. تقنيات NVM: تطبيقات ReRAM و PCM و FeFET في CiM
  2. الحساب تحت العتبة: تقليل الطاقة لكن زيادة حساسية درجة الحرارة
  3. تصميم قابل للصمود في درجات الحرارة: الحلول الحالية تركز بشكل أساسي على TCAM وبنى CiM البسيطة

الحالة الحالية لبحث FeFET

  1. نمذجة الأجهزة: نماذج NCFET و Preisach ومونت كارلو وغيرها
  2. التطبيقات الدائرية: تركز بشكل أساسي على الذاكرة والوحدات الحسابية البسيطة
  3. التأثيرات الحرارية: عدد قليل من الدراسات تركز على تأثير درجة الحرارة على أداء FeFET

مزايا هذه الورقة

مقارنة بالأعمال الحالية، تحقق هذه الورقة للمرة الأولى:

  • تصميم CiM قابل للصمود في درجات الحرارة مع التخزين متعدد البتات
  • نمذجة وتحقق شامل من التأثيرات الحرارية على مستوى النظام
  • تقييم كامل في تطبيقات الشبكات العصبية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. الجدوى التقنية: ينجح هيكل 2FeFET-1T في تحقيق الصمود في درجات الحرارة والتخزين متعدد البتات
  2. مزايا الأداء: تحسن كبير في الصمود في درجات الحرارة مع الحفاظ على الطاقة المنخفضة
  3. القيمة على مستوى النظام: التحقق من فعالية التصميم في تطبيقات الشبكات العصبية الفعلية

القيود

  1. حساسية الحالات الجزئية: حالات التخزين '2' وما فوق لا تزال لديها حساسية معينة لدرجة الحرارة
  2. الاعتماد على العملية: يعتمد الأداء على نضج عملية جهاز FeFET
  3. تكلفة ADC: يتطلب التصميم متعدد البتات ADC بدقة أعلى، مما يزيد من المساحة والطاقة
  4. نطاق درجات الحرارة: بينما يغطي 0-85°C، لا تزال الأداء تنخفض في درجات الحرارة القصوى

الاتجاهات المستقبلية

  1. تحسين الأجهزة: تحسين خصائص جهاز FeFET بشكل أكبر لتقليل حساسية درجة الحرارة
  2. تحسينات الدوائر: استكشاف تصاميم قابلة للصمود في درجات الحرارة لتخزين عرض بت أعلى
  3. التكامل على مستوى النظام: الدمج مع أجهزة استشعار درجة الحرارة على الرقاقة لتحقيق التعويض الديناميكي
  4. توسيع التطبيقات: التحقق من تأثير التصميم في المزيد من سيناريوهات تطبيقات الذكاء الاصطناعي

التقييم المتعمق

المزايا

  1. ابتكار قوي: أول تصميم FeFET CiM متعدد البتات قابل للصمود في درجات الحرارة، مع مسار تقني جديد
  2. أساس نظري متين: آلية التعويض الحراري بناءً على خصائص CTAT لها أساس فيزيائي قوي
  3. تحقق شامل: سلسلة تحقق كاملة من مستوى الجهاز إلى مستوى النظام
  4. قيمة عملية: إثبات قيمة التصميم في تطبيقات الشبكات العصبية الفعلية
  5. أداء ممتازة: كفاءة الطاقة والدقة كلاهما يصل إلى مستويات متقدمة

أوجه القصور

  1. تعويض حراري محدود: لحالات التخزين عالية البت، فعالية التعويض الحراري محدودة
  2. زيادة التعقيد: هيكل 2FeFET يزيد من تعقيد التصميم مقارنة بـ FeFET الواحد
  3. متطلبات العملية: متطلبات عالية لاتساق جهاز FeFET
  4. قابلية التوسع: يحتاج أداء التصميم في أحجام المصفوفات الأكبر إلى مزيد من التحقق

التأثير

  1. القيمة الأكاديمية: توفير مسار تقني جديد لتصميم CiM قابل للصمود في درجات الحرارة
  2. الأهمية الصناعية: ذات أهمية مرجعية كبيرة لتصميم رقائق الذكاء الاصطناعي على الحافة
  3. دفع التكنولوجيا: تعزيز تطور تقنية FeFET في تطبيقات مسرعات الذكاء الاصطناعي

السيناريوهات المعمول بها

  1. الذكاء الاصطناعي على الحافة: تطبيقات الاستدلال الحساسة للطاقة
  2. أجهزة إنترنت الأشياء: بيئات إنترنت الأشياء ذات تغيرات درجات الحرارة الكبيرة
  3. الحوسبة المحمولة: الأجهزة المحمولة ذات متطلبات كفاءة الطاقة العالية جداً
  4. التحكم الصناعي: التطبيقات الصناعية التي تتطلب العمل في نطاق درجات حرارة واسع

المراجع

تستشهد الورقة بـ 42 مرجعاً ذا صلة، تغطي تقنية CiM وأجهزة FeFET والتأثيرات الحرارية ومسرعات الشبكات العصبية وغيرها، مما يوفر أساساً نظرياً متيناً للبحث. تشمل المراجع الرئيسية إطار عمل NeuroSim ونمذجة FeFET والأعمال المتعلقة بتصميم CiM.


التقييم الشامل: هذه ورقة عالية الجودة تحقق مساهمات مهمة في مجال تصميم CiM قابل للصمود في درجات الحرارة. مسار الورقة التقني واضح، والتحقق التجريبي شامل، وله أهمية كبيرة في دفع تطبيق FeFET في مسرعات الذكاء الاصطناعي. بينما لا تزال هناك مجالات للتحسين في بعض الجوانب، فإن الورقة ككل تمثل تقدماً مهماً في هذا المجال.