2025-11-12T19:19:10.759650

On-chip rewritable phase-change metasurface for programmable diffractive deep neural networks

Zarei
Photonic neural networks capable of rapid programming are indispensable to realize many functionalities. Phase change technology can provide nonvolatile programmability in photonic neural networks. Integrating direct laser writing technique with phase change material (PCM) can potentially enable programming and in-memory computing for on-chip photonic neural networks. Sb2Se3 is a newly introduced ultralow-loss phase change material with a large refractive index contrast over the telecommunication transmission band. Compact, low-loss, rewritable, and nonvolatile on-chip phase-change metasurfaces can be created by using direct laser writing on a Sb2Se3 thin film. Here, by cascading multiple layers of on-chip phase-change metasurfaces, an ultra-compact on-chip programmable diffractive deep neural network is demonstrated at the wavelength of 1.55um and benchmarked on two machine learning tasks of pattern recognition and MNIST (Modified National Institute of Standards and Technology) handwritten digits classification and accuracies comparable to the state of the art are achieved. The proposed on-chip programmable diffractive deep neural network is also advantageous in terms of power consumption because of the ultralow-loss of the Sb2Se3 and its nonvolatility which requires no constant power supply to maintain its programmed state.
academic

سطح فوقي قابل لإعادة الكتابة متغير الطور على الرقاقة لشبكات عصبية حيود عميقة قابلة للبرمجة

المعلومات الأساسية

  • معرّف الورقة: 2411.05723
  • العنوان: On-chip rewritable phase-change metasurface for programmable diffractive deep neural networks
  • المؤلف: Sanaz Zarei (جامعة شريف للتكنولوجيا)
  • التصنيف: physics.optics
  • تاريخ النشر: نوفمبر 2024
  • رابط الورقة: https://arxiv.org/abs/2411.05723

الملخص

تقترح هذه الورقة تقنية سطح فوقي قابل لإعادة الكتابة على الرقاقة بناءً على مواد متغيرة الطور (PCM) لتحقيق شبكات عصبية حيود عميقة قابلة للبرمجة. من خلال دمج تقنية الكتابة بالليزر المباشر مع مادة Sb2Se3 متغيرة الطور منخفضة الفقدان للغاية، تم بناء سطح فوقي متغير الطور على الرقاقة مضغوط وقليل الفقدان وقابل لإعادة الكتابة وغير متطاير. من خلال تسلسل طبقات متعددة من الأسطح الفوقية متغيرة الطور على الرقاقة، تم تحقيق شبكة عصبية حيود عميقة قابلة للبرمجة على الرقاقة فائقة الضغط عند طول موجة 1.55 ميكرومتر، مع تحقيق دقة مماثلة للتقنيات الموجودة في مهام التعرف على الأنماط وتصنيف أرقام MNIST المكتوبة بخط اليد.

الخلفية البحثية والدافع

تعريف المشكلة

  1. الطلب المدفوع: تتطلب الشبكات العصبية الفوتونية قدرة برمجة سريعة لتحقيق وظائف متعددة، لكن الحلول الموجودة تفتقر إلى قابلية إعادة التكوين الفعالة
  2. التحديات التقنية: تفتقر الشبكات العصبية الفوتونية التقليدية إلى القدرة على البرمجة غير المتطايرة، وتتطلب إمدادًا كهربائيًا مستمرًا للحفاظ على الحالة
  3. قيود المواد: تتمتع مواد متغيرة الطور الموجودة بفقدان عالي في نطاق الاتصالات، مما يحد من أداء الجهاز

أهمية البحث

  • تتمتع الشبكات العصبية الفوتونية بمزايا استهلاك طاقة منخفض وتوازي عالي ومعالجة إشارات بسرعة الضوء، وهي مرشح لمنصات الحوسبة من الجيل التالي
  • القابلية للبرمجة هي تقنية أساسية لتحقيق شبكات عصبية فوتونية متعددة الوظائف
  • التكامل على الرقاقة شرط ضروري لتحقيق الحوسبة الفوتونية العملية

حدود الطرق الموجودة

  • تتمتع الشبكات العصبية الفوتونية التقليدية بهيكل ثابت وتفتقر إلى المرونة
  • تتطلب أنظمة إعادة التكوين الموجودة إمدادًا كهربائيًا مستمرًا، مما يزيد من استهلاك الطاقة
  • تتمتع مواد متغيرة الطور عادةً بفقدان عالي في نطاق الاتصالات

المساهمات الأساسية

  1. الاقتراح الأول لتقنية سطح فوقي قابل لإعادة الكتابة على الرقاقة بناءً على مادة Sb2Se3 متغيرة الطور لشبكات عصبية حيود عميقة
  2. تحقيق شبكة عصبية حيود عميقة قابلة للبرمجة على الرقاقة فائقة الضغط (30 ميكرومتر × 40 ميكرومتر)
  3. التحقق من دقة 100% في مهام التعرف على الأنماط، ودقة 91.86% في مهام تصنيف أرقام MNIST
  4. توفير حل شبكة عصبية فوتونية غير متطاير وقليل الطاقة
  5. إنشاء طريقة إعادة برمجة سريعة تجمع بين الكتابة بالليزر المباشر ومواد متغيرة الطور

شرح الطريقة

تعريف المهمة

بناء شبكة عصبية حيود قابلة لإعادة الكتابة على الرقاقة لتحقيق مهام تصنيف الصور. الإدخال عبارة عن بيانات صور معالجة مسبقًا، والإخراج عبارة عن توزيع احتمالي لنتائج التصنيف.

البنية التقنية الأساسية

تصميم السطح الفوقي متغير الطور

  • اختيار المادة: استخدام Sb2Se3 كمادة متغيرة الطور، مع فقدان منخفض للغاية ونسبة معامل انكسار عالية
  • تصميم الهيكل: بناء مصفوفة قضبان Sb2Se3 غير متبلورة (aSb2Se3) في غشاء Sb2Se3 متبلور (cSb2Se3)
  • المعاملات الهندسية: ثابت الشبكة 500 نانومتر، سمك غشاء Sb2Se3 30 نانومتر، طبقة حماية SiO2 200 نانومتر
  • المعاملات القابلة للتعديل: التحكم في الطور والسعة المرسلة من خلال تعديل طول وعرض قضبان aSb2Se3

بنية الشبكة

طبقة الإدخال → سطح فوقي متغير الطور 1 → سطح فوقي متغير الطور 2 → ... → سطح فوقي متغير الطور N → طبقة الإخراج
  • الطبقات المخفية: كل طبقة عبارة عن سطح فوقي متغير الطور يحتوي على عناصر ميتا متعددة (خلايا عصبية)
  • طريقة الاتصال: تحقيق الاتصال بين الطبقات من خلال حيود وتداخل الضوء
  • طبقة الإخراج: مناطق كشف مرتبة خطيًا متعددة

نقاط الابتكار التقني

  1. الابتكار في المواد:
    • استخدام مادة Sb2Se3 متغيرة الطور بفقدان منخفض للغاية في نطاق الاتصالات
    • نسبة معامل انكسار عالية (غير متبلورة مقابل متبلورة) توفر قدرة تعديل قوية
  2. عملية التحضير:
    • تحقيق التحضير والبرمجة بخطوة واحدة باستخدام تقنية الكتابة بالليزر المباشر
    • لا تتطلب عمليات تصنيع إضافية، يمكن تصحيح الأخطاء والتعديل محليًا
  3. تحسين التصميم:
    • طول القضيب كمعامل قابل للتعلم، يحقق تعديل طور يتجاوز π/2
    • السعة المرسلة قريبة من 1، مما يحافظ على كفاءة عالية
  4. عدم التطاير:
    • حالة متغيرة الطور مستقرة، لا تتطلب إمدادًا كهربائيًا مستمرًا للحفاظ على حالة البرمجة

الإعداد التجريبي

مجموعات البيانات

  1. مهام التعرف على الأنماط:
    • صور ثنائية القيمة بحجم 10×6 بكسل للأحرف الإنجليزية X و Y و Z
    • توليد 5490 صورة من خلال قلب عشوائي لبكسل واحد وثنائي البكسل
    • مجموعة التدريب 4590 صورة، مجموعة الاختبار 900 صورة
  2. تصنيف أرقام MNIST:
    • أرقام MNIST المكتوبة بخط اليد 0 و 1 و 2
    • مجموعة التدريب 18623 صورة، مجموعة الاختبار 3147 صورة
    • صور رمادية بحجم 28×28 بكسل تم تقليل عينتها إلى 14×14 بكسل

مؤشرات التقييم

  • الدقة: عدد العينات المصنفة بشكل صحيح / إجمالي عدد العينات
  • درجة المطابقة: نسبة التطابق بين نتائج المحاكاة الرقمية والتحقق من FDTD

أدوات المحاكاة

  • المحاكاة الرقمية: خوارزمية انتشار الخطأ العكسي بناءً على طريقة التدرج المرافق
  • أداة التحقق: محلل FDTD المتغير 2.5D من Lumerical Mode Solution
  • طول الموجة التشغيلي: طول موجة الاتصالات 1.55 ميكرومتر

تكوين الشبكة

شبكة التعرف على الأنماط

  • 5 طبقات من الأسطح الفوقية متغيرة الطور، 60 عنصر ميتا لكل طبقة
  • طول السطح الفوقي 30 ميكرومتر، المسافة بين الطبقات 8 ميكرومتر
  • إجمالي حجم الجهاز 30 ميكرومتر × 40 ميكرومتر

شبكة تصنيف الأرقام

  • 3 طبقات من الأسطح الفوقية متغيرة الطور، 196 عنصر ميتا لكل طبقة
  • طول السطح الفوقي 98 ميكرومتر، المسافة بين الطبقات 7 ميكرومتر
  • إجمالي حجم الجهاز 98 ميكرومتر × 21 ميكرومتر

النتائج التجريبية

النتائج الرئيسية

مهام التعرف على الأنماط

  • أداء التدريب: تحقيق دقة تدريب 100% في 3 حقب فقط
  • دقة الاختبار: دقة اختبار عمياء 100%
  • التحقق من FDTD: درجة مطابقة 98.8% (90 عينة اختبار عشوائية)

تصنيف أرقام MNIST

  • أداء التدريب: دقة تدريب 92.38% بعد 140 حقبة
  • دقة الاختبار: دقة اختبار عمياء 91.86%
  • التحقق من FDTD: درجة مطابقة 92% (100 عينة اختبار عشوائية)

التجارب الاستئصالية

تم إجراء تحليل منهجي لأداء الشبكات ذات الطبقات المختلفة:

  • شبكة بطبقة واحدة: دقة 86.30%، مطابقة 98%
  • شبكة بطبقتين: تحسن الأداء
  • شبكة بثلاث طبقات: دقة 91.86%، مطابقة 92%
  • شبكة بأربع طبقات: دقة 94.43% (الأفضل)
  • شبكة بخمس طبقات: دقة 92.50%، مطابقة 91%

الاكتشاف: تحقق شبكة بأربع طبقات أفضل أداء، وقد تؤدي الطبقات الإضافية إلى الإفراط في التدريب.

التحقق التقني

  1. نطاق تعديل الطور: تحقيق تعديل طور يتجاوز π/2 من خلال تعديل طول القضيب (300 نانومتر - 4 ميكرومتر)
  2. كفاءة النقل: السعة المرسلة قريبة من 1، مما يحافظ على كفاءة بصرية عالية
  3. تحمل التصنيع: يُظهر التحقق من FDTD تحملاً جيدًا للتصنيع والاستقرار

الأعمال ذات الصلة

الفوتونيات متغيرة الطور

  • عرض Delaney وآخرون أولاً تطبيق Sb2Se3 في أجهزة فوتونية
  • قام Blundell وآخرون بتحسين سمك غشاء Sb2Se3 لتعزيز تأثير التعديل
  • دمج Wu وآخرون التصميم العكسي مع الكتابة بالليزر المباشر لتحقيق أجهزة قابلة لإعادة التكوين

الشبكات العصبية الفوتونية

  • اقترح Wang وآخرون شبكة عصبية حيود فوتونية على الرقاقة بناءً على مصفوفة نقل عالية التباين
  • حقق Fu وآخرون تعلم آلي بصري حيود على الرقاقة
  • عرض Yan وآخرون تعلم تمثيل الرسوم البيانية الضوئية الكامل مع وحدات حوسبة حيود فوتونية متكاملة

مقارنة المزايا التقنية

المزايا الرئيسية للعمل الحالي مقارنة بالأعمال الموجودة:

  1. الجمع الأول بين مادة Sb2Se3 متغيرة الطور وشبكات عصبية حيود عميقة
  2. تحقيق قدرة برمجة غير متطايرة حقيقية
  3. حجم جهاز فائق الضغط وخصائص منخفضة الطاقة

الاستنتاج والمناقشة

الاستنتاجات الرئيسية

  1. الجدوى التقنية: التحقق الناجح من شبكة عصبية حيود عميقة قابلة للبرمجة على الرقاقة بناءً على سطح فوقي Sb2Se3 متغير الطور
  2. الأداء: تحقيق دقة مماثلة للتقنيات الموجودة في مهام التعرف على الأنماط وتصنيف الأرقام
  3. المزايا العملية: تحقيق شبكة عصبية فوتونية غير متطايرة وقليلة الطاقة وقابلة لإعادة الكتابة

القيود

  1. تعقيد المهام: التحقق الحالي فقط من مهام تصنيف نسبية بسيطة (3 فئات)
  2. حجم الجهاز: حجم الشبكة نسبي صغير، والقابلية للتوسع تحتاج إلى التحقق
  3. دقة التصنيع: قد تؤثر قيود الدقة في التصنيع الفعلي على الأداء
  4. استقرار درجة الحرارة: يحتاج استقرار درجة حرارة مادة متغيرة الطور إلى مزيد من الدراسة

الاتجاهات المستقبلية

  1. توسيع التطبيقات: استكشاف مهام تعلم آلي أكثر تعقيدًا وشبكات أكبر حجمًا
  2. تحسين التكامل: التكامل الهجين مع الدوائر الإلكترونية
  3. عملية التصنيع: تحسين معاملات الكتابة بالليزر وتدفق العملية
  4. التكامل النظامي: تطوير نظام حوسبة فوتونية كامل

التقييم المتعمق

المزايا

  1. ابتكار قوي:
    • التطبيق الأول لمادة Sb2Se3 متغيرة الطور في شبكات عصبية حيود عميقة
    • الجمع المبتكر بين الكتابة بالليزر المباشر وتقنية متغيرة الطور
  2. مزايا تقنية واضحة:
    • الخصائص غير المتطايرة تقلل بشكل كبير من استهلاك الطاقة
    • التصميم فائق الضغط مناسب للتكامل على الرقاقة
    • الخصائص القابلة لإعادة الكتابة توفر مرونة كبيرة
  3. التحقق التجريبي الشامل:
    • التطابق العالي بين المحاكاة الرقمية والتحقق من FDTD
    • التحقق من التعميم التقني على مهام متعددة
    • تحليل تجريبي استئصالي منهجي
  4. قيمة عملية عالية:
    • العمل عند طول موجة الاتصالات، متوافق مع أنظمة الاتصالات البصرية الموجودة
    • عملية تصنيع بسيطة، تكلفة منخفضة نسبيًا

أوجه القصور

  1. نطاق التطبيق محدود:
    • التحقق فقط من مهام تصنيف بسيطة بـ 3 فئات
    • نقص التحقق من المهام المعقدة
  2. تحليل نظري غير كافٍ:
    • نقص التحليل النظري لسعة الشبكة وقدرة التعبير
    • تحليل التقارب لخوارزمية التحسين غير عميق بما فيه الكفاية
  3. اعتبارات التصنيع العملي:
    • عدم الأخذ الكافي في الاعتبار لتأثير أخطاء التصنيع على الأداء
    • نقص تحليل الجدوى للتصنيع على نطاق واسع
  4. اعتبارات المستوى النظامي غير كافية:
    • نقص خطة التكامل مع واجهات الإدخال/الإخراج
    • عدم الأخذ في الاعتبار لإمكانية معالجة متعددة الأطوال الموجية بالتوازي

التأثير

  1. المساهمة الأكاديمية:
    • فتح اتجاه تطبيق جديد لمواد متغيرة الطور في الشبكات العصبية الفوتونية
    • توفير أفكار جديدة للحوسبة الفوتونية القابلة لإعادة التكوين
  2. الدفع التقني:
    • تعزيز عملية تطبيق الشبكات العصبية الفوتونية على الرقاقة
    • توفير حل للحوسبة الفوتونية منخفضة الطاقة
  3. الآفاق الصناعية:
    • إمكانية التطبيق في الاتصالات البصرية ومعالجة الصور والحوسبة الطرفية وغيرها
    • قد تحفز منتجات حوسبة فوتونية جديدة

السيناريوهات المعمول بها

  1. الحوسبة الطرفية: التعرف على الصور والمعالجة في الوقت الفعلي منخفضة الطاقة
  2. الاتصالات البصرية: معالجة الإشارات البصرية الكاملة والتوجيه
  3. أنظمة الاستشعار: معالجة الإشارات الذكية لأجهزة استشعار بصرية
  4. أدوات البحث: منصة تجريبية بصرية قابلة لإعادة التكوين

المراجع

تستشهد هذه الورقة بأعمال مهمة في مجالات الفوتونيات متغيرة الطور والشبكات العصبية الفوتونية، بما في ذلك:

  1. Wu et al. (2024) - العمل الرائد في تقنية الكتابة بالليزر المباشر Sb2Se3
  2. Delaney et al. (2021) - أول تطبيق لـ Sb2Se3 في أجهزة فوتونية
  3. Wang et al. (2022) - عمل أساسي مهم في الشبكات العصبية الحيود على الرقاقة
  4. Fu et al. (2023) - البحث ذي الصلة في تعلم الآلة البصري الحيود على الرقاقة

التقييم الشامل: هذه ورقة عالية الجودة تحقق مساهمات مهمة في المجال المتقاطع بين مواد متغيرة الطور والشبكات العصبية الفوتونية. على الرغم من وجود مجال للتحسن في تعقيد التطبيقات والتحليل النظري، فإن ابتكاريتها وقيمتها العملية تجعلها تقدمًا مهمًا في هذا المجال.