We propose a transfer learning-enabled Transformer framework to simultaneously realize accurate modeling and Raman pump design in C+L-band systems. The RMSE for modeling and peak-to-peak GSNR variation/deviation is within 0.22 dB and 0.86/0.1 dB, respectively.
- معرّف الورقة: 2510.09047
- العنوان: التعلم الانتقالي لضبط مضخة رامان الفعال تحت قوة الإطلاق الديناميكية لنقل نطاق C+L
- المؤلفون: Jiaming Liu, Hong Lin, Rui Wang, Jing Zhang, JinJiang Li, Kun Qiu (جامعة العلوم والتكنولوجيا الإلكترونية بالصين)
- التصنيف: eess.SP (معالجة الإشارات)
- وقت النشر/المؤتمر: 2025 (استنتاج من المراجع)
- رابط الورقة: https://arxiv.org/abs/2510.09047
تقترح هذه الورقة إطار عمل قائم على Transformer مع التعلم الانتقالي لتحقيق النمذجة الدقيقة وتصميم مضخة رامان في أنظمة نطاق C+L. يبلغ جذر متوسط الخطأ التربيعي (RMSE) للنمذجة أقل من 0.22 ديسيبل، مع تغيير وانحراف GSNR من الذروة إلى الذروة أقل من 0.86/0.1 ديسيبل على التوالي.
- المشكلة المراد حلها: مع نمو متطلبات النطاق الترددي، تحتاج أنظمة نقل نطاق C+L إلى معالجة عدم التجانس في الأداء الناجم عن تأثير التشتت رامان المحفز (SRS). يؤدي تأثير SRS إلى نقل الطاقة من الترددات العالية إلى المنخفضة، مما يؤثر على اتساق الأداء بين القنوات المختلفة ويحد من زيادة السعة الإجمالية.
- أهمية المشكلة: التوسع إلى نطاق C+L هو استراتيجية قابلة للتطبيق واقتصادية دون الحاجة إلى استبدال البنية التحتية للألياف البصرية الموجودة. يوفر مضخم رامان (RA) توزيع كسب تعسفي وخصائص ضوضاء منخفضة، مما يجعله التكنولوجيا الرئيسية لحل هذه المشكلة.
- قيود الطرق الموجودة:
- صعوبة نمذجة مضخم رامان، تتضمن مجموعات معادلات تفاضلية عادية معقدة بدون حلول تحليلية
- اختيار أطوال موجات المضخة والقوة يؤثر بشكل كبير على توزيع الكسب والضوضاء ASE والتداخل غير الخطي
- تتطلب طرق التعلم الآلي الموجودة تدريب نماذج متخصصة لكل سيناريو محدد، مما يفتقر إلى القدرة على التعميم
- دافع البحث: تطوير إطار عمل عام يمكنه تحقيق نمذجة عالية الدقة وتحسين فعال تحت ظروف قوة الإطلاق الديناميكية، لتحسين اتساق الأداء في أنظمة نطاق C+L.
- اقتراح إطار عمل Transformer قائم على التعلم الانتقالي يحقق نمذجة مضخم رامان وتحسين المضخة بشكل متزامن
- تصميم معمارية مشفر-فاك تستفيد من آلية الانتباه الذاتي لتحسين دقة النمذجة، مما يحقق الحساب العكسي دون الحاجة إلى خوارزميات تحسين إضافية
- تطوير استراتيجية تعلم انتقالي ثنائية المرحلة تتكيف مع ظروف قوة الإطلاق المختلفة باستخدام 10% فقط من مجموعة البيانات الأصلية
- تحقيق أداء عالية الدقة: RMSE < 0.22 ديسيبل في 90% من الحالات، مع تغيير GSNR من الذروة إلى الذروة < 0.86 ديسيبل بعد التحسين
- الإدخال: توزيع قوة مضخة رامان أو توزيع GSNR المستهدف
- الإخراج: توزيع GSNR المقابل أو تكوين قوة المضخة المحسّن
- القيود: الحفاظ على اتساق الأداء تحت ظروف قوة الإطلاق الديناميكية
يستخدم النموذج استراتيجية تدريب ثنائية المرحلة:
- مرحلة النمذجة الأمامية: تدريب المشفر للتنبؤ بتوزيع GSNR في ظل قوة مضخة معينة
- مرحلة التحسين العكسي: تجميد النموذج الأمامي، تدريب فاك لتوليد قوة مضخة مثلى من GSNR المستهدف
تتضمن دالة الخسارة للنموذج العكسي مكونين:
Loss=MSE(GSNRinput,GSNRestimated)+MSE(Poweroutput,Powerestimated)
حيث يُعرّف MSE على النحو التالي:
MSE=N1∑i=1N(∣Xgenerated,i−Xreal,i∣2)
- المشفر: طبقتان، بُعد النموذج dmodel=32
- شبكة التغذية الأمامية: حجم الطبقة المخفية 128
- الانتباه متعدد الرؤوس: 4 رؤوس انتباه
- معالجة الإخراج: توليد التنبؤ النهائي من خلال MLP بطبقتين
- تجميد طبقة استخراج الميزات: تجميد معاملات طبقة التضمين والترميز الموضعي ووحدات الانتباه متعدد الرؤوس
- ضبط طبقة التكيف: الحفاظ على قابلية تدريب الطبقات اللاحقة للتكيف مع ظروف قوة الإطلاق الجديدة
- إدخال دالة تفعيل LeakyReLU وطبقة خطية إضافية في مكونات MLP
- استخدام معدل تعلم صغير لنقل معرفة مستقر
- الحاجة إلى 10% فقط من بيانات المجال المستهدف للضبط الدقيق
- تكوين النطاق: نطاق C (191.0-197.0 THz) ونطاق L (184.5-190.5 THz)، 50 قناة لكل منهما
- تباعد القنوات: 100 GHz، معدل الرمز 96 GBaud
- النطاق الحامي: 500 GHz بين نطاقات C و L
- معاملات الألياف: 80 كم من ألياف الوضع الفردي القياسية ITU-T G.652.D
- خصائص الضوضاء: NF = 5 ديسيبل لنطاق C، NF = 6 ديسيبل لنطاق L
- حجم البيانات: 4000 تكوين مضخة مختلف، 70% للتدريب، 30% للاختبار
- عدد المضخات: 5
- أطوال موجات المضخة: 1455, 1469, 1484, 1498, 1514 نانومتر
- نطاق القوة: 0-200 ميلي وات موزعة بشكل منتظم
- المحسّن: Adam، معدل التعلم الأولي 1×10⁻³
- حجم الدفعة: 256
- أقصى عدد حقب: 1000 (استراتيجية الإيقاف المبكر)
- جدولة معدل التعلم: ReduceLROnPlateau
- أداء RMSE: RMSE < 0.22 ديسيبل في 90% من الحالات
- التوزيع الاحتمالي: تم التحقق من دقة التنبؤ العالية للنموذج من خلال PDF و CDF
تحت ظروف قوة إطلاق مختلفة (-4 ديسيبل إلى 2 ديسيبل):
- تغيير الذروة إلى الذروة: < 0.86 ديسيبل (100 قناة)
- الانحراف المتوسط: < 0.1 ديسيبل (نسبة إلى GSNR المستهدف)
- تغطية الطيف: 10.3 THz لنطاق C+L
- كفاءة البيانات: تحقيق نقل فعال باستخدام 10% فقط من بيانات المجال المستهدف
- القدرة على التكيف: التكيف الناجح مع ظروف قوة الإطلاق 2 ديسيبل و -2 ديسيبل
- الحفاظ على الأداء: الحفاظ على القدرة على النمذجة والتحسين عالية الدقة بعد النقل
- آلية الانتباه الذاتي في Transformer تلتقط بشكل فعال العلاقة المعقدة بين قوة المضخة و GSNR
- تحقق معمارية المشفر-فاك النمذجة ثنائية الاتجاه دون الحاجة إلى خوارزميات تحسين إضافية
- يحسّن التعلم الانتقالي بشكل كبير من قدرة النموذج على التعميم تحت قوة إطلاق مختلفة
- أنظمة النقل البصري متعدد النطاقات: تقنيات توسيع نطاق C+L
- تحسين مضخم رامان: تسطيح الكسب وتحسين الضوضاء
- تطبيقات التعلم الآلي: نمذجة الشبكات العصبية والخوارزميات الحسابية
- مقارنة بطرق ANN التقليدية، يتمتع Transformer بقدرة نمذجة تسلسلية أقوى
- تحسّن استراتيجية التعلم الانتقالي بشكل كبير من قابلية التكيف وكفاءة البيانات
- يحل الإطار من طرف إلى طرف مشاكل النمذجة والتحسين بشكل متزامن
- يُظهر إطار عمل Transformer القائم على التعلم الانتقالي المقترح أداءً ممتازاً في تحسين مضخة رامان لنطاق C+L
- تحقيق نمذجة عالية الدقة (RMSE < 0.22 ديسيبل في 90% من الحالات) وتحسين فعال
- تمكّن استراتيجية التعلم الانتقالي النموذج من التكيف الفعال مع ظروف قوة الإطلاق الديناميكية
- أُجريت التجارب فقط في بيئة محاكاة، مع نقص التحقق من الأنظمة الفعلية
- قد يحد تعقيد النموذج من التطبيقات في الوقت الفعلي
- يعتمد تأثير التعلم الانتقالي على التشابه بين المجال المصدر والمجال المستهدف
- التحقق من أداء الإطار في أنظمة النقل البصري الفعلية
- التوسع إلى نطاقات أكثر وطوبولوجيات شبكة أكثر تعقيداً
- تحسين بنية النموذج لزيادة كفاءة الحساب
- الابتكار التكنولوجي: أول تطبيق لـ Transformer والتعلم الانتقالي في تحسين مضخم رامان
- اكتمال الطريقة: إطار عمل من طرف إلى طرف يحل مشاكل النمذجة والتحسين بشكل متزامن
- كفاية التجارب: إعداد معاملات وتقييم أداء مفصل
- القيمة العملية: تحسين كبير في كفاءة البيانات (الحاجة إلى 10% فقط من البيانات للنقل)
- قيود التحقق: نقص التحقق من التجارب على الأنظمة الفعلية
- عدم كفاية المقارنة: عدم إجراء مقارنة كافية مع طرق التعلم الآلي المتقدمة الأخرى
- التحليل النظري: نقص التفسير النظري لتأثير التعلم الانتقالي
- المساهمة الأكاديمية: إدخال نموذج جديد من التعلم الآلي لمجال الاتصالات البصرية
- القيمة العملية: توفير أداة عملية لتحسين أنظمة نطاق C+L
- قابلية التكرار: يسهل الإعداد التجريبي المفصل إعادة إنتاج النتائج
- تصميم مضخم رامان لأنظمة النقل البصري لنطاق C+L
- تحسين معاملات المضخة تحت ظروف الشبكة الديناميكية
- توحيد الأداء في الشبكات البصرية متعددة النطاقات
تستشهد الورقة بـ 8 مراجع ذات صلة، تغطي الأعمال المهمة في مجالات النقل متعدد النطاقات ومضخم رامان وتطبيقات التعلم الآلي، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الشامل: هذه ورقة ذات ابتكار تكنولوجي قوي، تطبق تقنيات التعلم الآلي المتقدمة على تحسين أنظمة الاتصالات البصرية، مع اكتمال معقول في تصميم الطريقة والتحقق التجريبي. على الرغم من نقص التحقق من الأنظمة الفعلية، فإنها توفر مسار تكنولوجي قيم لتطور هذا المجال.