We propose a transfer learning-enabled Transformer framework to simultaneously realize accurate modeling and Raman pump design in C+L-band systems. The RMSE for modeling and peak-to-peak GSNR variation/deviation is within 0.22 dB and 0.86/0.1 dB, respectively.
- पेपर ID: 2510.09047
- शीर्षक: Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission
- लेखक: Jiaming Liu, Hong Lin, Rui Wang, Jing Zhang, JinJiang Li, Kun Qiu (इलेक्ट्रॉनिक विज्ञान और प्रौद्योगिकी विश्वविद्यालय, चीन)
- वर्गीकरण: eess.SP (सिग्नल प्रोसेसिंग)
- प्रकाशन समय/सम्मेलन: 2025 (संदर्भ के आधार पर अनुमानित)
- पेपर लिंक: https://arxiv.org/abs/2510.09047
यह पेपर C+L बैंड प्रणाली में सटीक मॉडलिंग और रामन पंप डिजाइन को एक साथ प्राप्त करने के लिए स्थानांतरण शिक्षा-आधारित ट्रांसफॉर्मर फ्रेमवर्क प्रस्तावित करता है। मॉडलिंग की मूल माध्य वर्ग त्रुटि (RMSE) 0.22 dB के भीतर है, और पीक-टू-पीक GSNR परिवर्तन/विचलन क्रमशः 0.86/0.1 dB के भीतर हैं।
- समाधान की जाने वाली समस्या: बैंडविड्थ की मांग में वृद्धि के साथ, C+L बैंड ट्रांसमिशन प्रणालियों को उत्तेजित रामन बिखराव (SRS) प्रभाव के कारण उत्पन्न प्रदर्शन असमानता की समस्या को हल करने की आवश्यकता है। SRS प्रभाव उच्च आवृत्ति से निम्न आवृत्ति की ओर शक्ति स्थानांतरण का कारण बनता है, जो विभिन्न चैनलों के बीच प्रदर्शन की सामंजस्य को प्रभावित करता है और समग्र क्षमता वृद्धि को सीमित करता है।
- समस्या की महत्ता: C+L बैंड तक विस्तार एक व्यावहारिक और आर्थिक रूप से प्रभावी रणनीति है, जिसमें मौजूदा ऑप्टिकल फाइबर बुनियादी ढांचे को बदलने की आवश्यकता नहीं है। रामन एम्पलीफायर (RA) मनमाना लाभ वितरण प्रदान कर सकते हैं और कम शोर विशेषताएं रखते हैं, जो इस समस्या को हल करने के लिए मुख्य तकनीक है।
- मौजूदा विधियों की सीमाएं:
- रामन एम्पलीफायर मॉडलिंग कठिन है, जिसमें जटिल साधारण अवकल समीकरण शामिल हैं और कोई विश्लेषणात्मक समाधान नहीं है
- पंप तरंग दैर्ध्य और शक्ति का चयन लाभ वितरण, ASE शोर और गैर-रैखिक हस्तक्षेप को महत्वपूर्ण रूप से प्रभावित करता है
- मौजूदा मशीन लर्निंग विधियों को प्रत्येक विशिष्ट परिदृश्य के लिए समर्पित मॉडल प्रशिक्षण की आवश्यकता होती है, जिसमें सामान्यीकरण क्षमता की कमी है
- अनुसंधान प्रेरणा: एक ऐसी सार्वभौमिक फ्रेमवर्क विकसित करना जो गतिशील ट्रांसमिशन शक्ति स्थितियों के तहत उच्च-सटीकता मॉडलिंग और कुशल अनुकूलन को प्राप्त कर सके, C+L बैंड प्रणाली के प्रदर्शन समरूपता को बेहतर बनाना।
- स्थानांतरण शिक्षा-आधारित ट्रांसफॉर्मर फ्रेमवर्क प्रस्तावित किया, जो रामन एम्पलीफायर मॉडलिंग और पंप अनुकूलन को एक साथ प्राप्त करता है
- एनकोडर-डिकोडर आर्किटेक्चर डिजाइन किया, जो स्व-ध्यान तंत्र का उपयोग करके मॉडलिंग सटीकता में सुधार करता है, अतिरिक्त अनुकूलन एल्गोरिदम के बिना व्युत्क्रम गणना को प्राप्त करता है
- दो-चरणीय स्थानांतरण शिक्षा रणनीति विकसित की, जो विभिन्न ट्रांसमिशन शक्ति स्थितियों के अनुकूल होने के लिए मूल डेटासेट के केवल 10% का उपयोग करती है
- उच्च-सटीकता प्रदर्शन प्राप्त किया: 90% मामलों में RMSE < 0.22 dB, अनुकूलन के बाद पीक-टू-पीक GSNR परिवर्तन < 0.86 dB
- इनपुट: रामन पंप शक्ति वितरण या लक्ष्य GSNR वितरण
- आउटपुट: संबंधित GSNR वितरण या अनुकूलित पंप शक्ति कॉन्फ़िगरेशन
- बाधाएं: गतिशील ट्रांसमिशन शक्ति स्थितियों के तहत प्रदर्शन समरूपता बनाए रखना
मॉडल दो-चरणीय प्रशिक्षण रणनीति अपनाता है:
- अग्रगामी मॉडलिंग चरण: दिए गए पंप शक्ति के तहत GSNR वितरण की भविष्यवाणी करने के लिए एनकोडर को प्रशिक्षित करना
- विपरीत अनुकूलन चरण: अग्रगामी मॉडल को फ्रीज करना, लक्ष्य GSNR से इष्टतम पंप शक्ति उत्पन्न करने के लिए डिकोडर को प्रशिक्षित करना
विपरीत मॉडल के लिए हानि फ़ंक्शन में दो घटक शामिल हैं:
Loss=MSE(GSNRinput,GSNRestimated)+MSE(Poweroutput,Powerestimated)
जहां MSE को इस प्रकार परिभाषित किया गया है:
MSE=N1∑i=1N(∣Xgenerated,i−Xreal,i∣2)
- एनकोडर: 2 परतें, मॉडल आयाम dmodel=32
- फीड-फॉरवर्ड नेटवर्क: छिपी हुई परत आकार 128
- बहु-सिर ध्यान: 4 ध्यान सिर
- आउटपुट प्रोसेसिंग: 2-परत MLP के माध्यम से अंतिम भविष्यवाणी उत्पन्न करना
- विशेषता निष्कर्षण परत फ्रीजिंग: एम्बेडिंग परत, स्थिति एन्कोडिंग और बहु-सिर ध्यान मॉड्यूल पैरामीटर को फ्रीज करना
- अनुकूलन परत सूक्ष्म-ट्यूनिंग: बाद की परतों को प्रशिक्षणीय रखना, नई ट्रांसमिशन शक्ति स्थितियों के अनुकूल होना
- MLP घटकों में LeakyReLU सक्रियण फ़ंक्शन और अतिरिक्त रैखिक परत का परिचय
- स्थिर ज्ञान स्थानांतरण के लिए छोटी सीखने की दर का उपयोग
- सूक्ष्म-ट्यूनिंग के लिए केवल 10% लक्ष्य डोमेन डेटा की आवश्यकता
- बैंड कॉन्फ़िगरेशन: C बैंड (191.0-197.0 THz) और L बैंड (184.5-190.5 THz), प्रत्येक 50 चैनल
- चैनल रिक्ति: 100 GHz, प्रतीक दर 96 GBaud
- सुरक्षा बैंड: C और L बैंड के बीच 500 GHz सुरक्षा बैंड
- ऑप्टिकल फाइबर पैरामीटर: 80 km ITU-T G.652.D मानक एकल-मोड ऑप्टिकल फाइबर
- शोर विशेषताएं: C बैंड NF=5dB, L बैंड NF=6dB
- डेटा स्केल: 4000 विभिन्न पंप शक्ति कॉन्फ़िगरेशन, 70% प्रशिक्षण, 30% परीक्षण
- पंप संख्या: 5
- पंप तरंग दैर्ध्य: 1455, 1469, 1484, 1498, 1514 nm
- शक्ति श्रेणी: 0-200 mW समान वितरण
- अनुकूलक: Adam, प्रारंभिक सीखने की दर 1×10⁻³
- बैच आकार: 256
- अधिकतम युग: 1000 (प्रारंभिक रोकने की रणनीति)
- सीखने की दर शेड्यूलिंग: ReduceLROnPlateau
- RMSE प्रदर्शन: 90% मामलों में RMSE < 0.22 dB
- संभाव्यता वितरण: PDF और CDF के माध्यम से मॉडल की उच्च भविष्यवाणी सटीकता सत्यापित की गई
विभिन्न ट्रांसमिशन शक्ति स्थितियों में (-4 dBm से 2 dBm):
- पीक-टू-पीक परिवर्तन: < 0.86 dB (100 चैनल)
- औसत विचलन: < 0.1 dB (लक्ष्य GSNR के सापेक्ष)
- स्पेक्ट्रम कवरेज: 10.3 THz C+L बैंड
- डेटा दक्षता: प्रभावी स्थानांतरण के लिए केवल 10% लक्ष्य डोमेन डेटा का उपयोग
- अनुकूलन क्षमता: 2 dBm और -2 dBm ट्रांसमिशन शक्ति स्थितियों के अनुकूल सफलतापूर्वक
- प्रदर्शन संरक्षण: स्थानांतरण के बाद उच्च-सटीकता मॉडलिंग और अनुकूलन क्षमता बनाए रखना
- ट्रांसफॉर्मर का स्व-ध्यान तंत्र पंप शक्ति और GSNR के बीच जटिल मानचित्रण संबंध को प्रभावी ढंग से कैप्चर करता है
- एनकोडर-डिकोडर आर्किटेक्चर अतिरिक्त अनुकूलन एल्गोरिदम के बिना द्विदिशात्मक मॉडलिंग को प्राप्त करता है
- स्थानांतरण शिक्षा विभिन्न ट्रांसमिशन शक्तियों के तहत मॉडल की सामान्यीकरण क्षमता में महत्वपूर्ण सुधार करता है
- बहु-बैंड ऑप्टिकल ट्रांसमिशन प्रणाली: C+L बैंड विस्तार तकनीक
- रामन एम्पलीफायर अनुकूलन: लाभ समतलीकरण और शोर अनुकूलन
- मशीन लर्निंग अनुप्रयोग: तंत्रिका नेटवर्क मॉडलिंग और अनुकूलन एल्गोरिदम
- पारंपरिक ANN विधि की तुलना में, ट्रांसफॉर्मर में अनुक्रम मॉडलिंग क्षमता अधिक है
- स्थानांतरण शिक्षा रणनीति मॉडल की अनुकूलन क्षमता और डेटा दक्षता में महत्वपूर्ण सुधार करती है
- अंत-से-अंत फ्रेमवर्क मॉडलिंग और अनुकूलन समस्या को एक साथ हल करता है
- प्रस्तावित स्थानांतरण शिक्षा ट्रांसफॉर्मर फ्रेमवर्क C+L बैंड रामन पंप अनुकूलन में उत्कृष्ट प्रदर्शन करता है
- उच्च-सटीकता मॉडलिंग (90% मामलों में RMSE < 0.22 dB) और प्रभावी अनुकूलन प्राप्त किया गया
- स्थानांतरण शिक्षा रणनीति मॉडल को गतिशील ट्रांसमिशन शक्ति स्थितियों के अनुकूल होने में सक्षम बनाती है
- प्रयोग केवल सिमुलेशन वातावरण में किए गए हैं, वास्तविक प्रणाली सत्यापन की कमी है
- मॉडल जटिलता वास्तविक समय अनुप्रयोग को सीमित कर सकती है
- स्थानांतरण शिक्षा का प्रभाव स्रोत डोमेन और लक्ष्य डोमेन की समानता पर निर्भर करता है
- वास्तविक ऑप्टिकल ट्रांसमिशन प्रणाली में फ्रेमवर्क प्रदर्शन का सत्यापन
- अधिक बैंड और अधिक जटिल नेटवर्क टोपोलॉजी तक विस्तार
- कम्प्यूटेशनल दक्षता में सुधार के लिए मॉडल संरचना का अनुकूलन
- तकनीकी नवाचार: रामन एम्पलीफायर अनुकूलन के लिए ट्रांसफॉर्मर और स्थानांतरण शिक्षा का पहला अनुप्रयोग
- विधि पूर्णता: मॉडलिंग और अनुकूलन समस्या को एक साथ हल करने वाली अंत-से-अंत फ्रेमवर्क
- प्रयोग पर्याप्तता: विस्तृत पैरामीटर सेटिंग और प्रदर्शन मूल्यांकन
- व्यावहारिक मूल्य: डेटा दक्षता में महत्वपूर्ण सुधार (स्थानांतरण के लिए केवल 10% डेटा की आवश्यकता)
- सत्यापन सीमाएं: वास्तविक प्रणाली प्रयोग सत्यापन की कमी
- तुलना अपर्याप्त: अन्य उन्नत मशीन लर्निंग विधियों के साथ पर्याप्त तुलना नहीं
- सैद्धांतिक विश्लेषण: स्थानांतरण शिक्षा प्रभाव के सैद्धांतिक व्याख्या की कमी
- शैक्षणिक योगदान: ऑप्टिकल संचार क्षेत्र में नई मशीन लर्निंग प्रतिमा का परिचय
- व्यावहारिक मूल्य: C+L बैंड प्रणाली अनुकूलन के लिए व्यावहारिक उपकरण प्रदान करता है
- पुनरुत्पादनीयता: विस्तृत प्रायोगिक सेटअप परिणामों के पुनरुत्पादन में सहायता करता है
- C+L बैंड ऑप्टिकल ट्रांसमिशन प्रणाली में रामन एम्पलीफायर डिजाइन
- गतिशील नेटवर्क स्थितियों के तहत एम्पलीफायर पैरामीटर अनुकूलन
- बहु-बैंड ऑप्टिकल नेटवर्क के प्रदर्शन समरूपता
पेपर में 8 संबंधित संदर्भ उद्धृत किए गए हैं, जिनमें बहु-बैंड ट्रांसमिशन, रामन एम्पलीफायर, मशीन लर्निंग अनुप्रयोग आदि मुख्य क्षेत्रों के महत्वपूर्ण कार्य शामिल हैं, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं।
समग्र मूल्यांकन: यह तकनीकी नवाचार के साथ एक मजबूत पेपर है, जो ऑप्टिकल संचार प्रणाली अनुकूलन के लिए उन्नत मशीन लर्निंग तकनीकों को लागू करता है, विधि डिजाइन और प्रायोगिक सत्यापन दोनों में काफी पूर्ण है। हालांकि वास्तविक प्रणाली सत्यापन की कमी है, लेकिन यह क्षेत्र के विकास के लिए मूल्यवान तकनीकी पथ प्रदान करता है।