We propose a transfer learning-enabled Transformer framework to simultaneously realize accurate modeling and Raman pump design in C+L-band systems. The RMSE for modeling and peak-to-peak GSNR variation/deviation is within 0.22 dB and 0.86/0.1 dB, respectively.
Optimisation Efficace de l'Accordage de la Pompe Raman Activée par l'Apprentissage par Transfert sous Puissance de Lancement Dynamique pour la Transmission en Bande C+L
- ID de l'article: 2510.09047
- Titre: Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission
- Auteurs: Jiaming Liu, Hong Lin, Rui Wang, Jing Zhang, JinJiang Li, Kun Qiu (Université des Sciences et Technologies Électroniques de Chine)
- Classification: eess.SP (Traitement du Signal)
- Date de Publication/Conférence: 2025 (déduit des références)
- Lien de l'article: https://arxiv.org/abs/2510.09047
Cet article propose un cadre Transformer basé sur l'apprentissage par transfert pour réaliser simultanément une modélisation précise et une conception de pompe Raman dans les systèmes de bande C+L. L'erreur quadratique moyenne (RMSE) de la modélisation est inférieure à 0,22 dB, et les variations/écarts de GSNR crête à crête sont respectivement inférieurs à 0,86/0,1 dB.
- Problème à résoudre: Avec la croissance des besoins en bande passante, les systèmes de transmission en bande C+L doivent résoudre les problèmes d'hétérogénéité de performance causés par l'effet de diffusion Raman stimulée (SRS). L'effet SRS provoque un transfert de puissance des hautes fréquences vers les basses fréquences, affectant la cohérence de performance entre les différents canaux et limitant l'augmentation globale de la capacité.
- Importance du problème: L'extension à la bande C+L est une stratégie viable et économique qui ne nécessite pas de remplacer l'infrastructure de fibres optiques existante. L'amplificateur Raman (RA) peut fournir une distribution de gain arbitraire avec des caractéristiques de faible bruit, ce qui en fait une technologie clé pour résoudre ce problème.
- Limitations des méthodes existantes:
- La modélisation de l'amplificateur Raman est difficile, impliquant un système complexe d'équations différentielles ordinaires sans solution analytique
- Le choix des longueurs d'onde et de la puissance de la pompe affecte considérablement la distribution de gain, le bruit ASE et les interférences non linéaires
- Les méthodes d'apprentissage automatique existantes nécessitent l'entraînement de modèles dédiés pour chaque scénario spécifique, manquant de capacité de généralisation
- Motivation de la recherche: Développer un cadre universel capable de réaliser une modélisation haute précision et une optimisation efficace dans des conditions de puissance d'émission dynamique, améliorant l'uniformité de performance des systèmes en bande C+L.
- Proposition d'un cadre Transformer basé sur l'apprentissage par transfert pour réaliser simultanément la modélisation et l'optimisation de la pompe Raman
- Conception d'une architecture encodeur-décodeur exploitant les mécanismes d'auto-attention pour améliorer la précision de modélisation, permettant le calcul inverse sans algorithmes d'optimisation supplémentaires
- Développement d'une stratégie d'apprentissage par transfert en deux étapes permettant l'adaptation à différentes conditions de puissance d'émission en utilisant seulement 10% de l'ensemble de données original
- Réalisation de performances haute précision: RMSE < 0,22 dB dans 90% des cas, variation crête à crête de GSNR optimisée < 0,86 dB
- Entrée: Distribution de puissance de pompe Raman ou distribution de GSNR cible
- Sortie: Distribution de GSNR correspondante ou configuration de puissance de pompe optimisée
- Contraintes: Maintenir l'uniformité de performance dans des conditions de puissance d'émission dynamique
Le modèle adopte une stratégie d'entraînement en deux étapes:
- Phase de modélisation avant: Entraînement de l'encodeur pour prédire la distribution de GSNR compte tenu de la puissance de pompe
- Phase d'optimisation inverse: Gel du modèle avant, entraînement du décodeur pour générer la puissance de pompe optimale à partir du GSNR cible
La fonction de perte du modèle inverse comprend deux composantes:
Perte=MSE(GSNRentreˊe,GSNRestimeˊ)+MSE(Puissancesortie,Puissanceestimeˊe)
où MSE est défini comme:
MSE=N1∑i=1N(∣Xgeˊneˊreˊ,i−Xreˊel,i∣2)
- Encodeur: 2 couches, dimension du modèle dmodeˋle=32
- Réseau avant: Taille de la couche cachée 128
- Attention multi-têtes: 4 têtes d'attention
- Traitement de sortie: Génération de prédictions finales via MLP à 2 couches
- Gel des couches d'extraction de caractéristiques: Gel des paramètres de la couche d'intégration, de l'encodage de position et des modules d'attention multi-têtes
- Ajustement fin des couches d'adaptation: Maintien des couches suivantes entraînables pour s'adapter aux nouvelles conditions de puissance d'émission
- Introduction de la fonction d'activation LeakyReLU et de couches linéaires supplémentaires dans les composantes MLP
- Utilisation d'un petit taux d'apprentissage pour un transfert de connaissances stable
- Nécessite seulement 10% des données du domaine cible pour l'ajustement fin
- Configuration de bande: Bande C (191,0-197,0 THz) et bande L (184,5-190,5 THz), 50 canaux chacun
- Espacement des canaux: 100 GHz, débit de symboles 96 GBaud
- Bande de garde: Bande de garde de 500 GHz entre les bandes C et L
- Paramètres de fibre: Fibre monomode standard ITU-T G.652.D de 80 km
- Caractéristiques de bruit: NF=5dB pour la bande C, NF=6dB pour la bande L
- Échelle de données: 4000 configurations de pompe différentes, 70% entraînement, 30% test
- Nombre de pompes: 5
- Longueurs d'onde de pompe: 1455, 1469, 1484, 1498, 1514 nm
- Plage de puissance: Distribution uniforme 0-200 mW
- Optimiseur: Adam, taux d'apprentissage initial 1×10⁻³
- Taille de lot: 256
- Nombre maximum d'épochs: 1000 (stratégie d'arrêt précoce)
- Planification du taux d'apprentissage: ReduceLROnPlateau
- Performance RMSE: RMSE < 0,22 dB dans 90% des cas
- Distribution de probabilité: Vérification de la haute précision de prédiction du modèle via PDF et CDF
Sous différentes conditions de puissance d'émission (-4 dBm à 2 dBm):
- Variation crête à crête: < 0,86 dB (100 canaux)
- Écart moyen: < 0,1 dB (par rapport au GSNR cible)
- Couverture spectrale: Bande C+L de 10,3 THz
- Efficacité des données: Transfert efficace en utilisant seulement 10% des données du domaine cible
- Capacité d'adaptation: Adaptation réussie aux conditions de puissance d'émission de 2 dBm et -2 dBm
- Maintien de performance: Conservation de la modélisation haute précision et de la capacité d'optimisation après transfert
- Le mécanisme d'auto-attention du Transformer capture efficacement la relation de mappage complexe entre la puissance de pompe et le GSNR
- L'architecture encodeur-décodeur réalise une modélisation bidirectionnelle sans nécessiter d'algorithmes d'optimisation supplémentaires
- L'apprentissage par transfert améliore considérablement la capacité de généralisation du modèle sous différentes puissances d'émission
- Systèmes de transmission optique multi-bandes: Technologie d'extension en bande C+L
- Optimisation de l'amplificateur Raman: Aplatissement de gain et optimisation du bruit
- Applications d'apprentissage automatique: Modélisation par réseau de neurones et algorithmes d'optimisation
- Comparé aux méthodes ANN traditionnelles, le Transformer possède une capacité de modélisation de séquences plus forte
- La stratégie d'apprentissage par transfert améliore considérablement l'adaptabilité et l'efficacité des données du modèle
- Le cadre bout en bout résout simultanément les problèmes de modélisation et d'optimisation
- Le cadre Transformer basé sur l'apprentissage par transfert proposé montre d'excellentes performances dans l'optimisation de la pompe Raman en bande C+L
- Réalisation d'une modélisation haute précision (RMSE < 0,22 dB dans 90% des cas) et d'une optimisation efficace
- La stratégie d'apprentissage par transfert permet au modèle de s'adapter efficacement aux conditions de puissance d'émission dynamique
- Les expériences ne sont menées que dans un environnement de simulation, manquant de vérification sur système réel
- La complexité du modèle peut limiter les applications en temps réel
- L'efficacité de l'apprentissage par transfert dépend de la similarité entre le domaine source et le domaine cible
- Vérifier les performances du cadre dans les systèmes de transmission optique réels
- Étendre à davantage de bandes et à des topologies de réseau plus complexes
- Optimiser la structure du modèle pour améliorer l'efficacité de calcul
- Innovativité technique: Application pionnière du Transformer et de l'apprentissage par transfert à l'optimisation de l'amplificateur Raman
- Complétude de la méthode: Cadre bout en bout résolvant simultanément les problèmes de modélisation et d'optimisation
- Suffisance expérimentale: Paramétrage détaillé et évaluation de performance
- Valeur pratique: Amélioration significative de l'efficacité des données (transfert avec seulement 10% des données)
- Limitations de vérification: Absence de vérification expérimentale sur système réel
- Comparaisons insuffisantes: Manque de comparaison suffisante avec d'autres méthodes d'apprentissage automatique avancées
- Analyse théorique: Absence d'explication théorique des effets de l'apprentissage par transfert
- Contribution académique: Introduction d'un nouveau paradigme d'apprentissage automatique pour le domaine des communications optiques
- Valeur pratique: Fourniture d'un outil pratique pour l'optimisation des systèmes en bande C+L
- Reproductibilité: Paramétrage expérimental détaillé facilitant la reproduction des résultats
- Conception de l'amplificateur Raman pour les systèmes de transmission optique en bande C+L
- Optimisation des paramètres de l'amplificateur dans des conditions de réseau dynamique
- Uniformisation de performance pour les réseaux optiques multi-bandes
L'article cite 8 références connexes couvrant les domaines clés de la transmission multi-bandes, des amplificateurs Raman et des applications d'apprentissage automatique, fournissant une base théorique solide pour la recherche.
Évaluation Globale: Cet article présente une innovativité technique considérable, appliquant des techniques d'apprentissage automatique avancées à l'optimisation des systèmes de communications optiques, avec une conception de méthode et une vérification expérimentale relativement complètes. Bien qu'il manque de vérification sur système réel, il fournit une voie technologique précieuse pour le développement de ce domaine.