2025-11-22T15:52:16.395606

Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission

Liu, Wang, Li et al.

We propose a transfer learning-enabled Transformer framework to simultaneously realize accurate modeling and Raman pump design in C+L-band systems. The RMSE for modeling and peak-to-peak GSNR variation/deviation is within 0.22 dB and 0.86/0.1 dB, respectively.

academic

Optimisation Efficace de l'Accordage de la Pompe Raman Activée par l'Apprentissage par Transfert sous Puissance de Lancement Dynamique pour la Transmission en Bande C+L

Informations Fondamentales

ID de l'article: 2510.09047
Titre: Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission
Auteurs: Jiaming Liu, Hong Lin, Rui Wang, Jing Zhang, JinJiang Li, Kun Qiu (Université des Sciences et Technologies Électroniques de Chine)
Classification: eess.SP (Traitement du Signal)
Date de Publication/Conférence: 2025 (déduit des références)
Lien de l'article: https://arxiv.org/abs/2510.09047

Résumé

Cet article propose un cadre Transformer basé sur l'apprentissage par transfert pour réaliser simultanément une modélisation précise et une conception de pompe Raman dans les systèmes de bande C+L. L'erreur quadratique moyenne (RMSE) de la modélisation est inférieure à 0,22 dB, et les variations/écarts de GSNR crête à crête sont respectivement inférieurs à 0,86/0,1 dB.

Contexte de Recherche et Motivation

Problème à résoudre: Avec la croissance des besoins en bande passante, les systèmes de transmission en bande C+L doivent résoudre les problèmes d'hétérogénéité de performance causés par l'effet de diffusion Raman stimulée (SRS). L'effet SRS provoque un transfert de puissance des hautes fréquences vers les basses fréquences, affectant la cohérence de performance entre les différents canaux et limitant l'augmentation globale de la capacité.
Importance du problème: L'extension à la bande C+L est une stratégie viable et économique qui ne nécessite pas de remplacer l'infrastructure de fibres optiques existante. L'amplificateur Raman (RA) peut fournir une distribution de gain arbitraire avec des caractéristiques de faible bruit, ce qui en fait une technologie clé pour résoudre ce problème.
Limitations des méthodes existantes:
- La modélisation de l'amplificateur Raman est difficile, impliquant un système complexe d'équations différentielles ordinaires sans solution analytique
- Le choix des longueurs d'onde et de la puissance de la pompe affecte considérablement la distribution de gain, le bruit ASE et les interférences non linéaires
- Les méthodes d'apprentissage automatique existantes nécessitent l'entraînement de modèles dédiés pour chaque scénario spécifique, manquant de capacité de généralisation
Motivation de la recherche: Développer un cadre universel capable de réaliser une modélisation haute précision et une optimisation efficace dans des conditions de puissance d'émission dynamique, améliorant l'uniformité de performance des systèmes en bande C+L.

Contributions Principales

Proposition d'un cadre Transformer basé sur l'apprentissage par transfert pour réaliser simultanément la modélisation et l'optimisation de la pompe Raman
Conception d'une architecture encodeur-décodeur exploitant les mécanismes d'auto-attention pour améliorer la précision de modélisation, permettant le calcul inverse sans algorithmes d'optimisation supplémentaires
Développement d'une stratégie d'apprentissage par transfert en deux étapes permettant l'adaptation à différentes conditions de puissance d'émission en utilisant seulement 10% de l'ensemble de données original
Réalisation de performances haute précision: RMSE < 0,22 dB dans 90% des cas, variation crête à crête de GSNR optimisée < 0,86 dB

Détails de la Méthode

Définition de la Tâche

Entrée: Distribution de puissance de pompe Raman ou distribution de GSNR cible
Sortie: Distribution de GSNR correspondante ou configuration de puissance de pompe optimisée
Contraintes: Maintenir l'uniformité de performance dans des conditions de puissance d'émission dynamique

Architecture du Modèle

Cadre Global

Le modèle adopte une stratégie d'entraînement en deux étapes:

Phase de modélisation avant: Entraînement de l'encodeur pour prédire la distribution de GSNR compte tenu de la puissance de pompe
Phase d'optimisation inverse: Gel du modèle avant, entraînement du décodeur pour générer la puissance de pompe optimale à partir du GSNR cible

Conception de la Fonction de Perte

La fonction de perte du modèle inverse comprend deux composantes:

$\text{Perte} = \text{MSE}(\text{GSNR}_{\text{entrée}}, \text{GSNR}_{\text{estimé}}) + \text{MSE}(\text{Puissance}_{\text{sortie}}, \text{Puissance}_{\text{estimée}})$

où MSE est défini comme: $\text{MSE} = \frac{1}{N}\sum_{i=1}^{N}(|X_{\text{généré},i} - X_{\text{réel},i}|^2)$

Détails de l'Architecture Transformer

Encodeur: 2 couches, dimension du modèle $d_{\text{modèle}} = 32$
Réseau avant: Taille de la couche cachée 128
Attention multi-têtes: 4 têtes d'attention
Traitement de sortie: Génération de prédictions finales via MLP à 2 couches

Stratégie d'Apprentissage par Transfert

Apprentissage par Transfert en Deux Étapes

Gel des couches d'extraction de caractéristiques: Gel des paramètres de la couche d'intégration, de l'encodage de position et des modules d'attention multi-têtes
Ajustement fin des couches d'adaptation: Maintien des couches suivantes entraînables pour s'adapter aux nouvelles conditions de puissance d'émission

Amélioration du Modèle

Introduction de la fonction d'activation LeakyReLU et de couches linéaires supplémentaires dans les composantes MLP
Utilisation d'un petit taux d'apprentissage pour un transfert de connaissances stable
Nécessite seulement 10% des données du domaine cible pour l'ajustement fin

Configuration Expérimentale

Ensemble de Données

Configuration de bande: Bande C (191,0-197,0 THz) et bande L (184,5-190,5 THz), 50 canaux chacun
Espacement des canaux: 100 GHz, débit de symboles 96 GBaud
Bande de garde: Bande de garde de 500 GHz entre les bandes C et L
Paramètres de fibre: Fibre monomode standard ITU-T G.652.D de 80 km
Caractéristiques de bruit: NF=5dB pour la bande C, NF=6dB pour la bande L
Échelle de données: 4000 configurations de pompe différentes, 70% entraînement, 30% test

Configuration de la Pompe Raman

Nombre de pompes: 5
Longueurs d'onde de pompe: 1455, 1469, 1484, 1498, 1514 nm
Plage de puissance: Distribution uniforme 0-200 mW

Paramètres d'Entraînement

Optimiseur: Adam, taux d'apprentissage initial 1×10⁻³
Taille de lot: 256
Nombre maximum d'épochs: 1000 (stratégie d'arrêt précoce)
Planification du taux d'apprentissage: ReduceLROnPlateau

Résultats Expérimentaux

Résultats Principaux

Précision de Modélisation

Performance RMSE: RMSE < 0,22 dB dans 90% des cas
Distribution de probabilité: Vérification de la haute précision de prédiction du modèle via PDF et CDF

Effet d'Optimisation du GSNR

Sous différentes conditions de puissance d'émission (-4 dBm à 2 dBm):

Variation crête à crête: < 0,86 dB (100 canaux)
Écart moyen: < 0,1 dB (par rapport au GSNR cible)
Couverture spectrale: Bande C+L de 10,3 THz

Effet de l'Apprentissage par Transfert

Efficacité des données: Transfert efficace en utilisant seulement 10% des données du domaine cible
Capacité d'adaptation: Adaptation réussie aux conditions de puissance d'émission de 2 dBm et -2 dBm
Maintien de performance: Conservation de la modélisation haute précision et de la capacité d'optimisation après transfert

Découvertes Expérimentales

Le mécanisme d'auto-attention du Transformer capture efficacement la relation de mappage complexe entre la puissance de pompe et le GSNR
L'architecture encodeur-décodeur réalise une modélisation bidirectionnelle sans nécessiter d'algorithmes d'optimisation supplémentaires
L'apprentissage par transfert améliore considérablement la capacité de généralisation du modèle sous différentes puissances d'émission

Travaux Connexes

Principaux Domaines de Recherche

Systèmes de transmission optique multi-bandes: Technologie d'extension en bande C+L
Optimisation de l'amplificateur Raman: Aplatissement de gain et optimisation du bruit
Applications d'apprentissage automatique: Modélisation par réseau de neurones et algorithmes d'optimisation

Avantages de cet Article

Comparé aux méthodes ANN traditionnelles, le Transformer possède une capacité de modélisation de séquences plus forte
La stratégie d'apprentissage par transfert améliore considérablement l'adaptabilité et l'efficacité des données du modèle
Le cadre bout en bout résout simultanément les problèmes de modélisation et d'optimisation

Conclusion et Discussion

Conclusions Principales

Le cadre Transformer basé sur l'apprentissage par transfert proposé montre d'excellentes performances dans l'optimisation de la pompe Raman en bande C+L
Réalisation d'une modélisation haute précision (RMSE < 0,22 dB dans 90% des cas) et d'une optimisation efficace
La stratégie d'apprentissage par transfert permet au modèle de s'adapter efficacement aux conditions de puissance d'émission dynamique

Limitations

Les expériences ne sont menées que dans un environnement de simulation, manquant de vérification sur système réel
La complexité du modèle peut limiter les applications en temps réel
L'efficacité de l'apprentissage par transfert dépend de la similarité entre le domaine source et le domaine cible

Directions Futures

Vérifier les performances du cadre dans les systèmes de transmission optique réels
Étendre à davantage de bandes et à des topologies de réseau plus complexes
Optimiser la structure du modèle pour améliorer l'efficacité de calcul

Évaluation Approfondie

Points Forts

Innovativité technique: Application pionnière du Transformer et de l'apprentissage par transfert à l'optimisation de l'amplificateur Raman
Complétude de la méthode: Cadre bout en bout résolvant simultanément les problèmes de modélisation et d'optimisation
Suffisance expérimentale: Paramétrage détaillé et évaluation de performance
Valeur pratique: Amélioration significative de l'efficacité des données (transfert avec seulement 10% des données)

Insuffisances

Limitations de vérification: Absence de vérification expérimentale sur système réel
Comparaisons insuffisantes: Manque de comparaison suffisante avec d'autres méthodes d'apprentissage automatique avancées
Analyse théorique: Absence d'explication théorique des effets de l'apprentissage par transfert

Impact

Contribution académique: Introduction d'un nouveau paradigme d'apprentissage automatique pour le domaine des communications optiques
Valeur pratique: Fourniture d'un outil pratique pour l'optimisation des systèmes en bande C+L
Reproductibilité: Paramétrage expérimental détaillé facilitant la reproduction des résultats

Scénarios d'Application

Conception de l'amplificateur Raman pour les systèmes de transmission optique en bande C+L
Optimisation des paramètres de l'amplificateur dans des conditions de réseau dynamique
Uniformisation de performance pour les réseaux optiques multi-bandes

Références

L'article cite 8 références connexes couvrant les domaines clés de la transmission multi-bandes, des amplificateurs Raman et des applications d'apprentissage automatique, fournissant une base théorique solide pour la recherche.

Évaluation Globale: Cet article présente une innovativité technique considérable, appliquant des techniques d'apprentissage automatique avancées à l'optimisation des systèmes de communications optiques, avec une conception de méthode et une vérification expérimentale relativement complètes. Bien qu'il manque de vérification sur système réel, il fournit une voie technologique précieuse pour le développement de ce domaine.