2025-11-22T15:52:16.395606

Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission

Liu, Wang, Li et al.

We propose a transfer learning-enabled Transformer framework to simultaneously realize accurate modeling and Raman pump design in C+L-band systems. The RMSE for modeling and peak-to-peak GSNR variation/deviation is within 0.22 dB and 0.86/0.1 dB, respectively.

academic

Эффективная настройка рамановского насоса с использованием трансферного обучения при динамической мощности запуска для передачи в полосе C+L

Основная информация

ID статьи: 2510.09047
Название: Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission
Авторы: Jiaming Liu, Hong Lin, Rui Wang, Jing Zhang, JinJiang Li, Kun Qiu (Университет электронной науки и технологии Китая)
Классификация: eess.SP (Обработка сигналов)
Время публикации/конференция: 2025 (на основе анализа ссылок)
Ссылка на статью: https://arxiv.org/abs/2510.09047

Аннотация

В данной работе предложена архитектура Transformer на основе трансферного обучения для одновременного достижения точного моделирования и проектирования рамановского насоса в системах полосы C+L. Среднеквадратическая ошибка (RMSE) моделирования составляет менее 0,22 дБ, а размах колебаний GSNR и отклонение находятся в пределах 0,86/0,1 дБ соответственно.

Исследовательский контекст и мотивация

Проблема, требующая решения: С ростом требований к полосе пропускания системы передачи в полосе C+L должны решить проблему неоднородности производительности, вызванную эффектом вынужденного рамановского рассеяния (SRS). Эффект SRS приводит к передаче мощности от высоких частот к низким, влияя на согласованность производительности между различными каналами и ограничивая общее увеличение пропускной способности.
Важность проблемы: Расширение на полосу C+L является жизнеспособной и экономически эффективной стратегией, не требующей замены существующей оптоволоконной инфраструктуры. Рамановский усилитель (RA) может обеспечить произвольное распределение усиления и обладает низкошумовыми характеристиками, являясь ключевой технологией для решения этой проблемы.
Ограничения существующих методов:
- Моделирование рамановского усилителя затруднено, включает сложные системы обыкновенных дифференциальных уравнений без аналитического решения
- Выбор длины волны и мощности насоса существенно влияет на распределение усиления, шум ASE и нелинейные помехи
- Существующие методы машинного обучения требуют обучения специализированных моделей для каждого конкретного сценария, что ограничивает их обобщающую способность
Исследовательская мотивация: Разработка универсальной платформы, способной достичь высокоточного моделирования и эффективной оптимизации при динамических условиях мощности передачи, повышая однородность производительности системы полосы C+L.

Основные вклады

Предложена архитектура Transformer на основе трансферного обучения для одновременного моделирования рамановского усилителя и оптимизации насоса
Разработана архитектура кодировщик-декодировщик, использующая механизм самовнимания для повышения точности моделирования и обеспечивающая обратные вычисления без дополнительных алгоритмов оптимизации
Разработана двухэтапная стратегия трансферного обучения, позволяющая адаптироваться к различным условиям мощности передачи, используя только 10% исходного набора данных
Достигнута высокая точность производительности: RMSE < 0,22 дБ в 90% случаев, размах колебаний GSNR после оптимизации < 0,86 дБ

Детальное описание методологии

Определение задачи

Входные данные: распределение мощности рамановского насоса или целевое распределение GSNR
Выходные данные: соответствующее распределение GSNR или оптимизированная конфигурация мощности насоса
Ограничения: сохранение однородности производительности при динамических условиях мощности передачи

Архитектура модели

Общая структура

Модель использует двухэтапную стратегию обучения:

Этап прямого моделирования: обучение кодировщика для предсказания распределения GSNR при заданной мощности насоса
Этап обратной оптимизации: замораживание прямой модели, обучение декодировщика для генерации оптимальной мощности насоса из целевого GSNR

Проектирование функции потерь

Функция потерь обратной модели содержит два компонента:

$\text{Loss} = \text{MSE}(\text{GSNR}_{\text{input}}, \text{GSNR}_{\text{estimated}}) + \text{MSE}(\text{Power}_{\text{output}}, \text{Power}_{\text{estimated}})$

где MSE определяется как: $\text{MSE} = \frac{1}{N}\sum_{i=1}^{N}(|X_{\text{generated},i} - X_{\text{real},i}|^2)$

Детали архитектуры Transformer

Кодировщик: 2 слоя, размерность модели $d_{\text{model}} = 32$
Сеть прямого распространения: размер скрытого слоя 128
Многоголовое внимание: 4 головы внимания
Обработка выходных данных: генерация финального предсказания через 2-слойный MLP

Стратегия трансферного обучения

Двухэтапное трансферное обучение

Замораживание слоев извлечения признаков: замораживание параметров слоя встраивания, позиционного кодирования и модулей многоголового внимания
Тонкая настройка адаптационных слоев: сохранение обучаемости последующих слоев для адаптации к новым условиям мощности передачи

Улучшение модели

Введение функции активации LeakyReLU и дополнительного линейного слоя в компоненты MLP
Использование малой скорости обучения для стабильной передачи знаний
Требуется только 10% данных целевого домена для тонкой настройки

Экспериментальная установка

Набор данных

Конфигурация полосы: полоса C (191,0-197,0 ТГц) и полоса L (184,5-190,5 ТГц), по 50 каналов в каждой
Интервал между каналами: 100 ГГц, скорость символов 96 ГБод
Защитная полоса: 500 ГГц между полосами C и L
Параметры оптоволокна: 80 км стандартного одномодового оптоволокна ITU-T G.652.D
Характеристики шума: NF=5 дБ для полосы C, NF=6 дБ для полосы L
Масштаб данных: 4000 различных конфигураций мощности насоса, 70% для обучения, 30% для тестирования

Конфигурация рамановского насоса

Количество насосов: 5
Длины волн насосов: 1455, 1469, 1484, 1498, 1514 нм
Диапазон мощности: 0-200 мВт равномерное распределение

Параметры обучения

Оптимизатор: Adam, начальная скорость обучения 1×10⁻³
Размер пакета: 256
Максимальное количество эпох: 1000 (стратегия ранней остановки)
Расписание скорости обучения: ReduceLROnPlateau

Результаты экспериментов

Основные результаты

Точность моделирования

Производительность RMSE: RMSE < 0,22 дБ в 90% случаев
Распределение вероятностей: проверка высокой точности предсказания модели через PDF и CDF

Эффект оптимизации GSNR

При различных условиях мощности передачи (от -4 дБм до 2 дБм):

Размах колебаний: < 0,86 дБ (100 каналов)
Среднее отклонение: < 0,1 дБ (относительно целевого GSNR)
Спектральное покрытие: 10,3 ТГц полоса C+L

Эффект трансферного обучения

Эффективность данных: эффективная передача с использованием только 10% данных целевого домена
Способность адаптации: успешная адаптация к условиям мощности передачи 2 дБм и -2 дБм
Сохранение производительности: сохранение высокоточного моделирования и оптимизации после передачи

Экспериментальные выводы

Механизм самовнимания Transformer эффективно захватывает сложное отображение между мощностью насоса и GSNR
Архитектура кодировщик-декодировщик обеспечивает двусторонее моделирование без необходимости в дополнительных алгоритмах оптимизации
Трансферное обучение значительно повышает обобщающую способность модели при различных мощностях передачи

Связанные работы

Основные направления исследований

Многополосные системы оптической передачи: технология расширения полосы C+L
Оптимизация рамановского усилителя: выравнивание усиления и оптимизация шума
Применение машинного обучения: нейросетевое моделирование и алгоритмы оптимизации

Преимущества данной работы

По сравнению с традиционными методами ANN, Transformer обладает более сильной способностью к моделированию последовательностей
Стратегия трансферного обучения значительно повышает адаптивность модели и эффективность использования данных
Сквозная архитектура одновременно решает проблемы моделирования и оптимизации

Заключение и обсуждение

Основные выводы

Предложенная архитектура Transformer на основе трансферного обучения показывает отличные результаты в оптимизации рамановского насоса для полосы C+L
Достигнуто высокоточное моделирование (RMSE < 0,22 дБ в 90% случаев) и эффективная оптимизация
Стратегия трансферного обучения позволяет модели эффективно адаптироваться к динамическим условиям мощности передачи

Ограничения

Эксперименты проводились только в среде моделирования, отсутствует проверка на реальных системах
Сложность модели может ограничить применение в реальном времени
Эффективность трансферного обучения зависит от сходства между исходным и целевым доменами

Направления будущих исследований

Проверка производительности платформы на реальных системах оптической передачи
Расширение на большее количество полос и более сложные сетевые топологии
Оптимизация структуры модели для повышения вычислительной эффективности

Глубокая оценка

Преимущества

Техническая инновационность: первое применение Transformer и трансферного обучения к оптимизации рамановского усилителя
Полнота методологии: сквозная архитектура, решающая одновременно проблемы моделирования и оптимизации
Достаточность экспериментов: детальная настройка параметров и оценка производительности
Практическая ценность: значительное повышение эффективности использования данных (требуется только 10% данных для передачи)

Недостатки

Ограничения проверки: отсутствие экспериментальной проверки на реальных системах
Недостаточное сравнение: отсутствие достаточного сравнения с другими передовыми методами машинного обучения
Теоретический анализ: отсутствие теоретического объяснения эффективности трансферного обучения

Влияние

Научный вклад: введение новой парадигмы машинного обучения в область оптической связи
Практическая ценность: предоставление практического инструмента для оптимизации систем полосы C+L
Воспроизводимость: детальная экспериментальная установка способствует воспроизведению результатов

Применимые сценарии

Проектирование рамановского усилителя для систем оптической передачи полосы C+L
Оптимизация параметров усилителя при динамических условиях сети
Выравнивание производительности в многополосных оптических сетях

Список литературы

Статья цитирует 8 связанных работ, охватывающих ключевые области многополосной передачи, рамановских усилителей и применения машинного обучения, обеспечивая прочную теоретическую базу для исследования.

Общая оценка: Это статья с высокой технической инновационностью, применяющая передовые методы машинного обучения к оптимизации систем оптической связи. Методология проектирования и экспериментальная проверка достаточно полны. Хотя отсутствует проверка на реальных системах, работа предоставляет ценный технологический путь для развития данной области.