We propose a transfer learning-enabled Transformer framework to simultaneously realize accurate modeling and Raman pump design in C+L-band systems. The RMSE for modeling and peak-to-peak GSNR variation/deviation is within 0.22 dB and 0.86/0.1 dB, respectively.
- ID статьи: 2510.09047
- Название: Transfer Learning-Enabled Efficient Raman Pump Tuning under Dynamic Launch Power for C+L Band Transmission
- Авторы: Jiaming Liu, Hong Lin, Rui Wang, Jing Zhang, JinJiang Li, Kun Qiu (Университет электронной науки и технологии Китая)
- Классификация: eess.SP (Обработка сигналов)
- Время публикации/конференция: 2025 (на основе анализа ссылок)
- Ссылка на статью: https://arxiv.org/abs/2510.09047
В данной работе предложена архитектура Transformer на основе трансферного обучения для одновременного достижения точного моделирования и проектирования рамановского насоса в системах полосы C+L. Среднеквадратическая ошибка (RMSE) моделирования составляет менее 0,22 дБ, а размах колебаний GSNR и отклонение находятся в пределах 0,86/0,1 дБ соответственно.
- Проблема, требующая решения: С ростом требований к полосе пропускания системы передачи в полосе C+L должны решить проблему неоднородности производительности, вызванную эффектом вынужденного рамановского рассеяния (SRS). Эффект SRS приводит к передаче мощности от высоких частот к низким, влияя на согласованность производительности между различными каналами и ограничивая общее увеличение пропускной способности.
- Важность проблемы: Расширение на полосу C+L является жизнеспособной и экономически эффективной стратегией, не требующей замены существующей оптоволоконной инфраструктуры. Рамановский усилитель (RA) может обеспечить произвольное распределение усиления и обладает низкошумовыми характеристиками, являясь ключевой технологией для решения этой проблемы.
- Ограничения существующих методов:
- Моделирование рамановского усилителя затруднено, включает сложные системы обыкновенных дифференциальных уравнений без аналитического решения
- Выбор длины волны и мощности насоса существенно влияет на распределение усиления, шум ASE и нелинейные помехи
- Существующие методы машинного обучения требуют обучения специализированных моделей для каждого конкретного сценария, что ограничивает их обобщающую способность
- Исследовательская мотивация: Разработка универсальной платформы, способной достичь высокоточного моделирования и эффективной оптимизации при динамических условиях мощности передачи, повышая однородность производительности системы полосы C+L.
- Предложена архитектура Transformer на основе трансферного обучения для одновременного моделирования рамановского усилителя и оптимизации насоса
- Разработана архитектура кодировщик-декодировщик, использующая механизм самовнимания для повышения точности моделирования и обеспечивающая обратные вычисления без дополнительных алгоритмов оптимизации
- Разработана двухэтапная стратегия трансферного обучения, позволяющая адаптироваться к различным условиям мощности передачи, используя только 10% исходного набора данных
- Достигнута высокая точность производительности: RMSE < 0,22 дБ в 90% случаев, размах колебаний GSNR после оптимизации < 0,86 дБ
- Входные данные: распределение мощности рамановского насоса или целевое распределение GSNR
- Выходные данные: соответствующее распределение GSNR или оптимизированная конфигурация мощности насоса
- Ограничения: сохранение однородности производительности при динамических условиях мощности передачи
Модель использует двухэтапную стратегию обучения:
- Этап прямого моделирования: обучение кодировщика для предсказания распределения GSNR при заданной мощности насоса
- Этап обратной оптимизации: замораживание прямой модели, обучение декодировщика для генерации оптимальной мощности насоса из целевого GSNR
Функция потерь обратной модели содержит два компонента:
Loss=MSE(GSNRinput,GSNRestimated)+MSE(Poweroutput,Powerestimated)
где MSE определяется как:
MSE=N1∑i=1N(∣Xgenerated,i−Xreal,i∣2)
- Кодировщик: 2 слоя, размерность модели dmodel=32
- Сеть прямого распространения: размер скрытого слоя 128
- Многоголовое внимание: 4 головы внимания
- Обработка выходных данных: генерация финального предсказания через 2-слойный MLP
- Замораживание слоев извлечения признаков: замораживание параметров слоя встраивания, позиционного кодирования и модулей многоголового внимания
- Тонкая настройка адаптационных слоев: сохранение обучаемости последующих слоев для адаптации к новым условиям мощности передачи
- Введение функции активации LeakyReLU и дополнительного линейного слоя в компоненты MLP
- Использование малой скорости обучения для стабильной передачи знаний
- Требуется только 10% данных целевого домена для тонкой настройки
- Конфигурация полосы: полоса C (191,0-197,0 ТГц) и полоса L (184,5-190,5 ТГц), по 50 каналов в каждой
- Интервал между каналами: 100 ГГц, скорость символов 96 ГБод
- Защитная полоса: 500 ГГц между полосами C и L
- Параметры оптоволокна: 80 км стандартного одномодового оптоволокна ITU-T G.652.D
- Характеристики шума: NF=5 дБ для полосы C, NF=6 дБ для полосы L
- Масштаб данных: 4000 различных конфигураций мощности насоса, 70% для обучения, 30% для тестирования
- Количество насосов: 5
- Длины волн насосов: 1455, 1469, 1484, 1498, 1514 нм
- Диапазон мощности: 0-200 мВт равномерное распределение
- Оптимизатор: Adam, начальная скорость обучения 1×10⁻³
- Размер пакета: 256
- Максимальное количество эпох: 1000 (стратегия ранней остановки)
- Расписание скорости обучения: ReduceLROnPlateau
- Производительность RMSE: RMSE < 0,22 дБ в 90% случаев
- Распределение вероятностей: проверка высокой точности предсказания модели через PDF и CDF
При различных условиях мощности передачи (от -4 дБм до 2 дБм):
- Размах колебаний: < 0,86 дБ (100 каналов)
- Среднее отклонение: < 0,1 дБ (относительно целевого GSNR)
- Спектральное покрытие: 10,3 ТГц полоса C+L
- Эффективность данных: эффективная передача с использованием только 10% данных целевого домена
- Способность адаптации: успешная адаптация к условиям мощности передачи 2 дБм и -2 дБм
- Сохранение производительности: сохранение высокоточного моделирования и оптимизации после передачи
- Механизм самовнимания Transformer эффективно захватывает сложное отображение между мощностью насоса и GSNR
- Архитектура кодировщик-декодировщик обеспечивает двусторонее моделирование без необходимости в дополнительных алгоритмах оптимизации
- Трансферное обучение значительно повышает обобщающую способность модели при различных мощностях передачи
- Многополосные системы оптической передачи: технология расширения полосы C+L
- Оптимизация рамановского усилителя: выравнивание усиления и оптимизация шума
- Применение машинного обучения: нейросетевое моделирование и алгоритмы оптимизации
- По сравнению с традиционными методами ANN, Transformer обладает более сильной способностью к моделированию последовательностей
- Стратегия трансферного обучения значительно повышает адаптивность модели и эффективность использования данных
- Сквозная архитектура одновременно решает проблемы моделирования и оптимизации
- Предложенная архитектура Transformer на основе трансферного обучения показывает отличные результаты в оптимизации рамановского насоса для полосы C+L
- Достигнуто высокоточное моделирование (RMSE < 0,22 дБ в 90% случаев) и эффективная оптимизация
- Стратегия трансферного обучения позволяет модели эффективно адаптироваться к динамическим условиям мощности передачи
- Эксперименты проводились только в среде моделирования, отсутствует проверка на реальных системах
- Сложность модели может ограничить применение в реальном времени
- Эффективность трансферного обучения зависит от сходства между исходным и целевым доменами
- Проверка производительности платформы на реальных системах оптической передачи
- Расширение на большее количество полос и более сложные сетевые топологии
- Оптимизация структуры модели для повышения вычислительной эффективности
- Техническая инновационность: первое применение Transformer и трансферного обучения к оптимизации рамановского усилителя
- Полнота методологии: сквозная архитектура, решающая одновременно проблемы моделирования и оптимизации
- Достаточность экспериментов: детальная настройка параметров и оценка производительности
- Практическая ценность: значительное повышение эффективности использования данных (требуется только 10% данных для передачи)
- Ограничения проверки: отсутствие экспериментальной проверки на реальных системах
- Недостаточное сравнение: отсутствие достаточного сравнения с другими передовыми методами машинного обучения
- Теоретический анализ: отсутствие теоретического объяснения эффективности трансферного обучения
- Научный вклад: введение новой парадигмы машинного обучения в область оптической связи
- Практическая ценность: предоставление практического инструмента для оптимизации систем полосы C+L
- Воспроизводимость: детальная экспериментальная установка способствует воспроизведению результатов
- Проектирование рамановского усилителя для систем оптической передачи полосы C+L
- Оптимизация параметров усилителя при динамических условиях сети
- Выравнивание производительности в многополосных оптических сетях
Статья цитирует 8 связанных работ, охватывающих ключевые области многополосной передачи, рамановских усилителей и применения машинного обучения, обеспечивая прочную теоретическую базу для исследования.
Общая оценка: Это статья с высокой технической инновационностью, применяющая передовые методы машинного обучения к оптимизации систем оптической связи. Методология проектирования и экспериментальная проверка достаточно полны. Хотя отсутствует проверка на реальных системах, работа предоставляет ценный технологический путь для развития данной области.