Radiative transfer is a fundamental process in astrophysics, essential for both interpreting observations and modeling thermal and dynamical feedback in simulations via ionizing radiation and photon pressure. However, numerically solving the underlying radiative transfer equation is computationally intensive due to the complex interaction of light with matter and the disparity between the speed of light and the typical gas velocities in astrophysical environments, making it particularly expensive to include the effects of on-the-fly radiation in hydrodynamic simulations. This motivates the development of surrogate models that can significantly accelerate radiative transfer calculations while preserving high accuracy. We present a surrogate model based on a Fourier Neural Operator architecture combined with U-Nets. Our model approximates three-dimensional, monochromatic radiative transfer in time-dependent regimes, in absorption-emission approximation, achieving speedups of more than 2 orders of magnitude while maintaining an average relative error below 3%, demonstrating our approach's potential to be integrated into state-of-the-art hydrodynamic simulations.
ID статьи : 2511.08219Название : Emulating Radiative Transfer in Astrophysical EnvironmentsАвторы : Rune Rost, Lorenzo Branca, Tobias Buck (Центр междисциплинарных научных вычислений Гейдельбергского университета)Классификация : astro-ph.IM (астрономические инструменты и методы), astro-ph.GA (галактическая астрофизика), cs.LG (машинное обучение)Конференция : 1st Workshop on Differentiable Systems and Scientific Machine Learning EurIPS 2025Ссылка на статью : https://arxiv.org/abs/2511.08219 Перенос излучения является фундаментальным процессом в астрофизике, критически важным для интерпретации наблюдательных данных и моделирования термодинамических обратных связей, вызванных ионизирующим излучением и давлением фотонов. Однако численное решение уравнения переноса излучения (РПИ) требует огромных вычислительных затрат из-за сложного взаимодействия света с веществом и огромной разницы между скоростью света и типичными скоростями газа, что делает включение радиационных эффектов в реальном времени в гидродинамические моделирования особенно дорогостоящим. В данной работе предлагается прокси-модель на основе операторов Фурье нейронных сетей (FNO) в сочетании с архитектурой U-Net для моделирования временной эволюции трёхмерного монохроматического переноса излучения в приближении поглощения-излучения, достигающая ускорения более чем на два порядка величины при сохранении средней относительной ошибки ниже 3%, демонстрируя потенциал интеграции в передовые гидродинамические моделирования.
Численное решение уравнения переноса излучения (РПИ) сталкивается с серьёзными вычислительными узкими местами в астрофизических моделированиях:
Уравнение РПИ :
1 c ∂ I ν ∂ t + ω ⋅ ∇ I ν + ( k ν , s + k ν , a ) ρ I ν = j ν ρ + k ν , s ρ 4 π ∫ S I ν d w ′ \frac{1}{c}\frac{\partial I_\nu}{\partial t} + \omega \cdot \nabla I_\nu + (k_{\nu,s} + k_{\nu,a})\rho I_\nu = j_\nu\rho + \frac{k_{\nu,s}\rho}{4\pi}\int_S I_\nu dw' c 1 ∂ t ∂ I ν + ω ⋅ ∇ I ν + ( k ν , s + k ν , a ) ρ I ν = j ν ρ + 4 π k ν , s ρ ∫ S I ν d w ′
где I ν I_\nu I ν — спектральная интенсивность излучения с высокомерной зависимостью (время t t t , пространственное положение x x x , направление ω \omega ω , частота ν \nu ν ), что приводит к экстремально высокой вычислительной сложности.
Диагностика наблюдений : ключевой мост между физическими моделями и наблюдательными даннымиТермодинамические обратные связи : влияние на термодинамику газа через фотоионизациюДавление излучения : воздействие на динамическую эволюцию газаФормирование галактик : критически важно при исследовании радиационных эффектов в областях звёздообразования, таких как гигантские молекулярные облакаМетоды Монте-Карло : высокие вычислительные затратыТрассировка лучей : требования к памяти растут линейно с числом источников и ячеек сетки O ( N s o u r c e s N c e l l s ) O(N_{sources}N_{cells}) O ( N so u rces N ce ll s ) Методы моментов : скорость света намного превышает скорость газа (c > > v g a s c >> v_{gas} c >> v g a s ), требуя чрезвычайно малых временных шаговТрадиционные методы глубокого обучения : плохая обобщаемость между дискретизациями сетки и параметрами, нестабильность и проблемы точности на высокомерных задачах УЧППробел в существующих работах : по знанию авторов, не существует эмуляторов для временнозависимого переноса излученияРазработка управляемой данными прокси-модели на основе нейронных операторов, способной:
Работать в бесконечномерных функциональных пространствах, повышая обобщаемость между дискретизациями сетки Значительно ускорить вычисления при сохранении высокой точности Служить готовым к использованию заменяемым модулем в гидродинамических моделированиях Первый эмулятор временнозависимого переноса излучения : по знанию авторов, это первый нейронный оператор-эмулятор для временнозависимого переноса излученияИнновационный дизайн архитектуры : предложена архитектура U-FNO, объединяющая операторы Фурье нейронных сетей (FNO) с U-Net, балансируя захват глобальных зависимостей и моделирование мелкомасштабных особенностейЗначительное повышение производительности :Прогнозирование временной эволюции: достигнуто ~600× ускорение, средняя относительная ошибка 2,9% Прогнозирование стационарного состояния: достигнуто ~6750× ускорение, относительная ошибка 2,6% Затраты памяти независимы от числа источников, решая критическое узкое место трассировки лучей Схема расширения на многочастотный случай : предоставлен явный путь расширения на многочастотный перенос излучения, соответствующий требованиям современных гидродинамических моделированийОткрытая реализация : предоставлен полностью воспроизводимый код (https://github.com/RuneRost/Astro-RT.git )Входные данные :
a ( x ) = k ν , a ρ ( x ) a(x) = k_{\nu,a}\rho(x) a ( x ) = k ν , a ρ ( x ) : поле поглощения (связано с плотностью)j ( x ) = j ν ρ ( x ) j(x) = j_\nu\rho(x) j ( x ) = j ν ρ ( x ) : поле излучения (распределение радиационных источников)I ν , t ( x ) I_{\nu,t}(x) I ν , t ( x ) : интенсивность излучения в текущий момент времениВыходные данные :
I ν , t + 1 ( x ) I_{\nu,t+1}(x) I ν , t + 1 ( x ) : интенсивность излучения в следующий момент времениУпрощающие предположения :
Режим без рассеяния (соответствует практическим on-the-fly вычислениям) Временно игнорируется угловая зависимость (будущие работы) Монохроматическое излучение (расширяемо на многочастотный случай) Трёхмерное пространство с сеткой 64 3 64^3 6 4 3 Входные данные [j(x), a(x), I_{ν,t}(x)]
↓
Слой повышения размерности P (отображение в высокомерное латентное пространство)
↓
U-Fourier слои × N (N=6)
↓
Слой проекции Q (отображение в размерность выхода)
↓
Выходные данные I_{ν,t+1}(x)
Каждый U-Fourier слой содержит три параллельных/последовательных компонента:
a) Оператор свёртки интегрирования (через преобразование Фурье) :
БПФ преобразование в частотную область: F \mathcal{F} F Умножение на обучаемые веса: R R R Обратное БПФ преобразование в пространственную область: F − 1 \mathcal{F}^{-1} F − 1 Усечение мод: сохраняются только первые K=4 моды (снижение сложности, поощрение гладких предсказаний) b) Аффинное преобразование : ( W , b ) (W, b) ( W , b )
c) U-Net модуль :
Архитектура кодировщик-декодировщик Симметричные пути понижающей и повышающей дискретизации Пропускающие соединения сохраняют детальную информацию Малые свёрточные ядра (2×2×2 или 3×3×3) для точной локализации мелкомасштабных особенностей Ширина: 16 (стационарное состояние) или 32 (временная эволюция) Преимущества FNO :
Обучение отображениям в бесконечномерном функциональном пространстве Захват глобальных зависимостей Теоретически инвариантно к разрешению сетки Преимущества U-Net :
Обработка острых градиентов и разрывов Малые свёрточные ядра обеспечивают точную локальную локализацию особенностей Пропускающие соединения сохраняют многомасштабную информацию Необходимость комбинации : чистая модель FNO показывает относительную ошибку 60%, добавление U-Net снижает её до 2,9%
U-Fourier слой : первое интегрирование U-Net в каждый слой Фурье, а не простое наложениеМногомасштабное слияние особенностей : глобальные особенности Фурье + локальные особенности U-NetОбучение: использование последовательных пар временных шагов ( I ν , t , I ν , t + 1 ) (I_{\nu,t}, I_{\nu,t+1}) ( I ν , t , I ν , t + 1 ) Вывод: рекурсивное применение, использование предсказания как входа для следующего шага Реализация полного моделирования временной эволюции Логарифмическое преобразование : обработка данных, охватывающих несколько порядков величиныMin-max нормализация : масштабирование в диапазон 0,1 Раздельная нормализация : независимая обработка полей поглощения, излучения и интенсивностиL = ∑ i = 1 N ( f ^ i − f i ) 2 ∑ i = 1 N ( f i ) 2 + λ ∑ i = 1 N ( ∇ f ^ i − ∇ f i ) 2 ∑ i = 1 N ( ∇ f i ) 2 L = \frac{\sqrt{\sum_{i=1}^N(\hat{f}_i - f_i)^2}}{\sqrt{\sum_{i=1}^N(f_i)^2}} + \lambda\frac{\sqrt{\sum_{i=1}^N(\nabla\hat{f}_i - \nabla f_i)^2}}{\sqrt{\sum_{i=1}^N(\nabla f_i)^2}} L = ∑ i = 1 N ( f i ) 2 ∑ i = 1 N ( f ^ i − f i ) 2 + λ ∑ i = 1 N ( ∇ f i ) 2 ∑ i = 1 N ( ∇ f ^ i − ∇ f i ) 2
Потеря относительной ошибки (избегает смещения абсолютной ошибки в сторону высоких значений) Член пространственного градиента (λ = 0.5 \lambda=0.5 λ = 0.5 ) поощряет реконструкцию острых особенностей Решает проблему размытых предсказаний Метод генерации : использование кода гидродинамики jf1uids для генерации турбулентного периодического ящикаСетка : пространственное разрешение 64 3 64^3 6 4 3 Стратегия разнообразия :
Варьирование случайного семени турбулентности Варьирование амплитуды возмущений скорости Варьирование показателя степени спектра кинетической энергии турбулентности Запуск до достижения турбулентным спектром стабильного равновесия Физический сценарий : моделирование условий гигантских молекулярных облаков (области звёздообразования)Радиационные источники : размещены в высокоплотных областях, составляющих верхние 1,5% по плотностиВременные шаги : 10 временных шагов на образец, начиная с I ν , 0 ( x ) = 0 I_{\nu,0}(x)=0 I ν , 0 ( x ) = 0 Численное решение : использование алгоритма трассировки лучей, реализованного на JAXКоличество образцов : 400 пар ( a ( x ) , j ( x ) ) (a(x), j(x)) ( a ( x ) , j ( x )) → развёрнуто в 3600 обучающих образцовРазделение : обучение 70% (2520), валидация 10% (360), тестирование 20% (720)Моделирование плотности : логнормальное случайное поле (моделирование турбулентной области звёздообразования)Поле излучения : гауссово распределение, центрированное на пиксели верхнего 1% по плотности (моделирование звёздного излучения)Коэффициент поглощения : k ν , a = 1 k_{\nu,a}=1 k ν , a = 1 (упрощение)Количество образцов : 1000Разделение : обучение 70% (700), валидация 10% (100), тестирование 20% (200)Средняя относительная ошибка на уровне пикселя :
Relative Error = 1 N ∑ i = 1 N ∣ I ^ i − I i ∣ ∣ I i ∣ \text{Relative Error} = \frac{1}{N}\sum_{i=1}^N\frac{|\hat{I}_i - I_i|}{|I_i|} Relative Error = N 1 ∑ i = 1 N ∣ I i ∣ ∣ I ^ i − I i ∣
(исключая пиксели с I i = 0 I_i=0 I i = 0 )Коэффициент ускорения : время вывода модели vs время численного решателяВизуальная оценка : остаточные графики по различным сечениямЧисленный базис : алгоритм трассировки лучей, реализованный на JAXСравнение архитектур : чистый FNO vs U-FNOСравнение с литературой : сравнение производительности с другими 3D эмуляторами статического РПИ 27 Обучение: NVIDIA H100 GPU (временная эволюция) / A100 GPU (стационарное состояние) Вывод: то же самое Алгоритм : AdamW (с развязанным затуханием веса)Расписание скорости обучения : экспоненциальное затухание
Временная эволюция: начальная 0.0006, коэффициент затухания 0.912 Стационарное состояние: начальная 0.0005, коэффициент затухания 0.900 Количество слоёв: 6 Ширина слоя: 32 Количество мод Фурье: 4 Свёрточное ядро U-Net: 2×2×2 Ширина U-Net: 32 Dropout: 0.08 Затухание веса: 0.0052 Временная эволюция : 20 эпох, ~320 минутСтационарное состояние : 40 эпох, ~80 минутОптимизация гиперпараметров : автоматический поиск OptunaФреймворк : JAX (JIT компиляция + ускорение GPU)Метрика Значение Средняя относительная ошибка (одношаговая) 2,9% Время вывода 0,1 сек Время численного решения 59,2 сек Коэффициент ускорения ~600× Сложность памяти Независима от числа источников
Ключевые находки :
Предсказания высоко согласуются с численным эталоном Остатки сосредоточены в основном на краях развивающихся структур Ошибка накапливается со временем, но остаётся небольшой (особенность рекурсивного прогнозирования) Гистограмма показывает приблизительно гауссово распределение ошибок с лёгким отрицательным смещением (сеть склонна к сглаживанию предсказаний) Метрика Значение Средняя относительная ошибка 2,6% Время вывода 0,003 сек Время численного решения 20,3 сек Коэффициент ускорения ~6750×
Сравнение с литературой : соответствует или превосходит производительность других 3D эмуляторов статического РПИ 27
Сравнение архитектур :
Чистый FNO : относительная ошибка 60% (неудача)U-FNO : относительная ошибка 2,9% (успех)Вывод : интеграция U-Net критически важна для обработки острых градиентов и разрывов
Сечение z=32 : демонстрирует полную эволюцию за 10 временных шаговОсобенности : излучение постепенно распространяется от источника, формируя сложный паттерн интенсивностиОстатки : в основном на фронте эволюции, величина <0,2 (нормализованная шкала)Согласованность между измерениями : сечения x=32, y=32, z=32 показывают аналогичное поведение (Рис. 10)Сложная топология : множественные источники создают сложное распределение интенсивностиТочная реконструкция : предсказание захватывает все основные структурыРаспределение остатков : равномерное, без систематических смещенийОдношаговая ошибка : 2,9%Кумулятивный эффект : Рис. 8 показывает постепенное увеличение ошибки с числом временных шагов10-й шаг : большинство пикселей имеют ошибку <10%Направление смещения : лёгкое положительное смещение, указывающее на то, что предсказанная эволюция немного быстрее эталонаОсновные локации : края структур и фронты эволюцииГладкие области : минимальная ошибкаОбласти высокого градиента : относительно большая ошибка, но всё ещё приемлемаяОбразцы тестового набора получены из различных конфигураций турбулентности Стабильная производительность указывает на хорошее обобщение на невиданные физические сценарии Методы Монте-Карло 20 : статистическая выборка, точная но медленнаяТрассировка лучей 25 : прямое решение, узкое место памятиМетоды моментов 24 : редукция размерности, ограничение временного шагаПриближение гравитационного дерева 21, 13 : оптимизация для специфических сценариевФизико-информированные нейронные сети (PINNs) 19 : встраивание физических ограничений, но ограниченная способность обобщенияТрадиционные CNN 18 : применение к радиационной теплопередаче, но сильная зависимость от сеткиПреимущества данной работы : первый эмулятор временнозависимого РПИ, лучшая способность обобщенияТеорема универсальной аппроксимации 6 : теоретическая основаFNO 16 : свёртка в пространстве ФурьеОбзор обучения операторам 15 : теория и алгоритмыU-FNO 29 : источник вдохновения для архитектуры данной работы (применение к многофазным потокам)RAMSES-RT 24 : космологическая радиационная гидродинамикаAREPO-RT 14 : радиационная гидродинамика на движущейся сеткеМоделирование GMC 8 : радиационные эффекты в гигантских молекулярных облакахПозиционирование данной работы : как модуль ускорения для этих моделированийТехническая осуществимость : U-FNO успешно реализует моделирование переноса излучения с высокой точностью, ошибка <3%Вычислительная эффективность : коэффициент ускорения достигает 2-3 порядков величины, удовлетворяя требованиям реального времениПреимущество памяти : независимость от числа источников решает критическое узкое место трассировки лучейПотенциал интеграции : может быть интегрирован как готовый к использованию модуль в существующие коды гидродинамикиРасширяемость : схема многочастотного расширения ясна (независимое обучение для каждой частоты или единая модель)Проблема : интеграция U-Net приводит к потере инвариантности разрешения FNOВлияние : требуется обучение на целевом разрешенииСмягчение : ограниченное влияние для сценариев с фиксированной сеткой; существуют методы независимости разрешения 29 Проблема : необходимо предсказывать всё поле, невозможно локальное вычислениеВлияние : ненужные затраты при интересе только к локальной областиПодходящие сценарии : приложения, требующие глобального поля излученияТекущее состояние : демонстрирует только модель одной частотыРасширение : требует независимого обучения для каждой частотыВычислительная стоимость : высокая стоимость обучения единой многочастотной модели (Приложение A показывает предварительные результаты с ошибкой на два порядка выше)Без рассеяния : соответствует большинству on-the-fly вычислений, но ограничивает универсальностьБез угловой зависимости : упрощает задачу, требует расширения в будущемОбъём образцов : 3600 обучающих образцов (временная эволюция)Генерация данных : требует дорогостоящего численного моделирования для создания обучающих данныхДиапазон обобщения : ограничен физическим режимом, охватываемым обучающими даннымиРасширение на полное решение РПИ Захват информации о направленности излучения Приложение A показывает предварительные результаты Требуется дальнейшая оптимизация архитектуры и гиперпараметров Противодействие 6-кратному увеличению сложности данных Связь с кодами гидродинамики Валидация на реальных научных приложениях Тестирование долгосрочной стабильности Включение полного члена рассеяния Обработка более сложного взаимодействия излучения с веществом Решение ограничений фиксированной сетки Достижение истинной инвариантности разрешения Заполнение пробела : первый нейронный оператор-эмулятор временнозависимого переноса излученияПрактическая ценность : прямое решение вычислительного узкого места в астрофизическом моделированииТеоретический вклад : демонстрация эффективности нейронных операторов для высокомерных временнозависимых УЧПДизайн архитектуры : U-FNO искусно объединяет глобальные и локальные особенностиФункция потерь : член градиента эффективно решает проблему размытых предсказанийРекурсивная стратегия : реализует временную эволюцию произвольной длиныМногосценарийная валидация : временная эволюция + стационарное состояниеДетальный анализ : включает множественные сечения, временные шаги, распределения ошибокАбляционные исследования : ясно демонстрирует вклад U-NetСравнение производительности : сравнение с результатами литературыОткрытый код : полностью воспроизводимоЭффективная реализация : JAX + JIT компиляцияПодробная документация : приложение содержит все детали реализацииЛогичная структура, полная организация Богатая визуализация (10 рисунков) Точная математическая нотация Отсутствие анализа сходимости Теоретические границы накопления ошибки не предоставлены Отсутствуют теоретические гарантии способности обобщения Предположение об отсутствии рассеяния ограничивает область применения Отсутствие угловой зависимости снижает универсальность Модель одной частоты требует множественного обучения 400 физических сценариев может быть недостаточно для охвата всех астрофизических окружений Ограничено разрешением 64 3 64^3 6 4 3 Обобщение на более высокие разрешения не тестировалось Отсутствует прямое сравнение с другими методами машинного обучения (например, PINNs) Не проведено сравнение с другими архитектурами нейронных операторов (например, DeepONet) Модель стационарного состояния сравнивается только с литературой 27 , метод не воспроизведён Тестирование только на 10 временных шагов Накопление ошибок при более длительной эволюции неизвестно Стабильность при связи с гидродинамикой не верифицирована Стоимость обучения (320 минут) не сравнена с общей стоимостью численного решения Стоимость обучения многочастотной модели может нивелировать ускорение вывода Конкретные значения использования памяти не предоставлены Новаторство : может инициировать волну исследований нейронных операторов для временнозависимых УЧПМеждисциплинарность : связывает машинное обучение и вычислительную астрофизикуМетодология : архитектура U-FNO может быть перенесена в другие областиПрямое применение : может быть интегрирована в RAMSES-RT, AREPO-RT и другие кодыЭкономия вычислений : может сэкономить тысячи GPU часов в крупномасштабных моделированияхНаучные открытия : ускорение может сделать ранее невозможные параметрические исследования осуществимымиТребуется крупномасштабная валидация для широкого принятия сообществом Стоимость генерации обучающих данных может ограничить распространение Физические упрощения требуют оценки влияния в реальных приложениях Моделирование на фиксированной сетке : такие как RAMSES, ENZO и др.Сценарии с множественными источниками : преимущество памяти очевидноТребующие повторных вычислений : стоимость обучения может быть амортизированаСреднее разрешение : около 64 3 64^3 6 4 3 Режим без рассеяния : такие как HII области, ионизационные фронтыАдаптивная сетка : текущая архитектура не поддерживаетЭкстремально высокое разрешение : требует переобученияСильно рассеивающие среды : такие как плотные пылевые облакаОдиночные вычисления : стоимость обучения не может быть амортизированаТребующие информации о направлении : такие как направленное давление излученияМоделирование космической реионизации : крупномасштабный перенос излученияОбратная связь звёздообразования : радиационные эффекты в GMCАтмосферы планет : моделирование переноса излученияСетевые синтезы : аналогичные высокомерные временнозависимые задачи16 Li et al. 2020 - Fourier Neural Operator: оригинальная статья FNO29 Wen et al. 2022 - U-FNO: источник вдохновения для архитектуры данной работы24 Rosdahl et al. 2013 - RAMSES-RT: основной код радиационной гидродинамики14 Kannan et al. 2019 - AREPO-RT: радиационная гидродинамика на движущейся сетке19 Mishra & Molinaro 2021 - PINNs для РПИ: связанная работа по машинному обучению27 Su et al. 2025 - Эмулятор переноса излучения CO линий: эталон для сравнения6 Chen & Chen 1995 - Теорема универсальной аппроксимации операторов: теоретическая основаЭто высокачественная междисциплинарная исследовательская статья , успешно применяющая передовые методы машинного обучения (нейронные операторы) к основным вызовам вычислительной астрофизики (перенос излучения). Основные преимущества работы:
Ясная научная ценность : решение реального вычислительного узкого места, коэффициент ускорения 600×Методологическая инновация : архитектура U-FNO эффективно объединяет глобальные и локальные особенностиНоваторство : первый нейронный оператор-эмулятор временнозависимого переноса излученияИнженерная полнота : открытый код, подробная документация, воспроизводимостьОсновные недостатки связаны с физическими упрощениями (без рассеяния, без угловой зависимости) и отсутствием теоретического анализа, но эти ограничения приемлемы для прототипной системы. Статья открывает новое направление применения машинного обучения в вычислительной астрофизике, обладая высокой академической и практической ценностью.
Рекомендуемая оценка : ⭐⭐⭐⭐☆ (4,5/5)