Radiative transfer is a fundamental process in astrophysics, essential for both interpreting observations and modeling thermal and dynamical feedback in simulations via ionizing radiation and photon pressure. However, numerically solving the underlying radiative transfer equation is computationally intensive due to the complex interaction of light with matter and the disparity between the speed of light and the typical gas velocities in astrophysical environments, making it particularly expensive to include the effects of on-the-fly radiation in hydrodynamic simulations. This motivates the development of surrogate models that can significantly accelerate radiative transfer calculations while preserving high accuracy. We present a surrogate model based on a Fourier Neural Operator architecture combined with U-Nets. Our model approximates three-dimensional, monochromatic radiative transfer in time-dependent regimes, in absorption-emission approximation, achieving speedups of more than 2 orders of magnitude while maintaining an average relative error below 3%, demonstrating our approach's potential to be integrated into state-of-the-art hydrodynamic simulations.
ID del Artículo : 2511.08219Título : Emulating Radiative Transfer in Astrophysical EnvironmentsAutores : Rune Rost, Lorenzo Branca, Tobias Buck (Centro de Computación Científica Interdisciplinaria, Universidad de Heidelberg)Clasificación : astro-ph.IM (Métodos e Instrumentos Astronómicos), astro-ph.GA (Astrofísica Galáctica), cs.LG (Aprendizaje Automático)Conferencia de Publicación : 1st Workshop on Differentiable Systems and Scientific Machine Learning EurIPS 2025Enlace del Artículo : https://arxiv.org/abs/2511.08219 La transferencia radiativa es un proceso fundamental en astrofísica, esencial para interpretar datos observacionales y simular retroalimentación termohidrodinámica de radiación ionizante y presión de fotones. Sin embargo, la resolución numérica de la ecuación de transferencia radiativa (RTE) es computacionalmente costosa debido a las complejas interacciones entre luz y materia, así como a la enorme diferencia entre la velocidad de la luz y las velocidades típicas del gas, siendo especialmente prohibitiva la inclusión de efectos radiativos en tiempo real en simulaciones de hidrodinámica. Este artículo propone un modelo sustituto basado en operadores neuronales de Fourier (FNO) combinados con arquitectura U-Net para modelar la evolución temporal de la transferencia radiativa monocromática tridimensional bajo la aproximación de absorción-emisión, logrando una aceleración de más de dos órdenes de magnitud mientras se mantiene un error relativo medio inferior al 3%, demostrando el potencial de integración en simulaciones de hidrodinámica de última generación.
La resolución numérica de la ecuación de transferencia radiativa (RTE) enfrenta un grave cuello de botella computacional en simulaciones astrofísicas:
Ecuación RTE :
1 c ∂ I ν ∂ t + ω ⋅ ∇ I ν + ( k ν , s + k ν , a ) ρ I ν = j ν ρ + k ν , s ρ 4 π ∫ S I ν d w ′ \frac{1}{c}\frac{\partial I_\nu}{\partial t} + \omega \cdot \nabla I_\nu + (k_{\nu,s} + k_{\nu,a})\rho I_\nu = j_\nu\rho + \frac{k_{\nu,s}\rho}{4\pi}\int_S I_\nu dw' c 1 ∂ t ∂ I ν + ω ⋅ ∇ I ν + ( k ν , s + k ν , a ) ρ I ν = j ν ρ + 4 π k ν , s ρ ∫ S I ν d w ′
donde I ν I_\nu I ν es la intensidad radiativa espectral, con dependencias de alta dimensionalidad (tiempo t t t , posición espacial x x x , dirección ω \omega ω , frecuencia ν \nu ν ), resultando en complejidad computacional extrema.
Diagnóstico Observacional : Puente clave que conecta modelos físicos con datos observacionalesRetroalimentación Termohidrodinámica : Afecta la termodinámica del gas mediante calentamiento fotoeléctricoPresión Radiativa : Influye en la evolución dinámica del gasFormación Galáctica : Crítica en estudios de efectos radiativos en regiones de formación estelar como nubes moleculares gigantesMétodos de Montecarlo : Costo computacional elevadoTrazado de Rayos : Requisitos de memoria crecen linealmente con el número de fuentes y celdas O ( N s o u r c e s N c e l l s ) O(N_{sources}N_{cells}) O ( N so u rces N ce ll s ) Métodos de Momentos : La velocidad de la luz es mucho mayor que la velocidad del gas (c > > v g a s c >> v_{gas} c >> v g a s ), requiriendo pasos de tiempo extremadamente pequeñosMétodos de Aprendizaje Profundo Tradicionales : Pobre capacidad de generalización entre discretizaciones de malla y configuraciones de parámetros, enfrentando desafíos de estabilidad y precisión en problemas PDE de alta dimensiónVacío en Trabajos Existentes : Según los autores, no existe simulador para transferencia radiativa dependiente del tiempoDesarrollar un modelo sustituto impulsado por datos basado en operadores neuronales que pueda:
Operar en espacios de funciones de dimensión infinita, mejorando la capacidad de generalización entre discretizaciones de malla Acelerar significativamente el cálculo mientras se mantiene alta precisión Integrarse como solución de reemplazo plug-and-play en simulaciones de hidrodinámica Primer Simulador de Transferencia Radiativa Dependiente del Tiempo : Según los autores, este es el primer simulador de operador neuronal para transferencia radiativa con evolución temporalDiseño Arquitectónico Innovador : Se propone la arquitectura U-FNO, que combina operadores neuronales de Fourier (FNO) con U-Net, equilibrando la captura de dependencias globales y el modelado de características de escala finaMejora Significativa de Rendimiento :Predicción de evolución temporal: ~600× aceleración, error relativo medio 2.9% Predicción de estado estacionario: ~6750× aceleración, error relativo 2.6% Costo de memoria independiente del número de fuentes, resolviendo el cuello de botella clave del trazado de rayos Plan de Extensión Multifrecuencia : Proporciona una ruta clara para extender a transferencia radiativa multifrecuencia, alineada con necesidades de simulaciones de hidrodinámica modernasImplementación de Código Abierto : Proporciona código completamente reproducible (https://github.com/RuneRost/Astro-RT.git )Entradas :
a ( x ) = k ν , a ρ ( x ) a(x) = k_{\nu,a}\rho(x) a ( x ) = k ν , a ρ ( x ) : Campo de absorción (relacionado con densidad)j ( x ) = j ν ρ ( x ) j(x) = j_\nu\rho(x) j ( x ) = j ν ρ ( x ) : Campo de emisión (distribución de fuentes radiativas)I ν , t ( x ) I_{\nu,t}(x) I ν , t ( x ) : Intensidad radiativa en el tiempo actualSalidas :
I ν , t + 1 ( x ) I_{\nu,t+1}(x) I ν , t + 1 ( x ) : Intensidad radiativa en el siguiente tiempoSupuestos Simplificadores :
Régimen sin dispersión (consistente con cálculos on-the-fly) Dependencia angular ignorada temporalmente (trabajo futuro) Radiación monocromática (extensible a multifrecuencia) Espacio tridimensional con malla 64 3 64^3 6 4 3 Entrada [j(x), a(x), I_{ν,t}(x)]
↓
Capa de Elevación P (mapeo a espacio latente de alta dimensión)
↓
Capas U-Fourier × N (N=6)
↓
Capa de Proyección Q (mapeo a dimensión de salida)
↓
Salida I_{ν,t+1}(x)
Cada capa U-Fourier contiene tres componentes en paralelo/serie:
a) Operador Integral de Convolución (mediante Transformada de Fourier) :
Transformación FFT al dominio de frecuencias: F \mathcal{F} F Multiplicación por pesos aprendibles: R R R Transformación FFT inversa al dominio espacial: F − 1 \mathcal{F}^{-1} F − 1 Truncamiento de modos: Solo se conservan los primeros K=4 modos (reducción de complejidad, fomenta predicciones suaves) b) Transformación Afín : ( W , b ) (W, b) ( W , b )
c) Módulo U-Net :
Estructura codificador-decodificador Rutas simétricas de submuestreo y sobremuestreo Conexiones de salto preservan información de detalles Núcleos de convolución pequeños (2×2×2 o 3×3×3) localizan con precisión características de escala fina Ancho: 16 (estado estacionario) o 32 (evolución temporal) Ventajas de FNO :
Aprende mapeos en espacios de funciones de dimensión infinita Captura dependencias globales Teóricamente invariante a la malla Ventajas de U-Net :
Maneja gradientes pronunciados y discontinuidades Núcleos de convolución pequeños logran localización precisa de características locales Conexiones de salto preservan información multiescala Necesidad de Combinación : El modelo FNO puro tiene error relativo del 60%, que se reduce al 2.9% al agregar U-Net
Capa U-Fourier : Primera integración de U-Net en cada capa de Fourier, en lugar de simple apilamientoFusión de Características Multiescala : Características de Fourier globales + características locales de U-NetEntrenamiento: Uso de pares de pasos de tiempo consecutivos ( I ν , t , I ν , t + 1 ) (I_{\nu,t}, I_{\nu,t+1}) ( I ν , t , I ν , t + 1 ) Inferencia: Aplicación recursiva, usando predicción como entrada del siguiente paso Implementa simulación de evolución temporal completa Transformación Logarítmica : Maneja datos que abarcan múltiples órdenes de magnitudNormalización Min-Max : Escala a intervalo 0,1 Normalización Separada : Campos de absorción, emisión e intensidad procesados independientementeL = ∑ i = 1 N ( f ^ i − f i ) 2 ∑ i = 1 N ( f i ) 2 + λ ∑ i = 1 N ( ∇ f ^ i − ∇ f i ) 2 ∑ i = 1 N ( ∇ f i ) 2 L = \frac{\sqrt{\sum_{i=1}^N(\hat{f}_i - f_i)^2}}{\sqrt{\sum_{i=1}^N(f_i)^2}} + \lambda\frac{\sqrt{\sum_{i=1}^N(\nabla\hat{f}_i - \nabla f_i)^2}}{\sqrt{\sum_{i=1}^N(\nabla f_i)^2}} L = ∑ i = 1 N ( f i ) 2 ∑ i = 1 N ( f ^ i − f i ) 2 + λ ∑ i = 1 N ( ∇ f i ) 2 ∑ i = 1 N ( ∇ f ^ i − ∇ f i ) 2
Pérdida de error relativo (evita sesgo del error absoluto hacia regiones de valores altos) Término de gradiente espacial (λ = 0.5 \lambda=0.5 λ = 0.5 ) fomenta reconstrucción de características pronunciadas Resuelve problema de predicciones borrosas Método de Generación : Generado usando código de hidrodinámica jf1uids en caja periódica turbulentaMalla : Resolución espacial 64 3 64^3 6 4 3 Estrategia de Diversidad :
Variación de semilla aleatoria de turbulencia Variación de amplitud de perturbación de velocidad Variación de índice de pendiente del espectro de potencia de energía cinética turbulenta Ejecución hasta que el espectro turbulento alcanza equilibrio estable Escenario Físico : Simulación de condiciones de nubes moleculares gigantes (regiones de formación estelar)Fuentes Radiativas : Colocadas en regiones de alta densidad (1.5% superior de densidad)Pasos Temporales : 10 pasos temporales por muestra, comenzando desde I ν , 0 ( x ) = 0 I_{\nu,0}(x)=0 I ν , 0 ( x ) = 0 Resolución Numérica : Algoritmo de trazado de rayos implementado en JAXNúmero de Muestras : 400 pares ( a ( x ) , j ( x ) ) (a(x), j(x)) ( a ( x ) , j ( x )) → expandidos a 3600 muestras de entrenamientoDivisión : Entrenamiento 70% (2520), Validación 10% (360), Prueba 20% (720)Modelado de Densidad : Campo aleatorio lognormal (simula región de formación estelar turbulenta)Campo de Emisión : Distribución gaussiana, centrada en píxeles del 1% superior de densidad (simula emisión estelar)Coeficiente de Absorción : k ν , a = 1 k_{\nu,a}=1 k ν , a = 1 (simplificado)Número de Muestras : 1000División : Entrenamiento 70% (700), Validación 10% (100), Prueba 20% (200)Error Relativo Medio a Nivel de Píxel :
Error Relativo = 1 N ∑ i = 1 N ∣ I ^ i − I i ∣ ∣ I i ∣ \text{Error Relativo} = \frac{1}{N}\sum_{i=1}^N\frac{|\hat{I}_i - I_i|}{|I_i|} Error Relativo = N 1 ∑ i = 1 N ∣ I i ∣ ∣ I ^ i − I i ∣
(excluyendo píxeles donde I i = 0 I_i=0 I i = 0 )Relación de Aceleración : Tiempo de inferencia del modelo vs tiempo del solucionador numéricoEvaluación Visual : Mediante mapas de residuos en diferentes secciones transversalesReferencia Numérica : Algoritmo de trazado de rayos implementado en JAXComparación de Arquitecturas : FNO puro vs U-FNOComparación con Literatura : Comparación de rendimiento con otros simuladores de RT 3D estático 27 Entrenamiento: GPU NVIDIA H100 (evolución temporal) / A100 GPU (estado estacionario) Inferencia: Igual que arriba Algoritmo : AdamW (con decaimiento de peso desacoplado)Programación de Tasa de Aprendizaje : Decaimiento exponencial
Evolución temporal: inicial 0.0006, tasa de decaimiento 0.912 Estado estacionario: inicial 0.0005, tasa de decaimiento 0.900 Número de capas: 6 Ancho de capa: 32 Número de modos de Fourier: 4 Núcleo de convolución U-Net: 2×2×2 Ancho de U-Net: 32 Dropout: 0.08 Decaimiento de peso: 0.0052 Evolución Temporal : 20 épocas, ~320 minutosEstado Estacionario : 40 épocas, ~80 minutosOptimización de Hiperparámetros : Búsqueda automática con OptunaMarco : JAX (compilación JIT + aceleración GPU)Métrica Valor Error Relativo Medio (paso único) 2.9% Tiempo de Inferencia 0.1 segundos Tiempo de Resolución Numérica 59.2 segundos Relación de Aceleración ~600× Complejidad de Memoria Independiente del número de fuentes
Hallazgos Clave :
Predicción altamente consistente con referencia numérica Residuos principalmente concentrados en bordes de estructuras en evolución Error acumulado con el tiempo pero permanece pequeño (característica de predicción recursiva) Histograma muestra distribución de error aproximadamente gaussiana, con ligero sesgo negativo (red tiende a suavizar predicciones) Métrica Valor Error Relativo Medio 2.6% Tiempo de Inferencia 0.003 segundos Tiempo de Resolución Numérica 20.3 segundos Relación de Aceleración ~6750×
Comparación con Literatura : Iguala o supera el rendimiento de otros simuladores de RT 3D estático 27
Comparación de Arquitecturas :
FNO Puro : Error relativo 60% (fallo)U-FNO : Error relativo 2.9% (éxito)Conclusión : La integración de U-Net es crucial para manejar gradientes pronunciados y discontinuidades
Sección z=32 : Muestra evolución completa en 10 pasos temporalesCaracterísticas : Radiación se difunde gradualmente desde punto fuente, formando patrones de intensidad complejosResiduos : Principalmente en frente de evolución, magnitud <0.2 (escala normalizada)Consistencia Transversal : Secciones x=32, y=32, z=32 muestran comportamiento similar (Figura 10)Topología Compleja : Múltiples fuentes producen distribución de intensidad complejaReconstrucción Precisa : Predicción captura todas las estructuras principalesDistribución de Residuos : Distribución uniforme, sin sesgo sistemáticoError de Paso Único : 2.9%Efecto Acumulativo : Figura 8 muestra aumento gradual del error con pasos temporalesPaso 10 : Mayoría de píxeles con error <10%Dirección de Sesgo : Ligero sesgo positivo, indicando que evolución predicha es ligeramente más rápida que referenciaUbicación Principal : Bordes de estructuras y frentes de evoluciónRegiones Suaves : Error mínimoRegiones de Alto Gradiente : Error relativo mayor pero aún aceptableMuestras de conjunto de prueba provienen de configuraciones de turbulencia diferentes Rendimiento estable, indicando buena generalización a escenarios físicos no vistos Métodos de Montecarlo 20 : Muestreo estadístico, preciso pero lentoTrazado de Rayos 25 : Resolución directa, cuello de botella de memoriaMétodos de Momentos 24 : Aproximación de reducción de dimensión, limitación de pasos temporalesAproximación de Árbol Gravitacional 21, 13 : Optimización para escenarios específicosRedes Neuronales Informadas por Física (PINNs) 19 : Restricciones físicas incrustadas, pero capacidad de generalización limitadaCNN Tradicionales 18 : Para transferencia radiativa térmica, pero fuerte dependencia de mallaVentaja de Este Trabajo : Primer simulador de RT dependiente del tiempo, mejor capacidad de generalizaciónTeorema de Aproximación Universal 6 : Fundamento teóricoFNO 16 : Convolución en espacio de FourierRevisión de Aprendizaje de Operadores 15 : Teoría y algoritmosU-FNO 29 : Inspiración arquitectónica de este trabajo (aplicación a flujos multifásicos)RAMSES-RT 24 : Hidrodinámica radiativa cosmológicaAREPO-RT 14 : Hidrodinámica radiativa de malla móvilSimulación GMC 8 : Efectos radiativos en nubes moleculares gigantesPosicionamiento de Este Trabajo : Como módulo de aceleración para estas simulacionesViabilidad Técnica : U-FNO logra exitosamente simulación de transferencia radiativa de alta precisión, con error <3%Eficiencia Computacional : Relación de aceleración alcanza 2-3 órdenes de magnitud, satisfaciendo requisitos de simulación en tiempo realVentaja de Memoria : Desacoplamiento del número de fuentes, resolviendo cuello de botella clave del trazado de rayosPotencial de Integración : Puede integrarse como módulo plug-and-play en códigos de hidrodinámica existentesExtensibilidad : Plan multifrecuencia claramente definido (entrenamiento independiente por segmento de frecuencia o modelo unificado)Problema : Integración de U-Net causa pérdida de invariancia de resolución de FNOImpacto : Requiere entrenamiento en resolución objetivoMitigación : Impacto limitado en escenarios de malla fija; existen técnicas de independencia de resolución 29 Problema : Debe predecir campo completo, sin cálculo localImpacto : Sobrecarga innecesaria cuando solo interesa región localEscenarios Aplicables : Aplicaciones que requieren campo radiativo globalActual : Solo demuestra modelo monofrecuenciaExtensión : Requiere entrenamiento de modelo independiente para cada segmento de frecuenciaCosto Computacional : Modelo multifrecuencia unificado tiene costo de entrenamiento alto (Apéndice A muestra resultados preliminares con error dos órdenes de magnitud mayor)Sin Dispersión : Consistente con mayoría de cálculos on-the-fly, pero limita generalidadSin Dependencia Angular : Simplifica problema, requiere extensión futuraVolumen de Muestras : 3600 muestras de entrenamiento (evolución temporal)Generación de Datos : Requiere simulación numérica costosa para generar datos de entrenamientoRango de Generalización : Limitado a régimen físico cubierto por datos de entrenamientoExtensión a solución RTE completa Captura de información direccional de radiación Apéndice A muestra resultados preliminares Requiere optimización adicional de arquitectura e hiperparámetros Abordaje de aumento de complejidad de datos 6× Acoplamiento con código de hidrodinámica Validación en aplicaciones científicas reales Pruebas de estabilidad a largo plazo Inclusión de término de dispersión completo Manejo de interacciones radiación-materia más complejas Resolución de limitaciones de malla fija Implementación de verdadera invariancia de resolución Llenar Vacío : Primer simulador de operador neuronal de transferencia radiativa dependiente del tiempoValor Práctico : Abordaje directo del cuello de botella computacional en simulaciones astrofísicasContribución Teórica : Demostración de efectividad de operadores neuronales en PDE de alta dimensión dependientes del tiempoDiseño Arquitectónico : U-FNO combina ingeniosamente características globales y localesFunción de Pérdida : Término de gradiente resuelve efectivamente problema de predicciones borrosasEstrategia Recursiva : Implementa evolución temporal de longitud arbitrariaValidación Multiescenario : Evolución temporal + estado estacionarioAnálisis Detallado : Incluye múltiples secciones transversales, pasos temporales, distribuciones de errorExperimentos de Ablación : Clarifica contribución de U-NetComparación de Rendimiento : Comparación con resultados de literaturaCódigo Abierto : Completamente reproducibleImplementación Eficiente : JAX + compilación JITDocumentación Detallada : Apéndice contiene todos los detalles de implementaciónLógica clara, estructura completa Visualización abundante (10 figuras) Expresión matemática precisa Falta análisis de convergencia Límites teóricos de acumulación de error no proporcionados Garantías teóricas de capacidad de generalización ausentes Supuesto sin dispersión limita rango de aplicación Falta de dependencia angular reduce generalidad Modelo monofrecuencia requiere múltiples entrenamientos 400 escenarios físicos pueden ser insuficientes para cubrir todos los entornos astrofísicos Limitado a resolución 64 3 64^3 6 4 3 Generalización a resoluciones más altas no probada Falta comparación directa con otros métodos de aprendizaje automático (como PINNs) Sin comparación con otras arquitecturas de operadores neuronales (como DeepONet) Modelo de estado estacionario solo comparado con literatura 27 , método no reproducido Solo prueba 10 pasos temporales Acumulación de error en evolución temporal más larga desconocida Estabilidad del acoplamiento con hidrodinámica no verificada Costo de entrenamiento (320 minutos) no comparado con costo total de resolución numérica Costo de entrenamiento de modelo multifrecuencia puede compensar aceleración de inferencia Valores específicos de ocupación de memoria no proporcionados Carácter Pionero : Puede desencadenar ola de investigación en simuladores de operadores neuronales para PDE dependientes del tiempoInterdisciplinario : Conecta aprendizaje automático y astrofísica computacionalMetodología Transferible : Arquitectura U-FNO puede transferirse a otros camposAplicación Directa : Puede integrarse en RAMSES-RT, AREPO-RT y códigos similaresAhorro Computacional : En simulaciones grandes puede ahorrar miles de horas GPUDescubrimiento Científico : Aceleración puede hacer viables estudios de parámetros previamente imposiblesRequiere validación a gran escala para adopción comunitaria amplia Costo de generación de datos de entrenamiento puede limitar propagación Simplificaciones físicas requieren evaluación de impacto en aplicaciones reales Simulaciones de Fluidos en Malla Fija : Como RAMSES, ENZO, etc.Escenarios de Múltiples Fuentes : Ventaja de memoria evidenteCálculos Repetidos : Costo de entrenamiento amortizableResolución Media : Alrededor de 64 3 64^3 6 4 3 Régimen Sin Dispersión : Como regiones HII, frentes de ionizaciónMalla Adaptativa : Arquitectura actual no soportaResolución Extremadamente Alta : Requiere reentrenamientoMedio Fuertemente Dispersor : Como nubes de polvo densasCálculo Único : Costo de entrenamiento no amortizableRequiere Información Angular : Como dirección de presión radiativaSimulación de Reionización Cósmica : Transferencia radiativa a gran escalaRetroalimentación de Formación Estelar : Efectos radiativos en GMCAtmósferas Planetarias : Modelado de transferencia radiativaRedes de Síntesis Nuclear : Problemas similares de alta dimensión dependientes del tiempo16 Li et al. 2020 - Fourier Neural Operator: Artículo original de FNO29 Wen et al. 2022 - U-FNO: Inspiración arquitectónica de este trabajo24 Rosdahl et al. 2013 - RAMSES-RT: Código de hidrodinámica radiativa principal14 Kannan et al. 2019 - AREPO-RT: Hidrodinámica radiativa de malla móvil19 Mishra & Molinaro 2021 - PINNs for RT: Trabajo de aprendizaje automático relacionado27 Su et al. 2025 - Simulador de transferencia radiativa de línea CO: Referencia de comparación6 Chen & Chen 1995 - Teorema de aproximación universal de operadores: Fundamento teóricoEste es un artículo de investigación de alta calidad interdisciplinaria que integra exitosamente tecnología de aprendizaje automático de vanguardia (operadores neuronales) con desafíos centrales de astrofísica computacional (transferencia radiativa). Las principales fortalezas del artículo son:
Valor Científico Claro : Resuelve cuello de botella computacional real, relación de aceleración 600×Innovación Metodológica : Arquitectura U-FNO combina efectivamente características globales y localesCarácter Pionero : Primer simulador de operador neuronal de transferencia radiativa dependiente del tiempoCompletitud de Ingeniería : Código abierto, documentación detallada, completamente reproducibleLas deficiencias principales radican en simplificaciones físicas (sin dispersión, sin ángulo) y análisis teórico insuficiente, pero estas son aceptables en un sistema prototipo. El artículo abre nuevas direcciones para aplicaciones de aprendizaje automático en astrofísica computacional, con valor académico y práctico considerable.
Índice de Recomendación : ⭐⭐⭐⭐☆ (4.5/5)