Radiative transfer is a fundamental process in astrophysics, essential for both interpreting observations and modeling thermal and dynamical feedback in simulations via ionizing radiation and photon pressure. However, numerically solving the underlying radiative transfer equation is computationally intensive due to the complex interaction of light with matter and the disparity between the speed of light and the typical gas velocities in astrophysical environments, making it particularly expensive to include the effects of on-the-fly radiation in hydrodynamic simulations. This motivates the development of surrogate models that can significantly accelerate radiative transfer calculations while preserving high accuracy. We present a surrogate model based on a Fourier Neural Operator architecture combined with U-Nets. Our model approximates three-dimensional, monochromatic radiative transfer in time-dependent regimes, in absorption-emission approximation, achieving speedups of more than 2 orders of magnitude while maintaining an average relative error below 3%, demonstrating our approach's potential to be integrated into state-of-the-art hydrodynamic simulations.
논문 ID : 2511.08219제목 : Emulating Radiative Transfer in Astrophysical Environments저자 : Rune Rost, Lorenzo Branca, Tobias Buck (하이델베르크 대학교 학제간 과학 계산 센터)분류 : astro-ph.IM (천문 기기 방법), astro-ph.GA (은하 천체물리학), cs.LG (기계학습)발표 학회 : 1st Workshop on Differentiable Systems and Scientific Machine Learning EurIPS 2025논문 링크 : https://arxiv.org/abs/2511.08219 방사선 전달은 천체물리학의 기본 과정으로, 관측 데이터 해석 및 이온화 방사선과 광자 압력의 열역학적 피드백을 모의하는 데 필수적이다. 그러나 빛과 물질의 복잡한 상호작용과 광속과 일반적인 기체 속도 간의 거대한 차이로 인해, 방사선 전달 방정식(RTE)의 수치 해석은 계산 비용이 매우 높으며, 유체역학 모의에 방사선 효과를 실시간으로 포함시키는 것은 특히 비싸다. 본 논문은 흡수-방출 근사 하에서 3차원 단색 방사선 전달의 시간 진화를 모델링하기 위해 푸리에 신경 연산자(FNO)와 U-Net 아키텍처를 결합한 대리 모델을 제안하며, 2개 수량급의 가속을 달성하면서 평균 상대 오차를 3% 이하로 유지하여, 최첨단 유체역학 모의에 통합할 수 있는 잠재력을 보여준다.
방사선 전달 방정식(RTE)의 수치 해석은 천체물리학 모의에서 심각한 계산 병목 현상에 직면해 있다:
RTE 방정식 :
1 c ∂ I ν ∂ t + ω ⋅ ∇ I ν + ( k ν , s + k ν , a ) ρ I ν = j ν ρ + k ν , s ρ 4 π ∫ S I ν d w ′ \frac{1}{c}\frac{\partial I_\nu}{\partial t} + \omega \cdot \nabla I_\nu + (k_{\nu,s} + k_{\nu,a})\rho I_\nu = j_\nu\rho + \frac{k_{\nu,s}\rho}{4\pi}\int_S I_\nu dw' c 1 ∂ t ∂ I ν + ω ⋅ ∇ I ν + ( k ν , s + k ν , a ) ρ I ν = j ν ρ + 4 π k ν , s ρ ∫ S I ν d w ′
여기서 I ν I_\nu I ν 는 분광 방사 강도이며, 시간 t t t , 공간 위치 x x x , 방향 ω \omega ω , 주파수 ν \nu ν 에 대한 높은 차원의 의존성을 가지므로 계산 복잡도가 극히 높다.
관측 진단 : 물리 모델과 관측 데이터를 연결하는 핵심 다리열역학적 피드백 : 광자 가열을 통해 기체 열역학에 영향방사선 압력 : 기체 동역학 진화에 영향은하 형성 : 거대 분자운 등 별 형성 영역의 방사선 효과 연구에 필수적몬테카를로 방법 : 높은 계산 비용광선 추적 : 메모리 요구량이 원천 수와 격자 수에 선형적으로 증가 O ( N s o u r c e s N c e l l s ) O(N_{sources}N_{cells}) O ( N so u rces N ce ll s ) 모멘트 방법 : 광속이 기체 속도보다 훨씬 크므로(c > > v g a s c >> v_{gas} c >> v g a s ) 극히 작은 시간 단계 필요전통적 심층학습 방법 : 격자 이산화 및 매개변수 설정 간 일반화 능력 부족, 고차원 PDE 문제에서 안정성 및 정확도 문제기존 연구 공백 : 저자의 지식으로는 시간 의존 방사선 전달에 대한 에뮬레이터가 없음신경 연산자 기반의 데이터 기반 대리 모델을 개발하여:
무한 차원 함수 공간에서 작동하여 격자 이산화 간 일반화 능력 향상 높은 정확도를 유지하면서 계산을 크게 가속화 유체역학 모의에 즉시 사용 가능한 대체 방안으로 통합 첫 번째 시간 의존 방사선 전달 에뮬레이터 : 저자의 지식으로는 시간 진화 방사선 전달을 위한 첫 번째 신경 연산자 에뮬레이터혁신적 아키텍처 설계 : 푸리에 신경 연산자(FNO)와 U-Net을 결합한 U-FNO 아키텍처를 제안하여 전역 의존성 포착과 미세 규모 특징 모델링을 모두 고려현저한 성능 향상 :시간 진화 예측: ~600배 가속, 평균 상대 오차 2.9% 정상 상태 예측: ~6750배 가속, 상대 오차 2.6% 메모리 비용이 원천 수와 무관하여 광선 추적의 핵심 병목 해결 다중 주파수 확장 방안 : 현대 유체역학 모의 요구사항에 부합하는 다중 주파수 방사선 전달로의 확장을 위한 명확한 경로 제공오픈소스 구현 : 완전히 재현 가능한 코드 제공 (https://github.com/RuneRost/Astro-RT.git )입력 :
a ( x ) = k ν , a ρ ( x ) a(x) = k_{\nu,a}\rho(x) a ( x ) = k ν , a ρ ( x ) : 흡수장(밀도와 관련)j ( x ) = j ν ρ ( x ) j(x) = j_\nu\rho(x) j ( x ) = j ν ρ ( x ) : 방출장(방사선원 분포)I ν , t ( x ) I_{\nu,t}(x) I ν , t ( x ) : 현재 시각의 방사선 강도출력 :
I ν , t + 1 ( x ) I_{\nu,t+1}(x) I ν , t + 1 ( x ) : 다음 시각의 방사선 강도단순화 가정 :
산란 없음 (실제 on-the-fly 계산과 일치) 각도 의존성 일시 무시(향후 작업) 단색 방사선(다중 주파수로 확장 가능) 3차원 공간 64 3 64^3 6 4 3 격자 입력 [j(x), a(x), I_{ν,t}(x)]
↓
상승 계층 P (고차원 잠재 공간으로 매핑)
↓
U-푸리에 계층 × N (N=6)
↓
투영 계층 Q (출력 차원으로 매핑)
↓
출력 I_{ν,t+1}(x)
각 U-푸리에 계층은 세 개의 병렬/순차 구성요소를 포함한다:
a) 컨볼루션 적분 연산자(푸리에 변환을 통해) :
FFT 변환을 주파수 영역으로: F \mathcal{F} F 학습 가능한 가중치 곱셈: R R R 역 FFT 변환을 공간 영역으로: F − 1 \mathcal{F}^{-1} F − 1 모드 절단: 처음 K=4개 모드만 유지(복잡도 감소, 부드러운 예측 장려) b) 아핀 변환 : ( W , b ) (W, b) ( W , b )
c) U-Net 모듈 :
인코더-디코더 구조 대칭적 다운샘플링 및 업샘플링 경로 세부 정보 보존을 위한 스킵 연결 작은 컨볼루션 커널(2×2×2 또는 3×3×3)로 미세 규모 특징 정확히 위치 파악 너비: 16(정상 상태) 또는 32(시간 진화) FNO의 장점 :
무한 차원 함수 공간에서 매핑 학습 전역 의존성 포착 이론적으로 격자 불변성 보유 U-Net의 장점 :
급격한 기울기 및 불연속성 처리 작은 컨볼루션 커널로 정확한 국소 특징 위치 파악 스킵 연결로 다중 규모 정보 보존 결합의 필요성 : 순수 FNO 모델의 상대 오차는 60%에 달하지만, U-Net 추가 후 2.9%로 감소
U-푸리에 계층 : 처음으로 U-Net을 각 푸리에 계층에 통합(단순 적층이 아님)다중 규모 특징 융합 : 전역 푸리에 특징 + 국소 U-Net 특징훈련: 연속 시간 단계 쌍 ( I ν , t , I ν , t + 1 ) (I_{\nu,t}, I_{\nu,t+1}) ( I ν , t , I ν , t + 1 ) 사용 추론: 재귀적으로 적용, 예측을 다음 단계의 입력으로 사용 완전한 시간 진화 모의 구현 로그 변환 : 여러 수량급에 걸친 데이터 처리최소-최대 정규화 : 0,1 구간으로 스케일링별도 정규화 : 흡수, 방출, 강도장 독립적으로 처리L = ∑ i = 1 N ( f ^ i − f i ) 2 ∑ i = 1 N ( f i ) 2 + λ ∑ i = 1 N ( ∇ f ^ i − ∇ f i ) 2 ∑ i = 1 N ( ∇ f i ) 2 L = \frac{\sqrt{\sum_{i=1}^N(\hat{f}_i - f_i)^2}}{\sqrt{\sum_{i=1}^N(f_i)^2}} + \lambda\frac{\sqrt{\sum_{i=1}^N(\nabla\hat{f}_i - \nabla f_i)^2}}{\sqrt{\sum_{i=1}^N(\nabla f_i)^2}} L = ∑ i = 1 N ( f i ) 2 ∑ i = 1 N ( f ^ i − f i ) 2 + λ ∑ i = 1 N ( ∇ f i ) 2 ∑ i = 1 N ( ∇ f ^ i − ∇ f i ) 2
상대 오차 손실(절대 오차가 높은 값 영역에 편향되는 것을 피함) 공간 기울기 항(λ = 0.5 \lambda=0.5 λ = 0.5 )으로 급격한 특징 재구성 장려 흐릿한 예측 문제 해결 생성 방법 : jf1uids 유체역학 코드를 사용하여 난류 주기 상자 생성격자 : 64 3 64^3 6 4 3 공간 해상도다양성 전략 :
난류 난수 시드 변화 속도 섭동 진폭 변화 난류 동역학 에너지 전력 스펙트럼 기울기 변화 난류 스펙트럼이 안정적인 평형에 도달할 때까지 실행 물리 시나리오 : 거대 분자운(별 형성 영역) 조건 모의방사선원 : 밀도장 상위 1.5%의 고밀도 영역에 배치시간 단계 : 각 샘플 10개 시간 단계, I ν , 0 ( x ) = 0 I_{\nu,0}(x)=0 I ν , 0 ( x ) = 0 에서 시작수치 해석 : JAX로 구현된 광선 추적 알고리즘 사용샘플 수 : 400개의 ( a ( x ) , j ( x ) ) (a(x), j(x)) ( a ( x ) , j ( x )) 쌍 → 3600개의 훈련 샘플로 확장분할 : 훈련 70%(2520), 검증 10%(360), 테스트 20%(720)밀도 모델링 : 로그 정규 난수장(난류 별 형성 영역 모의)방출장 : 가우스 분포, 밀도 상위 1%의 픽셀 중심(별 방출 모의)흡수 계수 : k ν , a = 1 k_{\nu,a}=1 k ν , a = 1 (단순화)샘플 수 : 1000개분할 : 훈련 70%(700), 검증 10%(100), 테스트 20%(200)픽셀 수준 평균 상대 오차 :
Relative Error = 1 N ∑ i = 1 N ∣ I ^ i − I i ∣ ∣ I i ∣ \text{Relative Error} = \frac{1}{N}\sum_{i=1}^N\frac{|\hat{I}_i - I_i|}{|I_i|} Relative Error = N 1 ∑ i = 1 N ∣ I i ∣ ∣ I ^ i − I i ∣
(I i = 0 I_i=0 I i = 0 인 픽셀 제외)가속 비율 : 모델 추론 시간 vs 수치 해석기 시간시각적 평가 : 다양한 단면의 잔차 그래프를 통해수치 기준 : JAX로 구현된 광선 추적 알고리즘아키텍처 비교 : 순수 FNO vs U-FNO문헌 비교 : 다른 3D 정적 RT 에뮬레이터27 와의 성능 비교훈련: NVIDIA H100 GPU (시간 진화) / A100 GPU (정상 상태) 추론: 동일 알고리즘 : AdamW (분리된 가중치 감쇠 포함)학습률 스케줄 : 지수 감쇠
시간 진화: 초기값 0.0006, 감쇠율 0.912 정상 상태: 초기값 0.0005, 감쇠율 0.900 계층 수: 6 계층 너비: 32 푸리에 모드 수: 4 U-Net 컨볼루션 커널: 2×2×2 U-Net 너비: 32 드롭아웃: 0.08 가중치 감쇠: 0.0052 시간 진화 : 20 에포크, ~320분정상 상태 : 40 에포크, ~80분하이퍼파라미터 최적화 : Optuna 자동 검색프레임워크 : JAX (JIT 컴파일 + GPU 가속)지표 수치 평균 상대 오차(단일 단계) 2.9% 추론 시간 0.1초 수치 해석 시간 59.2초 가속 비율 ~600배 메모리 복잡도 원천 수와 무관
주요 발견 :
예측이 수치 참조와 높은 일치도 잔차는 주로 진화 구조 가장자리에 집중 오차는 시간에 따라 누적되지만 작게 유지(재귀 예측 특성) 히스토그램은 오차가 대략 가우스 분포를 따르며 약간의 음의 왜도(네트워크가 예측을 평활화하는 경향) 지표 수치 평균 상대 오차 2.6% 추론 시간 0.003초 수치 해석 시간 20.3초 가속 비율 ~6750배
문헌 비교 : 다른 3D 정적 RT 에뮬레이터27 의 성능과 일치하거나 초과
아키텍처 비교 :
순수 FNO : 상대 오차 60% (실패)U-FNO : 상대 오차 2.9% (성공)결론 : U-Net의 통합은 급격한 기울기 및 불연속성 처리에 필수적
z=32 단면 : 10개 시간 단계의 완전한 진화 표시특징 : 방사선이 원천점에서 점진적으로 확산되어 복잡한 강도 패턴 형성잔차 : 진화 전선에 주로 위치, 크기 <0.2(정규화 규모)교차 차원 일관성 : x=32, y=32, z=32 단면이 유사한 성능 표시(그림 10)복잡한 위상 : 다중 원천 방사선이 복잡한 강도 분포 생성정확한 재구성 : 예측이 모든 주요 구조 포착잔차 분포 : 균일하게 분포, 체계적 편향 없음단일 단계 오차 : 2.9%누적 효과 : 그림 8은 오차가 시간 단계 증가에 따라 점진적으로 증가함을 보여줌10번째 단계 : 대부분의 픽셀 오차는 여전히 <10%편향 방향 : 약간의 양의 편향, 예측 진화가 참조보다 약간 빠름을 나타냄주요 위치 : 구조 가장자리 및 진화 전선평활 영역 : 극히 작은 오차높은 기울기 영역 : 상대적으로 큰 오차이지만 여전히 허용 가능테스트 세트 샘플은 다양한 난류 구성에서 나옴 안정적인 성능, 미처 본 물리 시나리오로의 좋은 일반화를 나타냄 몬테카를로 방법 20 : 통계적 샘플링, 정확하지만 느림광선 추적 25 : 직접 해석, 메모리 병목모멘트 방법 24 : 차원 축소 근사, 시간 단계 제한중력 트리 근사 21, 13 : 특정 시나리오 최적화물리 정보 신경망(PINNs) 19 : 물리 제약 포함, 일반화 능력 제한전통적 CNN 18 : 방사선 열 전달에 사용, 강한 격자 의존성본 논문의 장점 : 첫 번째 시간 의존 RT 에뮬레이터, 더 나은 일반화 능력통용 근사 정리 6 : 이론적 기초FNO 16 : 푸리에 공간 컨볼루션연산자 학습 개요 15 : 이론 및 알고리즘U-FNO 29 : 본 논문 아키텍처의 영감 원천(다상 흐름에 적용)RAMSES-RT 24 : 우주론적 방사선 유체역학AREPO-RT 14 : 이동 격자 방사선 유체역학GMC 모의 8 : 거대 분자운 방사선 효과본 논문의 위치 : 이러한 모의의 가속 모듈로 작용기술 타당성 : U-FNO가 높은 정확도의 방사선 전달 모의를 성공적으로 구현, 오차 <3%계산 효율성 : 가속 비율이 2-3개 수량급에 도달, 실시간 모의 요구사항 충족메모리 장점 : 원천 수와 분리, 광선 추적의 핵심 병목 해결통합 잠재력 : 즉시 사용 가능한 모듈로 기존 유체역학 코드에 통합 가능확장성 : 다중 주파수 방안이 명확함(각 주파수 대역별 독립 훈련 또는 통합 모델)문제 : U-Net 통합으로 인해 FNO의 분해능 불변성 상실영향 : 목표 분해능에서 훈련 필요완화 : 고정 격자 시나리오에서 영향 제한; 분해능 독립 기술 존재29 문제 : 전체 장을 예측해야 하며, 국소 계산 불가능영향 : 국소 영역만 관심 있을 때 불필요한 오버헤드적용 시나리오 : 전역 방사선장이 필요한 응용현재 : 단일 주파수 모델만 시연확장 : 각 주파수 대역별로 독립 모델 훈련 필요계산 비용 : 다중 주파수 통합 모델 훈련 비용 높음(부록 A는 초기 결과 오차가 2개 수량급 높음을 보여줌)산란 없음 : 대부분의 on-the-fly 계산과 일치하지만 일반성 제한각도 의존성 없음 : 문제 단순화, 향후 확장 필요샘플 수 : 3600개 훈련 샘플(시간 진화)데이터 생성 : 훈련 데이터 생성을 위해 비싼 수치 모의 필요일반화 범위 : 훈련 데이터가 포함하는 물리 영역으로 제한완전한 RTE 해석으로 확장 방사선의 방향성 정보 포착 부록 A는 초기 결과 제시 추가 아키텍처 및 하이퍼파라미터 최적화 필요 6배 데이터 복잡도 증가 대응 유체역학 코드와의 결합 실제 과학 응용 검증 장시간 안정성 테스트 완전한 산란항 포함 더 복잡한 방사선-물질 상호작용 처리 고정 격자 제한 해결 진정한 분해능 불변성 구현 공백 채우기 : 첫 번째 시간 의존 방사선 전달 신경 연산자 에뮬레이터실제 가치 : 계산 천체물리학의 계산 병목에 직접 대응이론적 기여 : 고차원 시간 의존 PDE에서 신경 연산자의 효과성 입증아키텍처 설계 : U-FNO가 전역 및 국소 특징을 효과적으로 결합손실 함수 : 기울기항이 흐릿한 예측 문제를 효과적으로 해결재귀 전략 : 임의 길이의 시간 진화 구현다중 시나리오 검증 : 시간 진화 + 정상 상태상세 분석 : 다양한 단면, 시간 단계, 오차 분포 포함절제 실험 : U-Net 기여도 명확화성능 비교 : 문헌 결과와 비교오픈소스 코드 : 완전히 재현 가능효율적 구현 : JAX + JIT 컴파일상세 문서 : 부록에 모든 구현 세부사항 포함논리 명확, 구조 완정 풍부한 시각화(10개 그림) 정확한 수학 표현 수렴성 분석 부재 오차 누적의 이론적 한계 미제시 일반화 능력의 이론적 보장 부재 산란 없음 가정이 응용 범위 제한 각도 의존성 부재로 일반성 감소 단일 주파수 모델은 다중 훈련 필요 400개 물리 시나리오는 모든 천체물리학 환경을 포함하기에 부족할 수 있음 64 3 64^3 6 4 3 분해능으로만 제한더 높은 분해능의 일반화 미테스트 다른 기계학습 방법(예: PINNs)과의 직접 비교 부재 다른 신경 연산자 아키텍처(예: DeepONet)와의 비교 부재 정상 상태 모델은 문헌27 과만 비교, 해당 방법 재현 미수행 10개 시간 단계만 테스트 더 긴 시간 진화의 오차 누적 미알려짐 유체역학과의 결합 안정성 미검증 훈련 비용(320분)이 수치 해석 총 비용과 비교 미수행 다중 주파수 모델 훈련 비용이 추론 가속을 상쇄할 수 있음 메모리 점유의 구체적 수치 미제시 개척적 : 시간 의존 PDE 신경 연산자 에뮬레이션 연구 열풍 가능성학제간 : 기계학습과 계산 천체물리학 연결방법론 : U-FNO 아키텍처를 다른 분야로 이전 가능직접 응용 : RAMSES-RT, AREPO-RT 등 코드에 통합 가능계산 절감 : 대규모 모의에서 수천 GPU 시간 절감 가능과학 발견 : 가속으로 인해 이전에 불가능한 매개변수 연구 가능커뮤니티 광범위 채택을 위해 대규모 검증 필요 훈련 데이터 생성 비용이 확산을 제한할 수 있음 물리 단순화의 실제 응용 영향 평가 필요 고정 격자 유체 모의 : RAMSES, ENZO 등다중 원천 방사선 시나리오 : 메모리 장점 명확반복 계산 필요 : 훈련 비용 분산 가능중간 분해능 : 64 3 64^3 6 4 3 근처산란 없는 영역 : HII 영역, 이온화 전선적응형 격자 : 현재 아키텍처 미지원극고 분해능 : 재훈련 필요강한 산란 매질 : 조밀한 먼지 구름 등일회성 계산 : 훈련 비용 분산 불가각도 정보 필요 : 방사선 압력 방향성 등우주 재이온화 모의 : 대규모 방사선 전달별 형성 피드백 : GMC의 방사선 효과행성 대기 : 방사선 전달 모델링핵합성 네트워크 : 유사 고차원 시간 의존 문제16 Li et al. 2020 - 푸리에 신경 연산자: FNO 원본 논문29 Wen et al. 2022 - U-FNO: 본 논문 아키텍처 영감 원천24 Rosdahl et al. 2013 - RAMSES-RT: 주류 방사선 유체역학 코드14 Kannan et al. 2019 - AREPO-RT: 이동 격자 방사선 유체역학19 Mishra & Molinaro 2021 - RT용 PINNs: 관련 기계학습 연구27 Su et al. 2025 - CO선 방사선 전달 에뮬레이터: 비교 기준6 Chen & Chen 1995 - 연산자 통용 근사 정리: 이론적 기초이것은 높은 품질의 학제간 연구 논문 으로, 최첨단 기계학습 기술(신경 연산자)을 계산 천체물리학의 핵심 과제(방사선 전달)에 성공적으로 적용했다. 논문의 주요 장점은:
명확한 과학적 가치 : 실제 계산 병목 해결, 600배 가속 달성방법 혁신 : U-FNO 아키텍처가 전역 및 국소 특징을 효과적으로 결합개척성 : 첫 번째 시간 의존 RT 신경 연산자 에뮬레이터공학 완성도 : 오픈소스 코드, 상세 문서, 재현 가능주요 부족점은 물리 단순화(산란 없음, 각도 없음)와 이론 분석 부재이지만, 이는 원형 시스템에서 수용 가능하다. 논문은 계산 천체물리학에서 기계학습 응용을 위한 새로운 방향을 개척하며, 학술 및 실용적 가치가 높다.
추천 지수 : ⭐⭐⭐⭐☆ (4.5/5)