Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
AI 기반 날씨 예측 모델 진단을 위한 앙상블 자료동화: ClimaX 버전 0.3.1 사례
인공지능(AI) 날씨 예측 연구가 빠르게 발전하여 첨단 역학적 수치 날씨 예측 모델과의 경쟁력을 보여주고 있습니다. 그러나 AI 날씨 예측 모델과 자료동화를 결합한 연구는 여전히 제한적이며, 그 이유 중 하나는 자료동화 시스템 평가에 장기간의 순차적 자료동화 순환이 필요하기 때문입니다. 본 연구는 앙상블 자료동화를 사용하여 AI 날씨 예측 모델을 진단하는 방법을 제안하며, 앙상블 칼만 필터와 AI 날씨 예측 모델의 결합을 처음으로 성공적으로 구현했습니다. AI 모델 ClimaX를 기반으로 한 실험은 앙상블 칼만 필터에서 공분산 팽창 및 국지화 기법을 사용함으로써 앙상블 자료동화가 안정적으로 순환 운영될 수 있음을 보여줍니다. ClimaX는 흐름 의존 오차 공분산 포착 측면에서 역학적 모델에 비해 제한이 있지만, AI 앙상블 예측은 관측이 희소한 지역에서 합리적이고 유용한 오차 공분산을 제공합니다. 또한 앙상블 자료동화는 ClimaX 앙상블 예측 기반의 오차 증가가 역학적 NWP 모델보다 약하여 더 높은 팽창 인자를 초래함을 드러냅니다. 일련의 실험은 앙상블 자료동화가 AI 날씨 예측 모델의 물리적 일관성 및 정확한 오차 증가 표현 등의 특성을 진단하는 데 사용될 수 있음을 입증합니다.
극단 기상 위협 심화: 기후 변화로 인한 극단 기상 사건이 날로 심각해지고 있으며, 세계경제포럼은 극단 기상을 가장 심각한 전 지구적 위협 중 하나로 선정했습니다
AI 날씨 예측의 급속한 발전: 2022년 12월 Google DeepMind의 GraphCast 발표 이후 심층 학습 날씨 예측 연구가 급속히 증가했으며, 화웨이의 Pangu-Weather, 마이크로소프트의 ClimaX 및 Stormer, 엔비디아의 FourCastNet 등이 포함됩니다
자료동화 연구의 지연: AI 날씨 예측 모델이 최첨단 NWP 모델과 경쟁할 수 있음에도 불구하고, AI 모델과 자료동화를 결합한 연구는 여전히 제한적입니다
Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.
본 논문은 AI 날씨 예측과 자료동화 결합 측면에서 획기적인 의미를 가지며, 일부 기술적 제한이 있음에도 불구하고 해당 분야의 발전을 위한 중요한 기초를 마련했으며, 높은 학술적 가치와 실용적 잠재력을 보유하고 있습니다.