Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
AI-आधारित मौसम पूर्वानुमान मॉडल का निदान करने के लिए समूह डेटा समन्वय: ClimaX संस्करण 0.3.1 के साथ एक केस
कृत्रिम बुद्धिमत्ता (AI) मौसम पूर्वानुमान अनुसंधान तेजी से विकसित हो रहा है और उन्नत गतिशील संख्यात्मक मौसम पूर्वानुमान मॉडल के साथ प्रतिस्पर्धा दिखा रहा है। हालांकि, AI मौसम पूर्वानुमान मॉडल के साथ डेटा समन्वय को एकीकृत करने का अनुसंधान अभी भी सीमित है, आंशिक रूप से क्योंकि डेटा समन्वय प्रणाली का मूल्यांकन करने के लिए दीर्घकालीन अनुक्रमिक डेटा समन्वय चक्र की आवश्यकता होती है। यह अनुसंधान AI मौसम पूर्वानुमान मॉडल का निदान करने के लिए समूह डेटा समन्वय का उपयोग करने का प्रस्ताव देता है और पहली बार समूह कलमान फिल्टर और AI मौसम पूर्वानुमान मॉडल के संयोजन को सफलतापूर्वक लागू करता है। AI मॉडल ClimaX के आधार पर प्रयोग दर्शाते हैं कि समूह कलमान फिल्टर में सहप्रसरण विस्तार और स्थानीयकरण तकनीकों का उपयोग करके, समूह डेटा समन्वय स्थिर रूप से चक्रीय रूप से चल सकता है। हालांकि ClimaX गतिशील मॉडल की तुलना में प्रवाह-निर्भर त्रुटि सहप्रसरण को पकड़ने में सीमाएं हैं, AI समूह पूर्वानुमान विरल अवलोकन क्षेत्रों में उचित और लाभकारी त्रुटि सहप्रसरण प्रदान करता है। इसके अलावा, समूह डेटा समन्वय ने ClimaX समूह पूर्वानुमान के आधार पर त्रुटि वृद्धि गतिशील NWP मॉडल की तुलना में कमजोर है, जिससे उच्च विस्तार कारक होता है। प्रयोगों की एक श्रृंखला ने साबित किया कि समूह डेटा समन्वय AI मौसम पूर्वानुमान मॉडल की भौतिक संगति और सटीक त्रुटि वृद्धि प्रतिनिधित्व जैसी विशेषताओं का निदान करने के लिए उपयोग किया जा सकता है।
चरम मौसम का बढ़ता खतरा: जलवायु परिवर्तन के कारण चरम मौसम की घटनाएं तेजी से गंभीर हो रही हैं, विश्व आर्थिक मंच ने चरम मौसम को सबसे गंभीर वैश्विक खतरों में से एक के रूप में सूचीबद्ध किया है
AI मौसम पूर्वानुमान का तीव्र विकास: दिसंबर 2022 में Google DeepMind द्वारा GraphCast जारी करने के बाद से, गहन शिक्षण मौसम पूर्वानुमान अनुसंधान तेजी से बढ़ रहा है, जिसमें Huawei का Pangu-Weather, Microsoft का ClimaX और Stormer, और Nvidia का FourCastNet शामिल है
डेटा समन्वय अनुसंधान में देरी: हालांकि AI मौसम पूर्वानुमान मॉडल पहले से ही सबसे उन्नत NWP मॉडल के साथ प्रतिस्पर्धा कर सकते हैं, AI मॉडल के साथ डेटा समन्वय को एकीकृत करने का अनुसंधान अभी भी सीमित है
तकनीकी चुनौतियाँ: दीर्घकालीन अनुक्रमिक डेटा समन्वय प्रयोगों की आवश्यकता AI मॉडल की डेटा समन्वय प्रणाली का मूल्यांकन करना मुश्किल बनाती है
विधि अंतराल: हालांकि भिन्नात्मक डेटा समन्वय और AI मॉडल के संयोजन का अनुसंधान है, अभी तक समूह कलमान फिल्टर और AI मॉडल के संयोजन का कोई सफल मामला नहीं है
निदान आवश्यकता: AI मौसम पूर्वानुमान मॉडल की विशेषताओं, जैसे भौतिक संगति और त्रुटि वृद्धि प्रतिनिधित्व का निदान करने के लिए प्रभावी तरीकों की आवश्यकता है
इस अनुसंधान का मुख्य कार्य समूह डेटा समन्वय तकनीक को AI मौसम पूर्वानुमान मॉडल पर लागू करना है, इसकी विशेषताओं का निदान करने और डेटा समन्वय प्रणाली में इसके प्रदर्शन का मूल्यांकन करने के लिए। इनपुट वायुमंडलीय अवलोकन डेटा और AI मॉडल पूर्वानुमान है, आउटपुट समन्वित विश्लेषण क्षेत्र है।
अल्पकालीन पूर्वानुमान सीमाएं: ClimaX लंबी अवधि के प्राकृतिक एकीकरण नहीं कर सकता, 6 घंटे के पूर्वानुमान के बाद धीरे-धीरे वास्तविक वायुमंडल से विचलित होता है
गैर-भौतिक क्षेत्र उत्पादन: दीर्घकालीन पूर्वानुमान मौसम विज्ञान की दृष्टि से अवास्तविक मौसम क्षेत्र उत्पन्न करता है (जैसे प्रशांत महासागर में अत्यधिक कम तापमान)
आकर्षक समस्या: AI मॉडल मौसम विज्ञान की दृष्टि से उचित आकर्षक प्रक्षेपवक्र पर वापस नहीं जा सकता
इष्टतम स्थानीयकरण पैमाना छोटा: 600 km गतिशील मॉडल के 900 km से महत्वपूर्ण रूप से छोटा है, प्रवाह-निर्भर त्रुटि सहप्रसरण को पकड़ने की क्षमता में कमी दर्शाता है
OSSE नहीं कर सकते: दीर्घकालीन पूर्वानुमान की अस्थिरता के कारण, अवलोकन प्रणाली सिमुलेशन प्रयोग नहीं कर सकते
भौतिक बाधा की कमी: AI मॉडल में भौतिक कानून की बाधा की कमी है, गैर-वास्तविक मौसम क्षेत्र उत्पन्न करने की प्रवृत्ति है
अपर्याप्त त्रुटि वृद्धि: समूह विचलन अपर्याप्त है, उच्च विस्तार कारक की आवश्यकता है
Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.
यह पेपर AI मौसम पूर्वानुमान और डेटा समन्वय के संयोजन में अग्रणी महत्व रखता है। हालांकि कुछ तकनीकी सीमाएं हैं, लेकिन यह इस क्षेत्र के विकास के लिए महत्वपूर्ण आधार स्थापित करता है और उच्च शैक्षणिक मूल्य और व्यावहारिक संभावना रखता है।