Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
استخدام تمثيل البيانات الجماعي لتشخيص نموذج التنبؤ بالطقس القائم على الذكاء الاصطناعي: حالة مع ClimaX الإصدار 0.3.1
يتطور البحث في التنبؤ بالطقس القائم على الذكاء الاصطناعي (AI) بسرعة، وقد أظهر قدرة تنافسية مع نماذج التنبؤ العددي الديناميكي المتقدمة. ومع ذلك، لا تزال الدراسات التي تجمع بين نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي وتمثيل البيانات محدودة، جزئياً لأن تقييم أنظمة تمثيل البيانات يتطلب حلقات تمثيل بيانات متسلسلة طويلة الأجل. تقترح هذه الدراسة استخدام تمثيل البيانات الجماعي لتشخيص نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي، وتحقق بنجاح للمرة الأولى من دمج مرشح كالمان المحول المحلي (LETKF) مع نموذج التنبؤ بالطقس القائم على الذكاء الاصطناعي. تُظهر التجارب القائمة على نموذج ClimaX أنه من خلال استخدام تضخيم التباين والتقنيات المحلية في مرشح كالمان الجماعي، يمكن لتمثيل البيانات الجماعي أن يعمل بشكل مستقر في حلقات متكررة. على الرغم من أن ClimaX يواجه قيوداً مقارنة بالنماذج الديناميكية في التقاط مصفوفات التباين المعتمدة على التدفق، فإن التنبؤ الجماعي القائم على الذكاء الاصطناعي يوفر مصفوفات تباين معقولة ومفيدة في المناطق ذات الملاحظات النادرة. علاوة على ذلك، يكشف تمثيل البيانات الجماعي أن نمو الخطأ بناءً على التنبؤ الجماعي لـ ClimaX أضعف من نماذج التنبؤ العددي الديناميكي، مما يؤدي إلى عوامل تضخيم أعلى. تثبت سلسلة من التجارب أن تمثيل البيانات الجماعي يمكن استخدامه لتشخيص خصائص نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي مثل الاتساق الفيزيائي والتمثيل الدقيق لنمو الخطأ.
تصاعد تهديدات الطقس القاسي: الأحداث الجوية القاسية الناجمة عن تغير المناخ تزداد حدة، وقد صنفها المنتدى الاقتصادي العالمي كأخطر تهديد عالمي
التطور السريع للتنبؤ بالطقس القائم على الذكاء الاصطناعي: منذ إطلاق Google DeepMind لـ GraphCast في ديسمبر 2022، نما البحث في التنبؤ بالطقس باستخدام التعلم العميق بسرعة، بما في ذلك Pangu-Weather من Huawei و ClimaX و Stormer من Microsoft و FourCastNet من Nvidia
تأخر البحث في تمثيل البيانات: على الرغم من أن نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي يمكنها الآن التنافس مع أحدث نماذج التنبؤ العددي، فإن الدراسات التي تجمع بين نماذج الذكاء الاصطناعي وتمثيل البيانات لا تزال محدودة
التحديات التقنية: متطلبات تجارب تمثيل البيانات المتسلسلة طويلة الأجل تجعل تقييم أنظمة تمثيل البيانات لنماذج الذكاء الاصطناعي صعباً
الفجوات المنهجية: على الرغم من وجود أبحاث تجمع بين تمثيل البيانات المتغير ونماذج الذكاء الاصطناعي، لا توجد حالات ناجحة لدمج مرشح كالمان الجماعي مع نماذج الذكاء الاصطناعي
احتياجات التشخيص: الحاجة إلى طرق فعالة لتشخيص خصائص نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي، مثل الاتساق الفيزيائي وتمثيل نمو الخطأ
الإنجاز الأول: دمج ناجح للمرة الأولى لمرشح كالمان المحول المحلي (LETKF) مع نموذج التنبؤ بالطقس القائم على الذكاء الاصطناعي (ClimaX)
التشغيل المستقر في حلقات متكررة: إثبات أن تمثيل البيانات الجماعي لنموذج الذكاء الاصطناعي يمكن أن يعمل بشكل مستقر لمدة سنة واحدة من خلال تضخيم التباين والتقنيات المحلية
إنشاء إطار تشخيصي: إنشاء إطار عمل لاستخدام تمثيل البيانات الجماعي لتشخيص خصائص نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي
النتائج المهمة: الكشف عن القيود المقارنة لنموذج الذكاء الاصطناعي مقابل النماذج الديناميكية من حيث نمو الخطأ والاتساق الفيزيائي
المهمة الأساسية للدراسة هي تطبيق تقنيات تمثيل البيانات الجماعية على نماذج التنبؤ بالطقس القائمة على الذكاء الاصطناعي لتشخيص خصائصها وتقييم أدائها في أنظمة تمثيل البيانات. المدخلات هي بيانات الملاحظات الجوية والتنبؤات من نموذج الذكاء الاصطناعي، والمخرجات هي حقول التحليل بعد التمثيل.
Lam, R., et al. (2023): تعلم التنبؤ الماهر بالطقس العالمي متوسط المدى. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): التنبؤ الدقيق بالطقس العالمي متوسط المدى باستخدام الشبكات العصبية ثلاثية الأبعاد. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): تمثيل بيانات فعال للفوضى الزمكانية: مرشح كالمان المحول المحلي الجماعي. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: نموذج أساسي للطقس والمناخ. arXiv preprint arXiv:2301.10343.
تتمتع هذه الورقة بأهمية رائدة في دمج التنبؤ بالطقس القائم على الذكاء الاصطناعي مع تمثيل البيانات. على الرغم من وجود بعض القيود التقنية، فإنها تضع أساساً مهماً لتطور هذا المجال، وتتمتع بقيمة أكاديمية عالية وإمكانية عملية كبيرة.