Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
Assimilation de données d'ensemble pour diagnostiquer un modèle de prévision météorologique basé sur l'IA : Un cas avec ClimaX version 0.3.1
La recherche en prévision météorologique par intelligence artificielle (IA) se développe rapidement et a démontré sa compétitivité par rapport aux modèles avancés de prévision numérique du temps (PNT). Cependant, les études combinant les modèles de prévision météorologique par IA avec l'assimilation de données restent limitées, en partie en raison de la nécessité de cycles d'assimilation de données séquentiels prolongés pour évaluer les systèmes d'assimilation. Cette étude propose d'utiliser l'assimilation de données d'ensemble pour diagnostiquer les modèles de prévision météorologique par IA, et réalise pour la première fois avec succès la combinaison du filtre de Kalman d'ensemble avec un modèle de prévision météorologique par IA. Les expériences basées sur le modèle IA ClimaX montrent que, grâce à l'utilisation de techniques d'inflation de covariance et de localisation dans le filtre de Kalman d'ensemble, l'assimilation de données d'ensemble peut fonctionner en cycle stable. Bien que ClimaX présente des limitations par rapport aux modèles dynamiques dans la capture de la covariance d'erreur dépendante du flux, l'ensemble de prévisions par IA fournit une covariance d'erreur raisonnable et bénéfique dans les régions d'observations éparses. De plus, l'assimilation de données d'ensemble révèle que la croissance d'erreur basée sur les prévisions d'ensemble ClimaX est plus faible que celle du modèle PNT dynamique, conduisant à des facteurs d'inflation plus élevés. Une série d'expériences démontre que l'assimilation de données d'ensemble peut être utilisée pour diagnostiquer les propriétés des modèles de prévision météorologique par IA, telles que la cohérence physique et la représentation précise de la croissance d'erreur.
Intensification des menaces météorologiques extrêmes : Les événements météorologiques extrêmes induits par le changement climatique deviennent de plus en plus graves, le Forum économique mondial classant les conditions météorologiques extrêmes parmi les menaces mondiales les plus sérieuses
Développement rapide de la prévision météorologique par IA : Depuis la publication de GraphCast par Google DeepMind en décembre 2022, la recherche en prévision météorologique par apprentissage profond s'est développée rapidement, incluant Pangu-Weather de Huawei, ClimaX et Stormer de Microsoft, FourCastNet de NVIDIA, etc.
Retard dans la recherche sur l'assimilation de données : Bien que les modèles de prévision météorologique par IA puissent rivaliser avec les modèles PNT les plus avancés, les recherches combinant les modèles IA avec l'assimilation de données restent limitées
Défis techniques : La nécessité d'expériences d'assimilation de données séquentielles prolongées rend difficile l'évaluation des systèmes d'assimilation de données pour les modèles IA
Lacunes méthodologiques : Bien qu'il existe des recherches combinant l'assimilation de données variationnelle avec les modèles IA, aucun cas réussi de combinaison du filtre de Kalman d'ensemble avec les modèles IA n'a été rapporté
Besoins diagnostiques : Des méthodes efficaces sont nécessaires pour diagnostiquer les propriétés des modèles de prévision météorologique par IA, telles que la cohérence physique et la représentation de la croissance d'erreur
Première réalisation réussie : Première combinaison réussie du filtre de Kalman d'ensemble local (LETKF) avec un modèle de prévision météorologique par IA (ClimaX)
Fonctionnement en cycle stable : Démonstration que l'assimilation de données d'ensemble du modèle IA peut fonctionner en cycle stable pendant un an grâce aux techniques d'inflation de covariance et de localisation
Établissement d'un cadre de diagnostic : Création d'un cadre utilisant l'assimilation de données d'ensemble pour diagnostiquer les propriétés des modèles de prévision météorologique par IA
Découvertes importantes : Révélation des limitations du modèle IA par rapport aux modèles dynamiques en termes de croissance d'erreur et de cohérence physique
Améliorations techniques : Extension de ClimaX pour supporter la prévision de plus de variables afin de répondre aux besoins de l'assimilation de données
La tâche centrale de cette recherche consiste à appliquer les techniques d'assimilation de données d'ensemble aux modèles de prévision météorologique par IA pour diagnostiquer leurs propriétés et évaluer leurs performances dans les systèmes d'assimilation de données. L'entrée comprend les données d'observation atmosphérique et les prévisions du modèle IA, tandis que la sortie est le champ d'analyse assimilé.
Architecture de base : Modèle mondial de prévision météorologique atmosphérique par IA basé sur Vision Transformer (ViT)
Configuration de résolution : Points de grille 64×32 (5,625°×5,625°), 7 niveaux verticaux (900, 850, 700, 600, 500, 250, 50 hPa)
Composants clés : Tokenisation des variables (variable tokenization) et agrégation des variables (variable aggregation)
Améliorations apportées : Extension des 5 variables de prévision par défaut à l'ensemble complet de variables présenté dans le tableau 1, supportant les besoins de l'assimilation de données
Intégration du système : Première intégration réussie du LETKF avec un modèle de prévision météorologique par IA, développée sur la base du système SPEEDY-LETKF
Extension du modèle : Extension de ClimaX pour supporter l'ensemble complet de variables requises par l'assimilation de données
Méthode de diagnostic : Utilisation d'indicateurs tels que l'échelle de localisation optimale et le facteur d'inflation pour diagnostiquer les propriétés du modèle IA
Conception du réseau d'observation : Adoption d'un réseau d'observation similaire aux observations de radiosondage, avec des observations de température, de champ de vent, etc. sur 7 niveaux aux stations d'observation
Échelle de localisation verticale : Lv = 1,0 (log Pa)
Erreur d'observation : Écart-type de 1,0 pour la température et le champ de vent, écart-type de 0,1 pour l'humidité spécifique, écart-type de 1,0 pour la pression de surface
Amélioration aux points d'observation : Amélioration généralisée du vent zonal et de la température aux points de grille avec observations
Dégradation périphérique : Légère dégradation observée dans les régions autour des stations d'observation (comme l'océan arctique, les côtes américaines et japonaises)
Avantage dans l'hémisphère sud : La hauteur géopotentielle et la pression de surface montrent une amélioration dans les régions d'observations éparses de l'hémisphère sud
Besoin d'inflation élevée : ClimaX nécessite des facteurs d'inflation plus élevés que le modèle dynamique (la figure 6 montre environ 1,4-1,6 en moyenne mondiale)
Croissance d'erreur faible : Indique que la croissance d'erreur du modèle IA est plus faible que celle du modèle PNT dynamique
Propriétés chaotiques insuffisantes : Cohérent avec les conclusions de Selz et Craig (2022), le modèle IA ne peut pas reproduire correctement l'effet papillon
Limitations de prévision à court terme : ClimaX ne peut pas effectuer d'intégration naturelle à long terme, s'écartant progressivement de l'atmosphère réelle après 6 heures de prévision
Génération de champs non physiques : Les prévisions à long terme produisent des champs météorologiques astronomiquement irréalistes (comme des températures extrêmement basses sur le Pacifique)
Problème d'attracteur : Le modèle IA ne peut pas revenir à une trajectoire d'attracteur météorologiquement raisonnable
Méthodes variationnelles : Similarité mathématique avec les modèles IA, recherches existantes sur la combinaison 4DVar
Méthodes d'ensemble : Cette étude réalise pour la première fois avec succès la combinaison EnKF avec les modèles IA
Assimilation de données par apprentissage profond : Utilisation récente de réseaux de neurones pour résoudre le problème inverse de l'assimilation de données
Faisabilité technique : L'assimilation de données d'ensemble peut être combinée de manière stable avec les modèles de prévision météorologique par IA et fonctionner en cycle
Valeur diagnostique : L'assimilation de données d'ensemble est un outil efficace pour diagnostiquer les propriétés des modèles IA
Identification des limitations : Les modèles IA présentent des insuffisances dans la capture de la covariance d'erreur dépendante du flux et la représentation de la croissance d'erreur
Avantage dans les régions éparses : L'ensemble de prévisions par IA fournit une covariance d'erreur raisonnable dans les régions d'observations éparses
Échelle de localisation optimale réduite : 600 km est significativement inférieur aux 900 km des modèles dynamiques, indiquant une capacité insuffisante à capturer la covariance d'erreur dépendante du flux
Impossibilité de réaliser des OSSE : En raison de l'instabilité des prévisions à long terme, les expériences de simulation de systèmes d'observation ne peuvent pas être réalisées
Absence de contraintes physiques : Les modèles IA manquent de contraintes de lois physiques, produisant facilement des champs météorologiques irréalistes
Croissance d'erreur insuffisante : La dispersion d'ensemble est insuffisante, nécessitant des facteurs d'inflation plus élevés
Intégration de contraintes physiques : Incorporation d'équilibre hydrostatique, équilibre géostrophique et autres contraintes physiques dans l'entraînement des modèles IA
Amélioration de la croissance d'erreur : Développement de schémas de paramétrisation stochastique ou de méthodes d'ensemble multi-modèles
Extension à grands ensembles : Exploitation des avantages informatiques des modèles IA pour l'extension à EnKF à grands ensembles ou filtres à particules localisés
Application à des observations réelles : Évolution vers l'assimilation de données avec des observations réelles
Contribution pionnière : Première réalisation réussie de la combinaison EnKF avec un modèle de prévision météorologique par IA, possédant une valeur académique importante
Recherche systématique : Évaluation systématique de l'efficacité de la méthode par le biais d'expériences avec plusieurs échelles de localisation
Diagnostic approfondi : Utilisation des techniques d'assimilation de données pour une analyse approfondie des propriétés du modèle IA, offrant une nouvelle perspective d'évaluation
Valeur pratique : Indique les directions d'amélioration des modèles de prévision météorologique par IA
Code en accès libre : Fourniture de code et de données complets assurant la reproductibilité
Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.
Cet article possède une importance pionnière dans la combinaison de la prévision météorologique par IA et de l'assimilation de données. Bien qu'il présente certaines limitations techniques, il jette les bases importantes du développement de ce domaine et possède une valeur académique et un potentiel pratique considérables.