Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
Ensemble-Datensimilierung zur Diagnose von KI-basierten Wettervorhersagemodellen: Ein Fall mit ClimaX Version 0.3.1
Die Forschung zur künstlichen Intelligenz (KI) in der Wettervorhersage entwickelt sich schnell und hat bereits Wettbewerbsfähigkeit mit fortschrittlichen dynamischen numerischen Wettervorhersagemodellen gezeigt. Allerdings ist die Forschung zur Kombination von KI-Wettervorhersagemodellen mit Datensimilierung noch begrenzt, teilweise weil die Bewertung von Datensimilierungssystemen lange sequenzielle Datensimilierungszyklen erfordert. Diese Studie schlägt vor, Ensemble-Datensimilierung zur Diagnose von KI-Wettervorhersagemodellen zu verwenden, und realisiert erstmals erfolgreich die Kombination des Ensemble-Kalman-Filters mit einem KI-Wettervorhersagemodell. Experimente basierend auf dem KI-Modell ClimaX zeigen, dass die Ensemble-Datensimilierung durch die Verwendung von Kovarianzinflation und Lokalisierungstechniken im Ensemble-Kalman-Filter stabil zyklisch betrieben werden kann. Obwohl ClimaX bei der Erfassung von strömungsabhängigen Fehlerkovarianzen Einschränkungen im Vergleich zu dynamischen Modellen aufweist, bietet die KI-Ensemble-Vorhersage in Regionen mit spärlichen Beobachtungen angemessene und nützliche Fehlerkovarianzen. Darüber hinaus zeigt die Ensemble-Datensimilierung, dass das Fehlerwachstum basierend auf ClimaX-Ensemble-Vorhersagen schwächer ist als bei dynamischen NWP-Modellen, was zu höheren Inflationsfaktoren führt. Eine Reihe von Experimenten demonstriert, dass die Ensemble-Datensimilierung zur Diagnose von Eigenschaften des KI-Wettervorhersagemodells wie physikalische Konsistenz und genaue Fehlerwachstumsdarstellung verwendet werden kann.
Zunehmende Extremwetterbedrohungen: Durch den Klimawandel verursachte Extremwetterereignisse werden immer schwerwiegender; das Weltwirtschaftsforum stuft Extremwetter als eine der schwerwiegendsten globalen Bedrohungen ein
Schnelle Entwicklung der KI-Wettervorhersage: Seit der Veröffentlichung von GraphCast durch Google DeepMind im Dezember 2022 ist die Forschung zur Deep-Learning-Wettervorhersage schnell gewachsen, einschließlich Pangu-Weather von Huawei, ClimaX und Stormer von Microsoft sowie FourCastNet von NVIDIA
Verzögerte Datensimilierungsforschung: Obwohl KI-Wettervorhersagemodelle bereits mit den fortschrittlichsten NWP-Modellen konkurrieren können, ist die Forschung zur Kombination von KI-Modellen mit Datensimilierung noch begrenzt
Technische Herausforderungen: Die Anforderung an lange sequenzielle Datensimilierungsexperimente macht die Bewertung von Datensimilierungssystemen für KI-Modelle schwierig
Methodische Lücken: Obwohl es Forschungen zur Kombination von Variationsdatensimilierung mit KI-Modellen gibt, gibt es noch keine erfolgreichen Fälle der Kombination von Ensemble-Kalman-Filtern mit KI-Modellen
Diagnosebedarf: Es werden wirksame Methoden benötigt, um Eigenschaften von KI-Wettervorhersagemodellen wie physikalische Konsistenz und Fehlerwachstumsdarstellung zu diagnostizieren
Erstmalige erfolgreiche Realisierung: Erstmalige erfolgreiche Kombination des Ensemble-Kalman-Filters (LETKF) mit einem KI-Wettervorhersagemodell (ClimaX)
Stabiler zyklischer Betrieb: Nachweis, dass die Ensemble-Datensimilierung des KI-Modells durch Kovarianzinflation und Lokalisierungstechniken ein Jahr lang stabil zyklisch betrieben werden kann
Etablierung eines Diagnosegerüsts: Etablierung eines Gerüsts zur Diagnose von Eigenschaften von KI-Wettervorhersagemodellen mittels Ensemble-Datensimilierung
Wichtige Erkenntnisse: Offenlegung der Einschränkungen des KI-Modells im Vergleich zu dynamischen Modellen bei Fehlerwachstum und physikalischer Konsistenz
Technische Verbesserungen: Erweiterung von ClimaX zur Unterstützung von Vorhersagen für mehr Variablen, um die Anforderungen der Datensimilierung zu erfüllen
Die Kernaufgabe dieser Studie besteht darin, Ensemble-Datensimilierungstechniken auf KI-Wettervorhersagemodelle anzuwenden, um deren Eigenschaften zu diagnostizieren und ihre Leistung in Datensimilierungssystemen zu bewerten. Die Eingaben sind atmosphärische Beobachtungsdaten und KI-Modellvorhersagen, die Ausgabe ist das assimilierte Analysfeld.
Schlüsselkomponenten: Variablentokenisierung (variable tokenization) und Variablenaggregation (variable aggregation)
Erweiterungsverbesserungen: Erweiterung der standardmäßigen 5 Vorhersagevariablen auf den in Tabelle 1 gezeigten vollständigen Variablensatz zur Unterstützung der Datensimilierungsanforderungen
Systemintegration: Erstmalige erfolgreiche Integration von LETKF mit KI-Wettervorhersagemodellen, entwickelt auf Basis des SPEEDY-LETKF-Systems
Modellerweiterung: Erweiterung von ClimaX zur Unterstützung des vollständigen Variablensatzes, der für die Datensimilierung erforderlich ist
Diagnosemethode: Nutzung von Indikatoren wie optimaler Lokalisierungsskala und Inflationsfaktor zur Diagnose von KI-Modelleigenschaften
Beobachtungsnetzwerk-Design: Verwendung eines Beobachtungsnetzwerks ähnlich dem Radiosonden-Beobachtungsnetz mit 7-Schicht-Beobachtungen von Temperatur, Windfeld usw. an Beobachtungsstationen
Verbesserung an Beobachtungspunkten: An Gitterpunkten mit Beobachtungen zeigen Zonalwind und Temperatur allgemeine Verbesserung
Verschlechterung in der Umgebung: Regionen um Beobachtungsstationen (wie arktische Meere, Küsten der USA und Japans) zeigen leichte Verschlechterung
Vorteil der südlichen Hemisphäre: Geopotenzielle Höhe und Oberflächendruck zeigen Verbesserung in der südlichen Hemisphäre mit spärlichen Beobachtungen
Hohe Inflationsanforderung: ClimaX erfordert höhere Inflationsfaktoren als dynamische Modelle (Abbildung 6 zeigt global gemittelten Wert von etwa 1,4-1,6)
Schwaches Fehlerwachstum: Deutet darauf hin, dass das Fehlerwachstum des KI-Modells schwächer ist als bei dynamischen NWP-Modellen
Mangelhafte chaotische Eigenschaften: Konsistent mit Befunden von Selz und Craig (2022), KI-Modelle können den Schmetterlingseffekt nicht genau nachbilden
Einschränkung bei kurzfristiger Vorhersage: ClimaX kann keine langfristige natürliche Integration durchführen und weicht nach 6-Stunden-Vorhersage allmählich von der realen Atmosphäre ab
Erzeugung nicht-physikalischer Felder: Langfristige Vorhersagen erzeugen meteorologisch unrealistische Wetterfelder (z.B. extrem niedrige Temperaturen über dem Pazifik)
Attraktor-Problem: KI-Modelle können nicht zu meteorologisch angemessenen Attraktor-Bahnen zurückkehren
Technische Machbarkeit: Ensemble-Datensimilierung kann stabil mit KI-Wettervorhersagemodellen kombiniert und zyklisch betrieben werden
Diagnosewert: Ensemble-Datensimilierung ist ein wirksames Werkzeug zur Diagnose von KI-Modelleigenschaften
Identifizierung von Einschränkungen: KI-Modelle weisen Mängel bei der Erfassung von strömungsabhängigen Fehlerkovarianzen und der Fehlerwachstumsdarstellung auf
Vorteil in spärlichen Regionen: KI-Ensemble-Vorhersagen bieten angemessene Fehlerkovarianzen in Regionen mit spärlichen Beobachtungen
Kleine optimale Lokalisierungsskala: 600 km ist signifikant kleiner als 900 km bei dynamischen Modellen, was auf unzureichende Erfassungsfähigkeit von strömungsabhängigen Fehlerkovarianzen hindeutet
Keine OSSE möglich: Aufgrund instabiler Langzeitvorhersagen können keine Beobachtungssystem-Simulationsexperimente durchgeführt werden
Fehlende physikalische Einschränkungen: KI-Modelle fehlen physikalische Gesetzbeschränkungen, was zur Erzeugung unrealistischer Wetterfelder führt
Unzureichendes Fehlerwachstum: Ensemble-Dispersion ist unzureichend, höhere Inflationsfaktoren erforderlich
Integration physikalischer Einschränkungen: Einbeziehung von hydrostatischem Gleichgewicht, geostrophischem Gleichgewicht und anderen physikalischen Einschränkungen beim KI-Modelltraining
Verbesserung des Fehlerwachstums: Entwicklung stochastischer Parametrisierungsschemata oder Multi-Modell-Ensemble-Methoden
Erweiterung auf große Ensembles: Nutzung der Rechenvorteile von KI-Modellen zur Erweiterung auf große Ensemble-EnKF oder lokale Partikelfilter
Anwendung auf echte Beobachtungen: Entwicklung hin zur Datensimilierung mit echten Beobachtungsdaten
Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.
Dieses Papier hat bahnbrechende Bedeutung bei der Kombination von KI-Wettervorhersage und Datensimilierung. Obwohl es einige technische Einschränkungen gibt, legt es eine wichtige Grundlage für die Entwicklung dieses Feldes und hat hohen akademischen Wert und praktisches Potenzial.