Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
Assimilazione dati d'insieme per diagnosticare il modello di previsione meteorologica basato su IA: Un caso con ClimaX versione 0.3.1
La ricerca sulla previsione meteorologica basata su intelligenza artificiale (IA) si sta sviluppando rapidamente, dimostrando competitività con i modelli avanzati di previsione numerica del tempo dinamica. Tuttavia, la ricerca che combina modelli di previsione meteorologica basati su IA con l'assimilazione dati rimane ancora limitata, in parte perché la valutazione dei sistemi di assimilazione dati richiede lunghi cicli sequenziali di assimilazione. Questo studio propone l'utilizzo dell'assimilazione dati d'insieme per diagnosticare i modelli di previsione meteorologica basati su IA, e realizza con successo per la prima volta la combinazione del filtro di Kalman d'insieme con un modello di previsione meteorologica basato su IA. Gli esperimenti basati sul modello IA ClimaX dimostrano che, attraverso l'utilizzo di tecniche di dilatazione della covarianza e localizzazione nel filtro di Kalman d'insieme, l'assimilazione dati d'insieme può funzionare stabilmente in cicli continui. Sebbene ClimaX presenti limitazioni nel catturare la covarianza dell'errore dipendente dal flusso rispetto ai modelli dinamici, la previsione d'insieme basata su IA fornisce covarianze d'errore ragionevoli e vantaggiose nelle regioni con osservazioni sparse. Inoltre, l'assimilazione dati d'insieme rivela che la crescita dell'errore basata sulla previsione d'insieme di ClimaX è più debole rispetto al modello NWP dinamico, determinando fattori di dilatazione più elevati. Una serie di esperimenti dimostra che l'assimilazione dati d'insieme può essere utilizzata per diagnosticare proprietà dei modelli di previsione meteorologica basati su IA, come la coerenza fisica e la rappresentazione accurata della crescita dell'errore.
Intensificazione delle Minacce Meteorologiche Estreme: Gli eventi meteorologici estremi causati dai cambiamenti climatici stanno diventando sempre più gravi, con il World Economic Forum che classifica i fenomeni meteorologici estremi tra le minacce globali più serie
Rapido Sviluppo della Previsione Meteorologica basata su IA: Dalla pubblicazione di GraphCast da parte di Google DeepMind nel dicembre 2022, la ricerca sul deep learning per la previsione meteorologica è cresciuta rapidamente, includendo Pangu-Weather di Huawei, ClimaX e Stormer di Microsoft, FourCastNet di NVIDIA e altri
Ritardo nella Ricerca sull'Assimilazione Dati: Sebbene i modelli di previsione meteorologica basati su IA siano già in grado di competere con i modelli NWP più avanzati, la ricerca che combina modelli IA con l'assimilazione dati rimane ancora limitata
Sfide Tecniche: La necessità di esperimenti lunghi e sequenziali di assimilazione dati rende difficile la valutazione dei sistemi di assimilazione dati per i modelli IA
Lacune Metodologiche: Sebbene esistano ricerche che combinano l'assimilazione dati variazionale con modelli IA, non ci sono ancora casi di successo di combinazione del filtro di Kalman d'insieme con modelli IA
Necessità di Diagnostica: È necessario un metodo efficace per diagnosticare le proprietà dei modelli di previsione meteorologica basati su IA, come la coerenza fisica e la rappresentazione della crescita dell'errore
Prima Realizzazione di Successo: Prima combinazione di successo del filtro di Kalman d'insieme locale (LETKF) con un modello di previsione meteorologica basato su IA (ClimaX)
Funzionamento Stabile in Cicli: Dimostrazione che, attraverso tecniche di dilatazione della covarianza e localizzazione, l'assimilazione dati d'insieme del modello IA può funzionare stabilmente per un anno intero
Istituzione di un Quadro Diagnostico: Istituzione di un quadro per l'utilizzo dell'assimilazione dati d'insieme nella diagnostica delle proprietà dei modelli di previsione meteorologica basati su IA
Scoperte Importanti: Rivelazione delle limitazioni del modello IA rispetto ai modelli dinamici in termini di crescita dell'errore e coerenza fisica
Miglioramenti Tecnici: Estensione di ClimaX per supportare la previsione di più variabili al fine di soddisfare i requisiti dell'assimilazione dati
Il compito principale di questa ricerca è l'applicazione della tecnica di assimilazione dati d'insieme ai modelli di previsione meteorologica basati su IA, al fine di diagnosticare le loro proprietà e valutare le loro prestazioni nei sistemi di assimilazione dati. L'input consiste nei dati di osservazione atmosferica e nelle previsioni del modello IA, mentre l'output è il campo di analisi assimilato.
Architettura di Base: Modello globale di previsione meteorologica atmosferica basato su IA con Vision Transformer (ViT)
Impostazione della Risoluzione: Griglia di 64×32 punti (5.625°×5.625°), 7 livelli verticali (900, 850, 700, 600, 500, 250, 50 hPa)
Componenti Chiave: Tokenizzazione delle variabili (variable tokenization) e aggregazione delle variabili (variable aggregation)
Miglioramenti Estesi: Estensione delle 5 variabili di previsione predefinite all'insieme completo di variabili mostrato nella Tabella 1, supportando i requisiti dell'assimilazione dati
Integrazione del Sistema: Prima integrazione di successo di LETKF con un modello di previsione meteorologica basato su IA, sviluppato sulla base del sistema SPEEDY-LETKF
Estensione del Modello: Estensione di ClimaX per supportare l'insieme completo di variabili necessarie per l'assimilazione dati
Metodo di Diagnostica: Utilizzo di indicatori come la scala di localizzazione ottimale e il fattore di dilatazione per diagnosticare le proprietà del modello IA
Progettazione della Rete di Osservazione: Adozione di una rete di osservazione simile alle osservazioni radiosonda, con osservazioni a 7 livelli di temperatura, campo di vento e altre variabili nei siti di osservazione
Scala di Localizzazione Verticale: Lv = 1.0 (log Pa)
Errore di Osservazione: Deviazione standard di temperatura e campo di vento 1.0, deviazione standard dell'umidità specifica 0.1, deviazione standard della pressione superficiale 1.0
Miglioramento nei Punti di Osservazione: Nei punti della griglia con osservazioni, il vento zonale e la temperatura migliorano generalmente
Deterioramento nelle Aree Circostanti: Nelle aree circostanti i siti di osservazione (come l'oceano artico, le coste degli Stati Uniti e del Giappone) si osserva un leggero deterioramento
Vantaggio nell'Emisfero Meridionale: L'altezza geopotenziale e la pressione superficiale mostrano miglioramenti nelle regioni con osservazioni sparse dell'emisfero meridionale
Necessità di Dilatazione Elevata: ClimaX richiede fattori di dilatazione più elevati rispetto ai modelli dinamici (la Figura 6 mostra una media globale di circa 1.4-1.6)
Crescita dell'Errore Debole: Indica che la crescita dell'errore del modello IA è più debole rispetto al modello NWP dinamico
Caratteristiche Caotiche Scarse: Coerente con i risultati di Selz and Craig (2022), il modello IA non riesce a riprodurre accuratamente l'effetto farfalla
Limitazioni della Previsione a Breve Termine: ClimaX non può eseguire l'integrazione naturale a lungo termine, deviando gradualmente dall'atmosfera reale dopo 6 ore di previsione
Generazione di Campi Non Fisici: Le previsioni a lungo termine producono campi meteorologici meteorologicamente irrealistici (come temperature estremamente basse sul Pacifico)
Problema dell'Attrattore: Il modello IA non riesce a tornare a un'orbita dell'attrattore meteorologicamente ragionevole
Fattibilità Tecnica: L'assimilazione dati d'insieme può combinarsi stabilmente con i modelli di previsione meteorologica basati su IA e funzionare in cicli continui
Valore Diagnostico: L'assimilazione dati d'insieme è uno strumento efficace per diagnosticare le proprietà dei modelli IA
Identificazione delle Limitazioni: I modelli IA presentano insufficienze nella covarianza dell'errore dipendente dal flusso e nella rappresentazione della crescita dell'errore
Vantaggi nelle Aree Sparse: La previsione d'insieme basata su IA fornisce covarianze d'errore ragionevoli nelle regioni con osservazioni sparse
Scala di Localizzazione Ottimale Piccola: 600 km è significativamente inferiore ai 900 km dei modelli dinamici, indicando capacità insufficiente di catturare la covarianza dell'errore dipendente dal flusso
Impossibilità di Condurre OSSE: A causa dell'instabilità della previsione a lungo termine, non è possibile condurre esperimenti di simulazione del sistema di osservazione
Mancanza di Vincoli Fisici: I modelli IA mancano di vincoli di leggi fisiche, facilitando la produzione di campi meteorologici non realistici
Crescita dell'Errore Insufficiente: La dispersione dell'insieme è insufficiente, richiedendo fattori di dilatazione più elevati
Integrazione di Vincoli Fisici: Incorporazione di vincoli fisici come l'equilibrio idrostatico e l'equilibrio geostrofico nell'addestramento dei modelli IA
Miglioramento della Crescita dell'Errore: Sviluppo di schemi di parametrizzazione stocastica o metodi di insieme multi-modello
Estensione dell'Insieme Ampio: Sfruttamento dei vantaggi computazionali dei modelli IA per l'estensione a EnKF di insieme ampio o filtri particellari localizzati
Applicazione alle Osservazioni Reali: Sviluppo verso l'assimilazione dati con dati di osservazione reali
Contributo Pioneristico: Prima realizzazione di successo della combinazione di EnKF con modelli di previsione meteorologica basati su IA, con significativo valore accademico
Ricerca Sistematica: Valutazione sistematica dell'efficacia del metodo attraverso esperimenti con multiple scale di localizzazione
Diagnostica Approfondita: Analisi approfondita delle proprietà dei modelli IA utilizzando tecniche di assimilazione dati, fornendo una nuova prospettiva di valutazione
Valore Pratico: Fornisce indicazioni per il miglioramento dei modelli di previsione meteorologica basati su IA
Codice Open Source: Fornisce codice e dati completi, garantendo la riproducibilità
Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.
Questo articolo ha un significato pioneristico nella combinazione di previsione meteorologica basata su IA e assimilazione dati. Sebbene presenti alcune limitazioni tecniche, pone una base importante per lo sviluppo di questo campo, possedendo elevato valore accademico e potenziale pratico considerevole.