Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic
Asimilación de datos con conjunto para diagnosticar modelo de predicción meteorológica basado en IA: Un caso con ClimaX versión 0.3.1
La investigación en predicción meteorológica basada en inteligencia artificial (IA) se desarrolla rápidamente y ha demostrado competitividad con modelos avanzados de predicción numérica dinámica. Sin embargo, la investigación que combina modelos de predicción meteorológica basados en IA con asimilación de datos sigue siendo limitada, en parte porque la evaluación de sistemas de asimilación de datos requiere ciclos de asimilación de datos secuenciales a largo plazo. Este estudio propone utilizar asimilación de datos con conjunto para diagnosticar modelos de predicción meteorológica basados en IA, e implementa exitosamente por primera vez la combinación del filtro de Kalman de conjunto con un modelo de predicción meteorológica basado en IA. Los experimentos basados en el modelo de IA ClimaX demuestran que, mediante el uso de técnicas de inflación de covarianza y localización en el filtro de Kalman de conjunto, la asimilación de datos con conjunto puede funcionar de manera estable en ciclos continuos. Aunque ClimaX presenta limitaciones en la captura de covarianzas de error dependientes del flujo en comparación con modelos dinámicos, la predicción por conjunto de IA proporciona covarianzas de error razonables y beneficiosas en regiones con observaciones escasas. Además, la asimilación de datos con conjunto revela que el crecimiento de error basado en predicciones por conjunto de ClimaX es más débil que en modelos NWP dinámicos, lo que resulta en factores de inflación más altos. Una serie de experimentos demuestra que la asimilación de datos con conjunto puede utilizarse para diagnosticar características de modelos de predicción meteorológica basados en IA, como la consistencia física y la representación precisa del crecimiento de error.
Intensificación de Amenazas de Clima Extremo: Los eventos climáticos extremos causados por el cambio climático se vuelven cada vez más graves, y el Foro Económico Mundial clasifica el clima extremo como una de las amenazas globales más serias
Desarrollo Rápido de Predicción Meteorológica basada en IA: Desde el lanzamiento de GraphCast por Google DeepMind en diciembre de 2022, la investigación en predicción meteorológica con aprendizaje profundo ha crecido rápidamente, incluyendo Pangu-Weather de Huawei, ClimaX y Stormer de Microsoft, y FourCastNet de NVIDIA
Retraso en Investigación de Asimilación de Datos: Aunque los modelos de predicción meteorológica basados en IA ya pueden competir con los modelos NWP más avanzados, la investigación que combina modelos de IA con asimilación de datos sigue siendo limitada
Desafíos Técnicos: La necesidad de experimentos de asimilación de datos secuenciales a largo plazo dificulta la evaluación de sistemas de asimilación de datos para modelos de IA
Vacío Metodológico: Aunque existen investigaciones sobre asimilación de datos variacional combinada con modelos de IA, aún no hay casos exitosos de filtro de Kalman de conjunto combinado con modelos de IA
Necesidad de Diagnóstico: Se requieren métodos efectivos para diagnosticar características de modelos de predicción meteorológica basados en IA, como consistencia física y representación del crecimiento de error
Implementación Exitosa por Primera Vez: Primera implementación exitosa de la combinación del filtro de Kalman de conjunto transformado localmente (LETKF) con un modelo de predicción meteorológica basado en IA (ClimaX)
Funcionamiento Estable en Ciclos: Se demuestra que mediante técnicas de inflación de covarianza y localización, la asimilación de datos con conjunto del modelo de IA puede funcionar de manera estable durante un año completo
Establecimiento de Marco de Diagnóstico: Se establece un marco para diagnosticar características de modelos de predicción meteorológica basados en IA utilizando asimilación de datos con conjunto
Hallazgos Importantes: Se revelan limitaciones del modelo de IA en comparación con modelos dinámicos en términos de crecimiento de error y consistencia física
Mejora Técnica: Se extendió ClimaX para soportar predicción de más variables a fin de satisfacer los requisitos de asimilación de datos
La tarea central de esta investigación es aplicar técnicas de asimilación de datos con conjunto a modelos de predicción meteorológica basados en IA para diagnosticar sus características y evaluar su desempeño en sistemas de asimilación de datos. La entrada consiste en datos de observaciones atmosféricas y predicciones del modelo de IA, y la salida es el campo de análisis asimilado.
Arquitectura Base: Modelo global de predicción meteorológica atmosférica basado en IA con arquitectura Vision Transformer (ViT)
Configuración de Resolución: Puntos de cuadrícula 64×32 (5.625°×5.625°), 7 capas verticales (900, 850, 700, 600, 500, 250, 50 hPa)
Componentes Clave: Tokenización de variables (variable tokenization) y agregación de variables (variable aggregation)
Mejoras Extendidas: Se extendieron las 5 variables de predicción predeterminadas al conjunto completo de variables mostrado en la Tabla 1, soportando requisitos de asimilación de datos
Integración de Sistemas: Primera integración exitosa de LETKF con modelo de predicción meteorológica basado en IA, desarrollada basándose en el sistema SPEEDY-LETKF
Extensión del Modelo: Extensión de ClimaX para soportar el conjunto completo de variables requeridas para asimilación de datos
Método de Diagnóstico: Utilización de indicadores como escala de localización óptima y factor de inflación para diagnosticar características del modelo de IA
Diseño de Red de Observación: Adopción de red de observación similar a observaciones de radiosonda, con observaciones de 7 capas de temperatura, campo de vientos, etc. en estaciones de observación
Escala de Localización Vertical: Lv = 1.0 (log Pa)
Error de Observación: Desviación estándar de temperatura y campo de vientos 1.0, desviación estándar de humedad específica 0.1, desviación estándar de presión de superficie 1.0
Mejora en Puntos de Observación: En puntos de cuadrícula con observaciones, vientos zonales y temperatura mejoran generalmente
Degradación Periférica: Regiones alrededor de estaciones de observación (como océanos polares, costas de América del Norte y Japón) muestran ligera degradación
Ventaja en Hemisferio Sur: Altura geopotencial y presión de superficie muestran mejora en regiones de observación escasa del hemisferio sur
Requisito de Inflación Alta: ClimaX requiere factor de inflación más alto que modelo dinámico (Figura 6 muestra aproximadamente 1.4-1.6 promediado globalmente)
Crecimiento de Error Débil: Indica que el crecimiento de error del modelo de IA es más débil que el modelo NWP dinámico
Características Caóticas Deficientes: Consistente con hallazgos de Selz and Craig (2022), el modelo de IA no puede reproducir con precisión el efecto mariposa
Limitación de Predicción a Corto Plazo: ClimaX no puede realizar integración natural a largo plazo, desviándose gradualmente de la atmósfera real después de 6 horas de predicción
Generación de Campos No Físicos: Predicciones a largo plazo generan campos meteorológicos meteorológicamente irreales (como temperaturas extremadamente bajas en el Pacífico)
Problema de Atractor: El modelo de IA no puede volver a trayectorias de atractor meteorológicamente razonables
Métodos Variacionales: Similitud matemática con modelos de IA, investigación existente sobre combinación con 4DVar
Métodos de Conjunto: Este estudio implementa exitosamente por primera vez la combinación de EnKF con modelo de IA
Asimilación de Datos con Aprendizaje Profundo: Investigación reciente comienza a utilizar redes neuronales para resolver problemas inversos de asimilación de datos
Viabilidad Técnica: La asimilación de datos con conjunto puede combinarse establemente con modelos de predicción meteorológica basados en IA y funcionar en ciclos continuos
Valor de Diagnóstico: La asimilación de datos con conjunto es una herramienta efectiva para diagnosticar características de modelos de IA
Identificación de Limitaciones: Los modelos de IA presentan insuficiencias en covarianzas de error dependientes del flujo y representación del crecimiento de error
Ventaja en Regiones de Observación Escasa: La predicción por conjunto de IA proporciona covarianzas de error razonables en regiones de observación escasa
Escala de Localización Óptima Pequeña: 600 km es significativamente menor que 900 km en modelos dinámicos, indicando capacidad insuficiente de captura de covarianzas de error dependientes del flujo
Imposibilidad de Realizar OSSE: Debido a inestabilidad en predicción a largo plazo, no se pueden realizar experimentos de simulación de sistema de observación
Ausencia de Restricciones Físicas: Los modelos de IA carecen de restricciones de leyes físicas, tendiendo a producir campos meteorológicos no realistas
Crecimiento de Error Insuficiente: Dispersión de conjunto insuficiente, requiriendo factor de inflación más alto
Integración de Restricciones Físicas: Incorporar restricciones físicas como equilibrio hidrostático y equilibrio geostrófico en entrenamiento de modelos de IA
Mejora del Crecimiento de Error: Desarrollar esquemas de parametrización estocástica o métodos de conjunto multimodelo
Extensión de Conjunto Grande: Aprovechar ventajas computacionales de modelos de IA para extender a EnKF de conjunto grande o filtros de partículas localizados
Aplicación con Observaciones Reales: Avanzar hacia asimilación de datos con observaciones reales
Contribución Pionera: Primera implementación exitosa de EnKF combinado con modelo de predicción meteorológica basado en IA, con valor académico importante
Investigación Sistemática: Evaluación sistemática de efectividad del método mediante experimentos con múltiples escalas de localización
Diagnóstico Profundo: Análisis profundo de características de modelos de IA utilizando técnicas de asimilación de datos, proporcionando nueva perspectiva de evaluación
Valor Práctico: Proporciona dirección para mejora de modelos de predicción meteorológica basados en IA
Código de Código Abierto: Proporciona código y datos completos, garantizando reproducibilidad
Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.
Este artículo tiene significado pionero en la combinación de predicción meteorológica basada en IA con asimilación de datos. Aunque presenta algunas limitaciones técnicas, sienta una base importante para el desarrollo de este campo, poseyendo valor académico considerable y potencial práctico.