2025-11-13T23:28:11.258985

Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1

Kotsuki, Shiraishi, Okazaki
Artificial intelligence (AI)-based weather prediction research is growing rapidly and has shown to be competitive with the advanced dynamic numerical weather prediction models. However, research combining AI-based weather prediction models with data assimilation remains limited partially because long-term sequential data assimilation cycles are required to evaluate data assimilation systems. This study proposes using ensemble data assimilation for diagnosing AI-based weather prediction models, and marked the first successful implementation of ensemble Kalman filter with AI-based weather prediction models. Our experiments with an AI-based model ClimaX demonstrated that the ensemble data assimilation cycled stably for the AI-based weather prediction model using covariance inflation and localization techniques within the ensemble Kalman filter. While ClimaX showed some limitations in capturing flow-dependent error covariance compared to dynamical models, the AI-based ensemble forecasts provided reasonable and beneficial error covariance in sparsely observed regions. In addition, ensemble data assimilation revealed that error growth based on ensemble ClimaX predictions was weaker than that of dynamical NWP models, leading to higher inflation factors. A series of experiments demonstrated that ensemble data assimilation can be used to diagnose properties of AI weather prediction models such as physical consistency and accurate error growth representation.
academic

Asimilación de datos con conjunto para diagnosticar modelo de predicción meteorológica basado en IA: Un caso con ClimaX versión 0.3.1

Información Básica

  • ID del Artículo: 2407.17781
  • Título: Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1
  • Autores: Shunji Kotsuki, Kenta Shiraishi, Atsushi Okazaki (Universidad de Chiba)
  • Clasificación: cs.LG stat.AP
  • Fecha de Publicación: Julio de 2024
  • Enlace del Artículo: https://arxiv.org/abs/2407.17781

Resumen

La investigación en predicción meteorológica basada en inteligencia artificial (IA) se desarrolla rápidamente y ha demostrado competitividad con modelos avanzados de predicción numérica dinámica. Sin embargo, la investigación que combina modelos de predicción meteorológica basados en IA con asimilación de datos sigue siendo limitada, en parte porque la evaluación de sistemas de asimilación de datos requiere ciclos de asimilación de datos secuenciales a largo plazo. Este estudio propone utilizar asimilación de datos con conjunto para diagnosticar modelos de predicción meteorológica basados en IA, e implementa exitosamente por primera vez la combinación del filtro de Kalman de conjunto con un modelo de predicción meteorológica basado en IA. Los experimentos basados en el modelo de IA ClimaX demuestran que, mediante el uso de técnicas de inflación de covarianza y localización en el filtro de Kalman de conjunto, la asimilación de datos con conjunto puede funcionar de manera estable en ciclos continuos. Aunque ClimaX presenta limitaciones en la captura de covarianzas de error dependientes del flujo en comparación con modelos dinámicos, la predicción por conjunto de IA proporciona covarianzas de error razonables y beneficiosas en regiones con observaciones escasas. Además, la asimilación de datos con conjunto revela que el crecimiento de error basado en predicciones por conjunto de ClimaX es más débil que en modelos NWP dinámicos, lo que resulta en factores de inflación más altos. Una serie de experimentos demuestra que la asimilación de datos con conjunto puede utilizarse para diagnosticar características de modelos de predicción meteorológica basados en IA, como la consistencia física y la representación precisa del crecimiento de error.

Antecedentes y Motivación de la Investigación

Contexto del Problema

  1. Intensificación de Amenazas de Clima Extremo: Los eventos climáticos extremos causados por el cambio climático se vuelven cada vez más graves, y el Foro Económico Mundial clasifica el clima extremo como una de las amenazas globales más serias
  2. Desarrollo Rápido de Predicción Meteorológica basada en IA: Desde el lanzamiento de GraphCast por Google DeepMind en diciembre de 2022, la investigación en predicción meteorológica con aprendizaje profundo ha crecido rápidamente, incluyendo Pangu-Weather de Huawei, ClimaX y Stormer de Microsoft, y FourCastNet de NVIDIA
  3. Retraso en Investigación de Asimilación de Datos: Aunque los modelos de predicción meteorológica basados en IA ya pueden competir con los modelos NWP más avanzados, la investigación que combina modelos de IA con asimilación de datos sigue siendo limitada

Motivación de la Investigación

  1. Desafíos Técnicos: La necesidad de experimentos de asimilación de datos secuenciales a largo plazo dificulta la evaluación de sistemas de asimilación de datos para modelos de IA
  2. Vacío Metodológico: Aunque existen investigaciones sobre asimilación de datos variacional combinada con modelos de IA, aún no hay casos exitosos de filtro de Kalman de conjunto combinado con modelos de IA
  3. Necesidad de Diagnóstico: Se requieren métodos efectivos para diagnosticar características de modelos de predicción meteorológica basados en IA, como consistencia física y representación del crecimiento de error

Contribuciones Principales

  1. Implementación Exitosa por Primera Vez: Primera implementación exitosa de la combinación del filtro de Kalman de conjunto transformado localmente (LETKF) con un modelo de predicción meteorológica basado en IA (ClimaX)
  2. Funcionamiento Estable en Ciclos: Se demuestra que mediante técnicas de inflación de covarianza y localización, la asimilación de datos con conjunto del modelo de IA puede funcionar de manera estable durante un año completo
  3. Establecimiento de Marco de Diagnóstico: Se establece un marco para diagnosticar características de modelos de predicción meteorológica basados en IA utilizando asimilación de datos con conjunto
  4. Hallazgos Importantes: Se revelan limitaciones del modelo de IA en comparación con modelos dinámicos en términos de crecimiento de error y consistencia física
  5. Mejora Técnica: Se extendió ClimaX para soportar predicción de más variables a fin de satisfacer los requisitos de asimilación de datos

Explicación Detallada de Métodos

Definición de Tarea

La tarea central de esta investigación es aplicar técnicas de asimilación de datos con conjunto a modelos de predicción meteorológica basados en IA para diagnosticar sus características y evaluar su desempeño en sistemas de asimilación de datos. La entrada consiste en datos de observaciones atmosféricas y predicciones del modelo de IA, y la salida es el campo de análisis asimilado.

Arquitectura del Modelo

Modelo ClimaX

  • Arquitectura Base: Modelo global de predicción meteorológica atmosférica basado en IA con arquitectura Vision Transformer (ViT)
  • Configuración de Resolución: Puntos de cuadrícula 64×32 (5.625°×5.625°), 7 capas verticales (900, 850, 700, 600, 500, 250, 50 hPa)
  • Componentes Clave: Tokenización de variables (variable tokenization) y agregación de variables (variable aggregation)
  • Mejoras Extendidas: Se extendieron las 5 variables de predicción predeterminadas al conjunto completo de variables mostrado en la Tabla 1, soportando requisitos de asimilación de datos

Sistema de Asimilación de Datos LETKF

Ecuación de actualización de matriz de estado de conjunto:

X^a = x̄^b · 1^T + δX^b P̃^a (Y^T R^-1 (y^o - H(X^b) · 1^T) + √(m-1) P̃^a^(1/2))

Donde la matriz de covarianza:

P̃^a = (I + Y^T R^-1 Y)^-1

Función de localización:

l = {exp(-dh²/Lh² - dv²/Lv²)  si dh ≤ 2√(10/3)Lh y dv ≤ 2√(10/3)Lv
     0                        en otro caso}

Puntos de Innovación Técnica

  1. Integración de Sistemas: Primera integración exitosa de LETKF con modelo de predicción meteorológica basado en IA, desarrollada basándose en el sistema SPEEDY-LETKF
  2. Extensión del Modelo: Extensión de ClimaX para soportar el conjunto completo de variables requeridas para asimilación de datos
  3. Método de Diagnóstico: Utilización de indicadores como escala de localización óptima y factor de inflación para diagnosticar características del modelo de IA
  4. Diseño de Red de Observación: Adopción de red de observación similar a observaciones de radiosonda, con observaciones de 7 capas de temperatura, campo de vientos, etc. en estaciones de observación

Configuración Experimental

Conjunto de Datos

  • Datos de Entrenamiento: Conjunto de datos WeatherBench 2006-2015 para entrenamiento, 2016 para validación
  • Datos de Experimento: Datos de 2017 para experimentos de asimilación de datos (no utilizados en entrenamiento)
  • Condiciones Iniciales: Condiciones iniciales de 20 miembros de conjunto seleccionados de datos WeatherBench de 2006

Indicadores de Evaluación

  • RMSE: Error cuadrático medio raíz promediado globalmente
  • Diferencia MAE: Diferencia de error absoluto medio entre campo de análisis y primer pronóstico
  • Factor de Inflación: Factor de inflación de covarianza adaptativo basado en estadísticas del espacio de observación
  • Coeficiente de Correlación de Anomalía: Indicador de desempeño del modelo durante el proceso de entrenamiento

Métodos de Comparación

  • Experimentos de sensibilidad con diferentes escalas de localización horizontal (Lh = 400, 500, 600, 700, 800 km)
  • Comparación de factor de inflación con modelo NWP dinámico (SPEEDY)

Detalles de Implementación

  • Tamaño de Conjunto: 20 miembros
  • Intervalo de Asimilación de Datos: 6 horas
  • Escala de Localización Vertical: Lv = 1.0 (log Pa)
  • Error de Observación: Desviación estándar de temperatura y campo de vientos 1.0, desviación estándar de humedad específica 0.1, desviación estándar de presión de superficie 1.0

Resultados Experimentales

Resultados Principales

Análisis de Estabilidad

  • Ciclos Exitosos: Experimentos con Lh = 500, 600, 700 km mantienen estabilidad durante todo el año 2017
  • Divergencia de Filtro: Lh = 800 km presenta divergencia de filtro después de septiembre de 2017
  • Desempeño Subóptimo: Lh = 400 km reduce continuamente RMSE pero muestra desempeño subóptimo

Escala de Localización Óptima

  • Configuración Óptima: Lh = 600 km logra el RMSE de análisis más bajo en la mayoría de variables
  • Mejora Significativa: Temperatura y presión de superficie muestran reducción significativa de error de análisis
  • Limitación en Campo de Vientos: Vientos zonales y meridionales no muestran mejora evidente, incluso con ligera degradación

Análisis de Patrones Espaciales

  • Mejora en Puntos de Observación: En puntos de cuadrícula con observaciones, vientos zonales y temperatura mejoran generalmente
  • Degradación Periférica: Regiones alrededor de estaciones de observación (como océanos polares, costas de América del Norte y Japón) muestran ligera degradación
  • Ventaja en Hemisferio Sur: Altura geopotencial y presión de superficie muestran mejora en regiones de observación escasa del hemisferio sur

Hallazgos Importantes

Características del Factor de Inflación

  • Requisito de Inflación Alta: ClimaX requiere factor de inflación más alto que modelo dinámico (Figura 6 muestra aproximadamente 1.4-1.6 promediado globalmente)
  • Crecimiento de Error Débil: Indica que el crecimiento de error del modelo de IA es más débil que el modelo NWP dinámico
  • Características Caóticas Deficientes: Consistente con hallazgos de Selz and Craig (2022), el modelo de IA no puede reproducir con precisión el efecto mariposa

Limitaciones de Consistencia Física

  • Limitación de Predicción a Corto Plazo: ClimaX no puede realizar integración natural a largo plazo, desviándose gradualmente de la atmósfera real después de 6 horas de predicción
  • Generación de Campos No Físicos: Predicciones a largo plazo generan campos meteorológicos meteorológicamente irreales (como temperaturas extremadamente bajas en el Pacífico)
  • Problema de Atractor: El modelo de IA no puede volver a trayectorias de atractor meteorológicamente razonables

Trabajo Relacionado

Desarrollo de Predicción Meteorológica basada en IA

  • GraphCast: Trabajo pionero de Google DeepMind
  • Modelos Comerciales: Pangu-Weather (Huawei), ClimaX/Stormer (Microsoft), FourCastNet (NVIDIA)
  • Arquitectura ViT: La mayoría de modelos de predicción meteorológica basados en IA adoptan arquitectura Vision Transformer

Métodos de Asimilación de Datos

  • Métodos Variacionales: Similitud matemática con modelos de IA, investigación existente sobre combinación con 4DVar
  • Métodos de Conjunto: Este estudio implementa exitosamente por primera vez la combinación de EnKF con modelo de IA
  • Asimilación de Datos con Aprendizaje Profundo: Investigación reciente comienza a utilizar redes neuronales para resolver problemas inversos de asimilación de datos

Conclusiones y Discusión

Conclusiones Principales

  1. Viabilidad Técnica: La asimilación de datos con conjunto puede combinarse establemente con modelos de predicción meteorológica basados en IA y funcionar en ciclos continuos
  2. Valor de Diagnóstico: La asimilación de datos con conjunto es una herramienta efectiva para diagnosticar características de modelos de IA
  3. Identificación de Limitaciones: Los modelos de IA presentan insuficiencias en covarianzas de error dependientes del flujo y representación del crecimiento de error
  4. Ventaja en Regiones de Observación Escasa: La predicción por conjunto de IA proporciona covarianzas de error razonables en regiones de observación escasa

Limitaciones

  1. Escala de Localización Óptima Pequeña: 600 km es significativamente menor que 900 km en modelos dinámicos, indicando capacidad insuficiente de captura de covarianzas de error dependientes del flujo
  2. Imposibilidad de Realizar OSSE: Debido a inestabilidad en predicción a largo plazo, no se pueden realizar experimentos de simulación de sistema de observación
  3. Ausencia de Restricciones Físicas: Los modelos de IA carecen de restricciones de leyes físicas, tendiendo a producir campos meteorológicos no realistas
  4. Crecimiento de Error Insuficiente: Dispersión de conjunto insuficiente, requiriendo factor de inflación más alto

Direcciones Futuras

  1. Integración de Restricciones Físicas: Incorporar restricciones físicas como equilibrio hidrostático y equilibrio geostrófico en entrenamiento de modelos de IA
  2. Mejora del Crecimiento de Error: Desarrollar esquemas de parametrización estocástica o métodos de conjunto multimodelo
  3. Extensión de Conjunto Grande: Aprovechar ventajas computacionales de modelos de IA para extender a EnKF de conjunto grande o filtros de partículas localizados
  4. Aplicación con Observaciones Reales: Avanzar hacia asimilación de datos con observaciones reales

Evaluación Profunda

Fortalezas

  1. Contribución Pionera: Primera implementación exitosa de EnKF combinado con modelo de predicción meteorológica basado en IA, con valor académico importante
  2. Investigación Sistemática: Evaluación sistemática de efectividad del método mediante experimentos con múltiples escalas de localización
  3. Diagnóstico Profundo: Análisis profundo de características de modelos de IA utilizando técnicas de asimilación de datos, proporcionando nueva perspectiva de evaluación
  4. Valor Práctico: Proporciona dirección para mejora de modelos de predicción meteorológica basados en IA
  5. Código de Código Abierto: Proporciona código y datos completos, garantizando reproducibilidad

Insuficiencias

  1. Limitación de Resolución: Experimentos realizados solo en baja resolución (5.625°), utilidad práctica limitada
  2. Observaciones Simuladas: Utilización de observaciones simuladas en lugar de datos de observación real, con brecha respecto a aplicaciones prácticas
  3. Modelo Único: Solo se prueba un modelo de IA (ClimaX), universalidad de conclusiones por verificar
  4. Análisis Teórico Insuficiente: Explicación teórica de limitaciones del modelo de IA relativamente superficial

Influencia

  1. Influencia Académica: Abre nueva dirección para combinación de predicción meteorológica basada en IA con asimilación de datos
  2. Valor Práctico: Proporciona referencia importante para desarrollo de sistemas de predicción meteorológica basados en IA operacionales
  3. Contribución Metodológica: Establece marco para diagnosticar modelos de IA utilizando asimilación de datos
  4. Reproducibilidad Fuerte: Código de código abierto completo facilita investigación posterior

Escenarios Aplicables

  1. Evaluación de Modelos de IA: Aplicable al diagnóstico de características de varios modelos de predicción meteorológica basados en IA
  2. Investigación de Asimilación de Datos: Proporciona base para desarrollo de sistemas de asimilación de datos para modelos de IA
  3. Sistemas Híbridos: Puede utilizarse para diseño de sistemas de predicción híbrida IA-física
  4. Investigación Educativa: Caso importante para enseñanza de meteorología con IA

Referencias

  1. Lam, R., et al. (2023): Learning skillful medium-range global weather forecasting. Science, 382(6677), 1416-1421.
  2. Bi, K., et al. (2023): Accurate medium-range global weather forecasting with 3D neural networks. Nature, 619(7970), 533-538.
  3. Hunt, B. R., et al. (2007): Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter. Physica D, 230(1-2), 112-126.
  4. Nguyen, T., et al. (2023): ClimaX: A foundation model for weather and climate. arXiv preprint arXiv:2301.10343.

Este artículo tiene significado pionero en la combinación de predicción meteorológica basada en IA con asimilación de datos. Aunque presenta algunas limitaciones técnicas, sienta una base importante para el desarrollo de este campo, poseyendo valor académico considerable y potencial práctico.