2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.
Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
academic

Hacia Modelos de Inferencia Fundamental que Aprendan EDOs en Contexto

Información Básica

  • ID del Artículo: 2510.12650
  • Título: Towards Foundation Inference Models that Learn ODEs In-Context
  • Autores: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
  • Clasificación: cs.LG (Aprendizaje Automático)
  • Fecha de Publicación/Conferencia: AI in Science (AIS), 2025, Copenhague, Dinamarca
  • Enlace del Artículo: https://arxiv.org/abs/2510.12650

Resumen

Las ecuaciones diferenciales ordinarias (EDOs) describen sistemas dinámicos cuya evolución es determinista en tiempo continuo. La modelización precisa de sistemas EDO desde una perspectiva impulsada por datos constituye un problema central en las ciencias naturales, aunque sigue siendo desafiante en contextos de datos escasos o ruidosos. Este artículo presenta FIM-ODE (Modelo de Inferencia Fundamental para EDOs), un modelo neuronal preentrenado diseñado para estimar EDOs de manera cero-shot (es decir, en contexto) a partir de observaciones escasas y ruidosas. El modelo se entrena con datos sintéticos, utilizando operadores neurales flexibles para la inferencia robusta de EDOs, funcionando incluso con datos corruptos. La validación experimental demuestra que FIM-ODE proporciona estimaciones precisas, con un desempeño comparable a métodos de última generación basados en redes neuronales, y realiza comparaciones cualitativas de cómo estiman la estructura del campo vectorial.

Contexto de Investigación y Motivación

Definición del Problema

El problema central que aborda esta investigación es el problema de identificación de sistemas EDO: estimar la EDO (es decir, el campo vectorial) que mejor describe el sistema basándose únicamente en observaciones de series temporales. Esto tiene aplicaciones amplias en las ciencias naturales, desde las leyes del movimiento de Newton hasta la dinámica de poblaciones en sistemas biológicos y la convección atmosférica en meteorología.

Importancia del Problema

  1. Aplicabilidad Generalizada: Las EDOs son herramientas de modelización fundamental en múltiples campos como física, biología y meteorología
  2. Capacidad Predictiva: Los modelos EDO precisos pueden caracterizar fenómenos subyacentes (como puntos fijos o ciclos límite) y predecir estados futuros
  3. Comprensión Científica: Los modelos EDO facilitan la comprensión de los mecanismos internos y las características dinámicas del sistema

Limitaciones de Métodos Existentes

  1. Métodos Tradicionales: Los métodos no paramétricos o basados en regresión simbólica muestran un desempeño deficiente al procesar datos escasos y ruidosos
  2. Limitaciones de ODEFormer: Aunque es el método más reciente de regresión neuronal-simbólica, solo puede procesar una única trayectoria y puede producir patrones innecesariamente complejos en la predicción del campo vectorial global

Motivación de la Investigación

Los autores, basándose en el marco de Modelos de Inferencia Fundamental (FIMs), que ha demostrado buenos resultados en cadenas de Markov en tiempo continuo, ecuaciones diferenciales estocásticas e inferencia de procesos puntuales, proponen el modelo FIM-ODE especializado en inferencia de EDOs.

Contribuciones Principales

  1. Propuesta del Modelo FIM-ODE: Primer modelo preentrenado de inferencia de EDOs basado en el marco de Modelos de Inferencia Fundamental
  2. Arquitectura de Operador Neuronal: Adopta el operador neuronal DeepONet para la estimación flexible del campo vectorial
  3. Capacidad de Procesamiento Multi-Trayectoria: Puede procesar simultáneamente múltiples trayectorias del mismo sistema, mejorando la precisión de la inferencia
  4. Desempeño Superior: Supera a ODEFormer en conjuntos de datos sintéticos, con puntuaciones R² de 0.90 vs 0.65 (tarea de reconstrucción) y 0.26 vs 0.19 (tarea de generalización)
  5. Predicción Global Más Razonable: En comparación con ODEFormer, proporciona predicciones de campo vectorial más simples y razonables en regiones alejadas de los puntos observados

Explicación Detallada del Método

Definición de la Tarea

Dado un conjunto de observaciones de series temporales D={yk}k=1K\mathcal{D} = \{y_k\}_{k=1}^K, donde cada secuencia yk=[(tk1,yk1),,(tkL,ykL)]y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})], el objetivo es estimar el campo vectorial f^\hat{f} que pueda describir el sistema EDO que genera estas observaciones:

dx(t)dt=f(t,x(t))\frac{dx(t)}{dt} = f(t, x(t))

Arquitectura del Modelo

1. Generación de Datos Sintéticos

  • Se muestrean componentes del campo vectorial a partir de una distribución polinomial multivariada (máximo grado 3)
  • Soporta sistemas EDO de hasta 3 dimensiones
  • Se simula el sistema en una malla irregular y se añade ruido para generar datos de entrenamiento

2. Arquitectura de Operador Neuronal (DeepONet)

FIM-ODE adopta la arquitectura de operador neuronal DeepONet, que comprende tres componentes principales:

Red Rama (Branch Network):

  • Utiliza un codificador Transformer
  • Codifica los datos observados D\mathcal{D} en K(L1)K(L-1) representaciones de dimensión EE: DRE×K(L1)\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}
  • Mantiene codificaciones independientes para prácticamente todas las observaciones

Red Tronco (Trunk Network):

  • Mapeo lineal que codifica la posición xRDx \in \mathbb{R}^D en h(x)REh(x) \in \mathbb{R}^E

Red de Combinación (Combination Network):

  • Secuencia de capas de atención residual, similar a un decodificador Transformer
  • Utiliza D\mathcal{D} como claves y valores, h(x)h(x) como consulta
  • Proyección lineal final para obtener la estimación del campo vectorial f^(x)\hat{f}(x)

3. Objetivo de Entrenamiento

Se adopta un objetivo de aprendizaje supervisado: L(x,D,f)=f^(x)f(x)2L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2

Que coincide con el campo vectorial predicho y real en puntos de muestreo cercanos a los valores observados xx.

Puntos de Innovación Técnica

  1. Capacidad de Aprendizaje en Contexto: Puede procesar nuevos sistemas EDO sin entrenamiento adicional o ajuste fino
  2. Fusión Multi-Trayectoria: Puede procesar simultáneamente múltiples trayectorias, extrayendo y combinando efectivamente toda la información disponible
  3. Aproximación de Función Flexible: Los operadores neurales son más flexibles que la regresión simbólica al procesar datos escasos y ruidosos
  4. Equilibrio Local-Global: Proporciona predicciones complejas cerca de puntos observados y predicciones simples y razonables en regiones alejadas de las observaciones

Configuración Experimental

Conjunto de Datos

  • Datos de Entrenamiento: 600,000 ecuaciones EDO sintéticas, modelo con aproximadamente 20 millones de parámetros
  • Datos de Prueba: 4,000 campos vectoriales polinomiales EDO (máximo grado 3, máximo 3 dimensiones)
  • Configuración de Trayectorias: Cada EDO genera 9 trayectorias, estados iniciales muestreados de N(0,1)N(0,1)
  • Configuración de Observaciones: 200 puntos de observación por trayectoria, malla regular, intervalo de tiempo Δτ=0.05\Delta\tau = 0.05

Métricas de Evaluación

Se utiliza la Precisión R²: Porcentaje de puntuaciones R² mayores que 0.9

Métodos de Comparación

ODEFormer: Método preentrenado de regresión neuronal-simbólica, entrenado en 50 millones de ecuaciones, con 86 millones de parámetros

Tareas Experimentales

  1. Tarea de Reconstrucción: Mide el desempeño de reconstrucción en trayectorias de contexto
  2. Tarea de Generalización: Mide el desempeño de reconstrucción en trayectorias retenidas

Resultados Experimentales

Resultados Principales

ModeloTarea de ReconstrucciónTarea de Generalización
ODEFormer0.650.19
FIM-ODE0.900.26

Hallazgos Clave:

  • FIM-ODE supera significativamente a ODEFormer en ambas tareas
  • La tarea de generalización es más desafiante que la tarea de reconstrucción, lo que es intuitivo
  • A pesar de que ODEFormer se entrena en una distribución más amplia y tiene más parámetros, FIM-ODE aún muestra un desempeño superior

Análisis de Contexto Multi-Trayectoria

La Figura 1 muestra la estimación del campo vectorial de FIM-ODE con diferentes números de trayectorias de contexto:

  • Trayectoria Única: Estimación imprecisa en posiciones alejadas de las observaciones
  • Multi-Trayectoria: A medida que aumenta el número de trayectorias, FIM-ODE puede corregir estas estimaciones, cubriendo efectivamente un espacio más grande

Comparación de Predicción Local y Global

La Figura 2 compara las estimaciones del campo vectorial de FIM-ODE y ODEFormer:

  • FIM-ODE:
    • Local: Predice patrones complejos en puntos observados para reconstruir trayectorias
    • Global: Predice patrones más simples cuando se aleja de puntos observados
  • ODEFormer: Predice campos vectoriales más complejos, resultando en predicciones de patrones globales complejas sin apoyo de una única trayectoria simple

Análisis de Diferencias Estructurales

Las diferencias entre los dos modelos provienen de diferentes parametrizaciones del campo vectorial:

  • ODEFormer: Restringido a ecuaciones simbólicas (racionales) polinomiales, que pueden no predeterminar expresiones simples bajo observaciones escasas o ruidosas
  • FIM-ODE: Los operadores neurales pueden manejar estas situaciones de manera más flexible

Trabajo Relacionado

Métodos Tradicionales de Inferencia de EDOs

  1. Métodos No Paramétricos: Como procesos gaussianos, entre otros
  2. Métodos de Regresión Simbólica: Regresión simbólica tradicional basada en algoritmos genéticos u otros métodos de optimización

Marco de Modelos de Inferencia Fundamental

  • FIM-CTMC: Inferencia de cadenas de Markov en tiempo continuo
  • FIM-SDE: Inferencia de ecuaciones diferenciales estocásticas
  • FIM-PP: Inferencia de procesos puntuales
  • El FIM-ODE de este artículo es una extensión de este marco a la inferencia de EDOs

Regresión Neuronal-Simbólica

ODEFormer: Método neuronal preentrenado que convierte observaciones de series temporales en ecuaciones simbólicas

Conclusiones y Discusión

Conclusiones Principales

  1. FIM-ODE extiende exitosamente el marco de Modelos de Inferencia Fundamental al problema de inferencia de EDOs
  2. En conjuntos de datos sintéticos, FIM-ODE supera significativamente al método de última generación existente, ODEFormer
  3. La flexibilidad del operador neuronal permite que FIM-ODE proporcione predicciones de campo vectorial global más razonables
  4. La capacidad de procesamiento multi-trayectoria es una ventaja importante de FIM-ODE sobre ODEFormer

Limitaciones

  1. Restricción de Distribución de Datos: Actualmente validado solo en campos vectoriales polinomiales, los sistemas reales pueden ser más complejos
  2. Restricción de Dimensionalidad: Los experimentos actuales se limitan a sistemas de 3 dimensiones
  3. Alcance de Evaluación: Se requiere validación en sistemas EDO más amplios
  4. Eficiencia Computacional: El artículo no discute en detalle la complejidad computacional y la velocidad de inferencia

Direcciones Futuras

  1. Evaluación en ODEBench: Comparar métodos en un conjunto de datos de referencia que contiene 63 EDOs seleccionadas manualmente
  2. Descubrimiento de Dinámicas Latentes: Explorar el uso de FIM-ODE preentrenado para descubrir dinámicas latentes
  3. Extensión de Aplicaciones:
    • Dinámicas de poblaciones neurales
    • Cinética de reacciones químicas
    • Evolución de contenido en lenguaje natural

Evaluación Profunda

Fortalezas

  1. Innovación Metodológica: Primera aplicación del marco FIM a la inferencia de EDOs, con diseño arquitectónico razonable
  2. Ventajas Técnicas:
    • Capacidad de procesamiento multi-trayectoria
    • Arquitectura flexible de operador neuronal
    • Capacidad de aprendizaje en contexto
  3. Suficiencia Experimental:
    • Comparación directa con línea base sólida
    • Análisis desde múltiples perspectivas (reconstrucción vs generalización, local vs global)
    • Análisis de visualización mejora la comprensión
  4. Convincencia de Resultados: Supera significativamente al método de comparación en todas las métricas

Insuficiencias

  1. Alcance Experimental Limitado:
    • Validación solo en datos polinomiales sintéticos
    • Falta de validación en datos del mundo real
    • Dimensionalidad y complejidad limitadas
  2. Comparación Insuficiente:
    • Solo comparación con ODEFormer, falta de comparación con otros métodos tradicionales
    • Sin comparación de eficiencia computacional
  3. Falta de Análisis Teórico:
    • Ausencia de garantías teóricas de convergencia o capacidad de generalización
    • Sin análisis de ventajas teóricas del método
  4. Detalles Técnicos Insuficientes:
    • Descripción breve de detalles de entrenamiento
    • Falta de explicación sobre selección de hiperparámetros

Impacto

  1. Contribución Académica:
    • Extiende el alcance de aplicación del marco FIM
    • Proporciona un nuevo método de red neuronal para inferencia de EDOs
  2. Valor Práctico:
    • La capacidad de inferencia cero-shot tiene potencial de aplicación práctica
    • El procesamiento multi-trayectoria es más práctico en escenarios reales
  3. Reproducibilidad:
    • Basado en la arquitectura FIM-SDE existente, la ruta técnica es clara
    • Pero carece de detalles de implementación detallados

Escenarios Aplicables

  1. Computación Científica: Modelización de sistemas dinámicos en física, biología, química y otros campos
  2. Aplicaciones de Ingeniería: Sistemas de control, procesamiento de señales y otros escenarios que requieren identificación de sistemas
  3. Escenarios de Datos Escasos: Particularmente adecuado para situaciones donde los datos de observación son limitados o ruidosos
  4. Datos Multi-Trayectoria: Ventajas evidentes cuando el mismo sistema tiene múltiples trayectorias observadas

Referencias

Este artículo hace referencia principalmente a los siguientes trabajos clave:

  • d'Ascoli et al. (2024): Artículo original de ODEFormer
  • Seifner et al. (2025a): Marco FIM-SDE
  • Lu et al. (2021): Operador neuronal DeepONet
  • Berghaus et al. (2024): Trabajo fundamental del marco FIM

Evaluación General: Este es un artículo técnicamente sólido que extiende exitosamente el marco de Modelos de Inferencia Fundamental al problema de inferencia de EDOs. Aunque el alcance experimental es limitado, demuestra ventajas evidentes en la configuración establecida. Este trabajo proporciona un método valioso y novedoso para el problema de identificación de sistemas en computación científica, con buenas perspectivas de desarrollo.