2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.

Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.

academic

Hacia Modelos de Inferencia Fundamental que Aprendan EDOs en Contexto

Información Básica

ID del Artículo: 2510.12650
Título: Towards Foundation Inference Models that Learn ODEs In-Context
Autores: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
Clasificación: cs.LG (Aprendizaje Automático)
Fecha de Publicación/Conferencia: AI in Science (AIS), 2025, Copenhague, Dinamarca
Enlace del Artículo: https://arxiv.org/abs/2510.12650

Resumen

Las ecuaciones diferenciales ordinarias (EDOs) describen sistemas dinámicos cuya evolución es determinista en tiempo continuo. La modelización precisa de sistemas EDO desde una perspectiva impulsada por datos constituye un problema central en las ciencias naturales, aunque sigue siendo desafiante en contextos de datos escasos o ruidosos. Este artículo presenta FIM-ODE (Modelo de Inferencia Fundamental para EDOs), un modelo neuronal preentrenado diseñado para estimar EDOs de manera cero-shot (es decir, en contexto) a partir de observaciones escasas y ruidosas. El modelo se entrena con datos sintéticos, utilizando operadores neurales flexibles para la inferencia robusta de EDOs, funcionando incluso con datos corruptos. La validación experimental demuestra que FIM-ODE proporciona estimaciones precisas, con un desempeño comparable a métodos de última generación basados en redes neuronales, y realiza comparaciones cualitativas de cómo estiman la estructura del campo vectorial.

Contexto de Investigación y Motivación

Definición del Problema

El problema central que aborda esta investigación es el problema de identificación de sistemas EDO: estimar la EDO (es decir, el campo vectorial) que mejor describe el sistema basándose únicamente en observaciones de series temporales. Esto tiene aplicaciones amplias en las ciencias naturales, desde las leyes del movimiento de Newton hasta la dinámica de poblaciones en sistemas biológicos y la convección atmosférica en meteorología.

Importancia del Problema

Aplicabilidad Generalizada: Las EDOs son herramientas de modelización fundamental en múltiples campos como física, biología y meteorología
Capacidad Predictiva: Los modelos EDO precisos pueden caracterizar fenómenos subyacentes (como puntos fijos o ciclos límite) y predecir estados futuros
Comprensión Científica: Los modelos EDO facilitan la comprensión de los mecanismos internos y las características dinámicas del sistema

Limitaciones de Métodos Existentes

Métodos Tradicionales: Los métodos no paramétricos o basados en regresión simbólica muestran un desempeño deficiente al procesar datos escasos y ruidosos
Limitaciones de ODEFormer: Aunque es el método más reciente de regresión neuronal-simbólica, solo puede procesar una única trayectoria y puede producir patrones innecesariamente complejos en la predicción del campo vectorial global

Motivación de la Investigación

Los autores, basándose en el marco de Modelos de Inferencia Fundamental (FIMs), que ha demostrado buenos resultados en cadenas de Markov en tiempo continuo, ecuaciones diferenciales estocásticas e inferencia de procesos puntuales, proponen el modelo FIM-ODE especializado en inferencia de EDOs.

Contribuciones Principales

Propuesta del Modelo FIM-ODE: Primer modelo preentrenado de inferencia de EDOs basado en el marco de Modelos de Inferencia Fundamental
Arquitectura de Operador Neuronal: Adopta el operador neuronal DeepONet para la estimación flexible del campo vectorial
Capacidad de Procesamiento Multi-Trayectoria: Puede procesar simultáneamente múltiples trayectorias del mismo sistema, mejorando la precisión de la inferencia
Desempeño Superior: Supera a ODEFormer en conjuntos de datos sintéticos, con puntuaciones R² de 0.90 vs 0.65 (tarea de reconstrucción) y 0.26 vs 0.19 (tarea de generalización)
Predicción Global Más Razonable: En comparación con ODEFormer, proporciona predicciones de campo vectorial más simples y razonables en regiones alejadas de los puntos observados

Explicación Detallada del Método

Definición de la Tarea

Dado un conjunto de observaciones de series temporales $\mathcal{D} = \{y_k\}_{k=1}^K$ , donde cada secuencia $y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})]$ , el objetivo es estimar el campo vectorial $\hat{f}$ que pueda describir el sistema EDO que genera estas observaciones:

$\frac{dx(t)}{dt} = f(t, x(t))$

Arquitectura del Modelo

1. Generación de Datos Sintéticos

Se muestrean componentes del campo vectorial a partir de una distribución polinomial multivariada (máximo grado 3)
Soporta sistemas EDO de hasta 3 dimensiones
Se simula el sistema en una malla irregular y se añade ruido para generar datos de entrenamiento

2. Arquitectura de Operador Neuronal (DeepONet)

FIM-ODE adopta la arquitectura de operador neuronal DeepONet, que comprende tres componentes principales:

Red Rama (Branch Network):

Utiliza un codificador Transformer
Codifica los datos observados $\mathcal{D}$ en $K(L-1)$ representaciones de dimensión $E$ : $\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}$
Mantiene codificaciones independientes para prácticamente todas las observaciones

Red Tronco (Trunk Network):

Mapeo lineal que codifica la posición $x \in \mathbb{R}^D$ en $h(x) \in \mathbb{R}^E$

Red de Combinación (Combination Network):

Secuencia de capas de atención residual, similar a un decodificador Transformer
Utiliza $\mathcal{D}$ como claves y valores, $h(x)$ como consulta
Proyección lineal final para obtener la estimación del campo vectorial $\hat{f}(x)$

3. Objetivo de Entrenamiento

Se adopta un objetivo de aprendizaje supervisado: $L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2$

Que coincide con el campo vectorial predicho y real en puntos de muestreo cercanos a los valores observados $x$ .

Puntos de Innovación Técnica

Capacidad de Aprendizaje en Contexto: Puede procesar nuevos sistemas EDO sin entrenamiento adicional o ajuste fino
Fusión Multi-Trayectoria: Puede procesar simultáneamente múltiples trayectorias, extrayendo y combinando efectivamente toda la información disponible
Aproximación de Función Flexible: Los operadores neurales son más flexibles que la regresión simbólica al procesar datos escasos y ruidosos
Equilibrio Local-Global: Proporciona predicciones complejas cerca de puntos observados y predicciones simples y razonables en regiones alejadas de las observaciones

Configuración Experimental

Conjunto de Datos

Datos de Entrenamiento: 600,000 ecuaciones EDO sintéticas, modelo con aproximadamente 20 millones de parámetros
Datos de Prueba: 4,000 campos vectoriales polinomiales EDO (máximo grado 3, máximo 3 dimensiones)
Configuración de Trayectorias: Cada EDO genera 9 trayectorias, estados iniciales muestreados de $N(0,1)$
Configuración de Observaciones: 200 puntos de observación por trayectoria, malla regular, intervalo de tiempo $\Delta\tau = 0.05$

Métricas de Evaluación

Se utiliza la Precisión R²: Porcentaje de puntuaciones R² mayores que 0.9

Métodos de Comparación

ODEFormer: Método preentrenado de regresión neuronal-simbólica, entrenado en 50 millones de ecuaciones, con 86 millones de parámetros

Tareas Experimentales

Tarea de Reconstrucción: Mide el desempeño de reconstrucción en trayectorias de contexto
Tarea de Generalización: Mide el desempeño de reconstrucción en trayectorias retenidas

Resultados Experimentales

Resultados Principales

Modelo	Tarea de Reconstrucción	Tarea de Generalización
ODEFormer	0.65	0.19
FIM-ODE	0.90	0.26

Hallazgos Clave:

FIM-ODE supera significativamente a ODEFormer en ambas tareas
La tarea de generalización es más desafiante que la tarea de reconstrucción, lo que es intuitivo
A pesar de que ODEFormer se entrena en una distribución más amplia y tiene más parámetros, FIM-ODE aún muestra un desempeño superior

Análisis de Contexto Multi-Trayectoria

La Figura 1 muestra la estimación del campo vectorial de FIM-ODE con diferentes números de trayectorias de contexto:

Trayectoria Única: Estimación imprecisa en posiciones alejadas de las observaciones
Multi-Trayectoria: A medida que aumenta el número de trayectorias, FIM-ODE puede corregir estas estimaciones, cubriendo efectivamente un espacio más grande

Comparación de Predicción Local y Global

La Figura 2 compara las estimaciones del campo vectorial de FIM-ODE y ODEFormer:

FIM-ODE:
- Local: Predice patrones complejos en puntos observados para reconstruir trayectorias
- Global: Predice patrones más simples cuando se aleja de puntos observados
ODEFormer: Predice campos vectoriales más complejos, resultando en predicciones de patrones globales complejas sin apoyo de una única trayectoria simple

Análisis de Diferencias Estructurales

Las diferencias entre los dos modelos provienen de diferentes parametrizaciones del campo vectorial:

ODEFormer: Restringido a ecuaciones simbólicas (racionales) polinomiales, que pueden no predeterminar expresiones simples bajo observaciones escasas o ruidosas
FIM-ODE: Los operadores neurales pueden manejar estas situaciones de manera más flexible

Trabajo Relacionado

Métodos Tradicionales de Inferencia de EDOs

Métodos No Paramétricos: Como procesos gaussianos, entre otros
Métodos de Regresión Simbólica: Regresión simbólica tradicional basada en algoritmos genéticos u otros métodos de optimización

Marco de Modelos de Inferencia Fundamental

FIM-CTMC: Inferencia de cadenas de Markov en tiempo continuo
FIM-SDE: Inferencia de ecuaciones diferenciales estocásticas
FIM-PP: Inferencia de procesos puntuales
El FIM-ODE de este artículo es una extensión de este marco a la inferencia de EDOs

Regresión Neuronal-Simbólica

ODEFormer: Método neuronal preentrenado que convierte observaciones de series temporales en ecuaciones simbólicas

Conclusiones y Discusión

Conclusiones Principales

FIM-ODE extiende exitosamente el marco de Modelos de Inferencia Fundamental al problema de inferencia de EDOs
En conjuntos de datos sintéticos, FIM-ODE supera significativamente al método de última generación existente, ODEFormer
La flexibilidad del operador neuronal permite que FIM-ODE proporcione predicciones de campo vectorial global más razonables
La capacidad de procesamiento multi-trayectoria es una ventaja importante de FIM-ODE sobre ODEFormer

Limitaciones

Restricción de Distribución de Datos: Actualmente validado solo en campos vectoriales polinomiales, los sistemas reales pueden ser más complejos
Restricción de Dimensionalidad: Los experimentos actuales se limitan a sistemas de 3 dimensiones
Alcance de Evaluación: Se requiere validación en sistemas EDO más amplios
Eficiencia Computacional: El artículo no discute en detalle la complejidad computacional y la velocidad de inferencia

Direcciones Futuras

Evaluación en ODEBench: Comparar métodos en un conjunto de datos de referencia que contiene 63 EDOs seleccionadas manualmente
Descubrimiento de Dinámicas Latentes: Explorar el uso de FIM-ODE preentrenado para descubrir dinámicas latentes
Extensión de Aplicaciones:
- Dinámicas de poblaciones neurales
- Cinética de reacciones químicas
- Evolución de contenido en lenguaje natural

Evaluación Profunda

Fortalezas

Innovación Metodológica: Primera aplicación del marco FIM a la inferencia de EDOs, con diseño arquitectónico razonable
Ventajas Técnicas:
- Capacidad de procesamiento multi-trayectoria
- Arquitectura flexible de operador neuronal
- Capacidad de aprendizaje en contexto
Suficiencia Experimental:
- Comparación directa con línea base sólida
- Análisis desde múltiples perspectivas (reconstrucción vs generalización, local vs global)
- Análisis de visualización mejora la comprensión
Convincencia de Resultados: Supera significativamente al método de comparación en todas las métricas

Insuficiencias

Alcance Experimental Limitado:
- Validación solo en datos polinomiales sintéticos
- Falta de validación en datos del mundo real
- Dimensionalidad y complejidad limitadas
Comparación Insuficiente:
- Solo comparación con ODEFormer, falta de comparación con otros métodos tradicionales
- Sin comparación de eficiencia computacional
Falta de Análisis Teórico:
- Ausencia de garantías teóricas de convergencia o capacidad de generalización
- Sin análisis de ventajas teóricas del método
Detalles Técnicos Insuficientes:
- Descripción breve de detalles de entrenamiento
- Falta de explicación sobre selección de hiperparámetros

Impacto

Contribución Académica:
- Extiende el alcance de aplicación del marco FIM
- Proporciona un nuevo método de red neuronal para inferencia de EDOs
Valor Práctico:
- La capacidad de inferencia cero-shot tiene potencial de aplicación práctica
- El procesamiento multi-trayectoria es más práctico en escenarios reales
Reproducibilidad:
- Basado en la arquitectura FIM-SDE existente, la ruta técnica es clara
- Pero carece de detalles de implementación detallados

Escenarios Aplicables

Computación Científica: Modelización de sistemas dinámicos en física, biología, química y otros campos
Aplicaciones de Ingeniería: Sistemas de control, procesamiento de señales y otros escenarios que requieren identificación de sistemas
Escenarios de Datos Escasos: Particularmente adecuado para situaciones donde los datos de observación son limitados o ruidosos
Datos Multi-Trayectoria: Ventajas evidentes cuando el mismo sistema tiene múltiples trayectorias observadas

Referencias

Este artículo hace referencia principalmente a los siguientes trabajos clave:

d'Ascoli et al. (2024): Artículo original de ODEFormer
Seifner et al. (2025a): Marco FIM-SDE
Lu et al. (2021): Operador neuronal DeepONet
Berghaus et al. (2024): Trabajo fundamental del marco FIM

Evaluación General: Este es un artículo técnicamente sólido que extiende exitosamente el marco de Modelos de Inferencia Fundamental al problema de inferencia de EDOs. Aunque el alcance experimental es limitado, demuestra ventajas evidentes en la configuración establecida. Este trabajo proporciona un método valioso y novedoso para el problema de identificación de sistemas en computación científica, con buenas perspectivas de desarrollo.