2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.

Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.

academic

Vers des Modèles d'Inférence Fondamentaux qui Apprennent les EDO en Contexte

Informations Fondamentales

Identifiant de l'article: 2510.12650
Titre: Towards Foundation Inference Models that Learn ODEs In-Context
Auteurs: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
Classification: cs.LG (Apprentissage Automatique)
Date de publication/Conférence: AI in Science (AIS), 2025, Copenhague, Danemark
Lien de l'article: https://arxiv.org/abs/2510.12650

Résumé

Les équations différentielles ordinaires (EDO) décrivent les systèmes dynamiques dont l'évolution est déterministe dans le temps continu. La modélisation précise des systèmes EDO à partir de données est un problème fondamental en sciences naturelles, mais reste difficile en cas de données éparses ou bruitées. Cet article présente FIM-EDO (Foundation Inference Model for ODEs), un modèle neuronal pré-entraîné conçu pour estimer les EDO à partir d'observations éparses et bruitées sans apprentissage supplémentaire (c'est-à-dire en contexte). Le modèle est entraîné sur des données synthétiques et utilise des opérateurs neuraux flexibles pour une inférence robuste des EDO, fonctionnant même sur des données corrompues. Les validations expérimentales montrent que FIM-EDO fournit des estimations précises, avec des performances comparables aux méthodes de pointe en réseaux de neurones, et permet une comparaison qualitative de la structure des champs de vecteurs estimés.

Contexte et Motivation de la Recherche

Définition du Problème

Le problème fondamental abordé par cette recherche est le problème d'identification de systèmes EDO: estimer à partir d'observations de séries temporelles l'EDO (c'est-à-dire le champ de vecteurs) qui décrit le mieux le système. Ceci a des applications largement répandues en sciences naturelles, allant des lois du mouvement de Newton à la dynamique des populations en biologie, en passant par la convection atmosphérique en météorologie.

Importance du Problème

Applicabilité générale: Les EDO sont des outils de modélisation fondamentaux dans plusieurs domaines: physique, biologie, météorologie, etc.
Capacité prédictive: Un modèle EDO précis peut caractériser les phénomènes latents (tels que les points fixes ou les cycles limites) et prédire les états futurs
Compréhension scientifique: Les modèles EDO aident à comprendre les mécanismes intrinsèques et les caractéristiques dynamiques des systèmes

Limitations des Méthodes Existantes

Méthodes traditionnelles: Les méthodes non paramétriques ou basées sur la régression symbolique fonctionnent mal avec des données éparses et bruitées
Limitations d'ODEFormer: Bien qu'il s'agisse de la dernière méthode de régression symbolique neuronale, elle ne peut traiter qu'une seule trajectoire et peut produire des motifs complexes déraisonnables dans la prédiction du champ de vecteurs global

Motivation de la Recherche

Les auteurs, basés sur le cadre des Foundation Inference Models (FIMs), qui a montré de bons résultats dans l'inférence de chaînes de Markov en temps continu, d'équations différentielles stochastiques et de processus ponctuels, proposent le modèle FIM-EDO spécialement conçu pour l'inférence d'EDO.

Contributions Principales

Proposition du modèle FIM-EDO: Premier modèle pré-entraîné d'inférence d'EDO basé sur le cadre des Foundation Inference Models
Architecture d'opérateurs neuraux: Utilise l'opérateur neuronal DeepONet pour une estimation flexible du champ de vecteurs
Capacité de traitement multi-trajectoires: Peut traiter simultanément plusieurs trajectoires du même système, améliorant la précision de l'inférence
Performance supérieure: Surpasse ODEFormer sur l'ensemble de données synthétiques, avec des scores R² respectifs de 0,90 vs 0,65 (tâche de reconstruction) et 0,26 vs 0,19 (tâche de généralisation)
Prédictions globales plus raisonnables: Par rapport à ODEFormer, fournit des prédictions de champs de vecteurs plus simples et plus raisonnables dans les régions éloignées des points d'observation

Détails de la Méthode

Définition de la Tâche

Étant donné un ensemble d'observations de séries temporelles $\mathcal{D} = \{y_k\}_{k=1}^K$ , où chaque séquence $y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})]$ , l'objectif est d'estimer le champ de vecteurs $\hat{f}$ capable de décrire le système EDO générant ces observations:

$\frac{dx(t)}{dt} = f(t, x(t))$

Architecture du Modèle

1. Génération de Données Synthétiques

Échantillonnage de chaque composante du champ de vecteurs à partir d'une distribution polynomiale multivariée (degré maximal 3)
Support de systèmes EDO jusqu'à 3 dimensions
Simulation du système sur une grille irrégulière et ajout de bruit pour générer les données d'entraînement

2. Architecture d'Opérateurs Neuraux (DeepONet)

FIM-EDO adopte l'architecture d'opérateur neuronal DeepONet, comprenant trois composants principaux:

Réseau de Branche (Branch Network):

Utilise un encodeur Transformer
Encode les données d'observation $\mathcal{D}$ en $K(L-1)$ représentations de dimension $E$ : $\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}$
Conserve des encodages indépendants pour presque toutes les observations

Réseau Principal (Trunk Network):

Mappage linéaire qui encode la position $x \in \mathbb{R}^D$ en $h(x) \in \mathbb{R}^E$

Réseau de Combinaison (Combination Network):

Séquence de couches d'attention résiduelle, similaire à un décodeur Transformer
Utilise $\mathcal{D}$ comme clés et valeurs, $h(x)$ comme requête
Projection linéaire finale pour obtenir l'estimation du champ de vecteurs $\hat{f}(x)$

3. Objectif d'Entraînement

Utilise un objectif d'apprentissage supervisé: $L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2$

Correspondance entre les champs de vecteurs prédits et réels sur les points d'échantillonnage $x$ proches des valeurs observées.

Points d'Innovation Technique

Capacité d'apprentissage en contexte: Traite les nouveaux systèmes EDO sans entraînement ou ajustement supplémentaire
Fusion multi-trajectoires: Traite simultanément plusieurs trajectoires, extrayant et combinant efficacement toutes les informations disponibles
Approximation de fonction flexible: Les opérateurs neuraux sont plus flexibles que la régression symbolique pour traiter les données éparses et bruitées
Équilibre local-global: Fournit des prédictions complexes près des points d'observation et des prédictions simples et raisonnables dans les régions éloignées

Configuration Expérimentale

Ensemble de Données

Données d'entraînement: 600 000 équations EDO synthétiques, modèles d'environ 20 millions de paramètres
Données de test: 4 000 champs de vecteurs polynomiaux EDO (degré maximal 3, jusqu'à 3 dimensions)
Configuration des trajectoires: 9 trajectoires générées par EDO, états initiaux échantillonnés à partir de $N(0,1)$
Configuration des observations: 200 points d'observation par trajectoire, grille régulière, intervalle de temps $\Delta\tau = 0,05$

Métriques d'Évaluation

Utilise le score R²: Pourcentage de scores R² supérieurs à 0,9

Méthodes de Comparaison

ODEFormer: Méthode de régression symbolique neuronale pré-entraînée, entraînée sur 50 millions d'équations, avec 86 millions de paramètres

Tâches Expérimentales

Tâche de reconstruction: Mesure la performance de reconstruction sur les trajectoires contextuelles
Tâche de généralisation: Mesure la performance de reconstruction sur les trajectoires retenues

Résultats Expérimentaux

Résultats Principaux

Modèle	Tâche de Reconstruction	Tâche de Généralisation
ODEFormer	0,65	0,19
FIM-EDO	0,90	0,26

Découvertes Clés:

FIM-EDO surpasse significativement ODEFormer dans les deux tâches
La tâche de généralisation est plus difficile que la tâche de reconstruction, ce qui est conforme à l'intuition
Malgré l'entraînement d'ODEFormer sur une distribution plus large et plus de paramètres, FIM-EDO affiche de meilleures performances

Analyse du Contexte Multi-Trajectoires

La Figure 1 montre l'estimation du champ de vecteurs de FIM-EDO avec différents nombres de trajectoires contextuelles:

Trajectoire unique: Estimation inexacte dans les positions éloignées des observations
Multi-trajectoires: Avec l'augmentation du nombre de trajectoires, FIM-EDO corrige ces estimations, couvrant efficacement un espace plus grand

Comparaison des Prédictions Locales et Globales

La Figure 2 compare les estimations du champ de vecteurs de FIM-EDO et ODEFormer:

FIM-EDO:
- Local: Prédit des motifs complexes aux points d'observation pour reconstruire les trajectoires
- Global: Prédit des champs de vecteurs plus simples loin des points d'observation
ODEFormer: Prédit des champs de vecteurs plus complexes, entraînant des prédictions de motifs globaux complexes et manquant de support d'une seule trajectoire simple

Analyse des Différences Structurelles

Les différences entre les deux modèles proviennent de paramétrages différents du champ de vecteurs:

ODEFormer: Limité aux équations symboliques polynomiales (rationnelles), qui peuvent ne pas se réduire par défaut à des expressions simples avec des observations éparses ou bruitées
FIM-EDO: L'opérateur neuronal traite ces cas de manière plus flexible

Travaux Connexes

Méthodes Traditionnelles d'Inférence d'EDO

Méthodes non paramétriques: Telles que les processus gaussiens, etc.
Méthodes de régression symbolique: Régression symbolique traditionnelle basée sur des algorithmes génétiques ou d'autres méthodes d'optimisation

Cadre des Foundation Inference Models

FIM-CTMC: Inférence de chaînes de Markov en temps continu
FIM-SDE: Inférence d'équations différentielles stochastiques
FIM-PP: Inférence de processus ponctuels
Le FIM-EDO de cet article est l'extension du cadre à l'inférence d'EDO

Régression Symbolique Neuronale

ODEFormer: Méthode neuronale pré-entraînée convertissant les observations de séries temporelles en équations symboliques

Conclusion et Discussion

Conclusions Principales

FIM-EDO étend avec succès le cadre des Foundation Inference Models au problème d'inférence d'EDO
Sur l'ensemble de données synthétiques, FIM-EDO surpasse significativement la méthode de pointe existante ODEFormer
La flexibilité de l'opérateur neuronal permet à FIM-EDO de fournir des prédictions de champs de vecteurs globaux plus raisonnables
La capacité de traitement multi-trajectoires est un avantage important de FIM-EDO par rapport à ODEFormer

Limitations

Restrictions de distribution de données: Actuellement validé uniquement sur des champs de vecteurs polynomiaux, les systèmes réels peuvent être plus complexes
Restrictions de dimensionnalité: Les expériences actuelles sont limitées aux systèmes 3D
Portée d'évaluation: Nécessite une validation sur une gamme plus large de systèmes EDO
Efficacité computationnelle: L'article ne discute pas en détail de la complexité computationnelle et de la vitesse d'inférence

Directions Futures

Évaluation sur EDOBench: Comparaison des méthodes sur un ensemble de données de référence contenant 63 EDO sélectionnés manuellement
Découverte de dynamiques latentes: Exploration de l'utilisation du FIM-EDO pré-entraîné pour découvrir les dynamiques latentes
Extensions d'applications:
- Dynamiques de populations neurales
- Cinétique des réactions chimiques
- Évolution du contenu en langage naturel

Évaluation Approfondie

Points Forts

Innovativité de la méthode: Première application du cadre FIM à l'inférence d'EDO, conception architecturale raisonnée
Avantages techniques:
- Capacité de traitement multi-trajectoires
- Architecture d'opérateur neuronal flexible
- Capacité d'apprentissage en contexte
Suffisance expérimentale:
- Comparaison directe avec des références fortes
- Analyse multi-angles (reconstruction vs généralisation, local vs global)
- L'analyse de visualisation améliore la compréhension
Pouvoir de conviction des résultats: Surpasse significativement les méthodes de comparaison sur tous les indicateurs

Insuffisances

Portée expérimentale limitée:
- Validation uniquement sur des données polynomiales synthétiques
- Absence de validation sur des données du monde réel
- Dimensionnalité et complexité limitées
Comparaison insuffisante:
- Comparaison uniquement avec ODEFormer, absence de comparaison avec d'autres méthodes traditionnelles
- Pas de comparaison d'efficacité computationnelle
Absence d'analyse théorique:
- Manque de garanties théoriques de convergence ou de capacité de généralisation
- Pas d'analyse des avantages théoriques de la méthode
Détails techniques insuffisants:
- Description sommaire des détails d'entraînement
- Manque d'explication sur le choix des hyperparamètres

Impact

Contribution académique:
- Extension de la portée d'application du cadre FIM
- Nouvelle méthode de réseau de neurones pour l'inférence d'EDO
Valeur pratique:
- La capacité d'inférence sans apprentissage supplémentaire a un potentiel d'application pratique
- Le traitement multi-trajectoires est plus pratique dans les scénarios réels
Reproductibilité:
- Basé sur l'architecture FIM-SDE existante, la trajectoire technique est claire
- Mais manque de détails d'implémentation détaillés

Scénarios Applicables

Calcul scientifique: Modélisation de systèmes dynamiques dans les domaines de la physique, biologie, chimie, etc.
Applications d'ingénierie: Systèmes de contrôle, traitement du signal et autres scénarios nécessitant l'identification de systèmes
Scénarios de données éparses: Particulièrement adapté aux cas où les données d'observation sont limitées ou bruitées
Données multi-trajectoires: Avantages évidents lorsque le même système a plusieurs trajectoires d'observation

Références

Cet article référence principalement les travaux clés suivants:

d'Ascoli et al. (2024): Article original d'ODEFormer
Seifner et al. (2025a): Cadre FIM-SDE
Lu et al. (2021): Opérateur neuronal DeepONet
Berghaus et al. (2024): Travaux fondamentaux du cadre FIM

Évaluation Globale: Cet article est techniquement solide et étend avec succès le cadre des Foundation Inference Models au problème d'inférence d'EDO. Bien que la portée expérimentale soit limitée, il démontre des avantages évidents dans le cadre établi. Ce travail fournit une nouvelle méthode précieuse pour le problème d'identification de systèmes en calcul scientifique, avec de bonnes perspectives de développement.