Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
- Identifiant de l'article: 2510.12650
- Titre: Towards Foundation Inference Models that Learn ODEs In-Context
- Auteurs: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
- Classification: cs.LG (Apprentissage Automatique)
- Date de publication/Conférence: AI in Science (AIS), 2025, Copenhague, Danemark
- Lien de l'article: https://arxiv.org/abs/2510.12650
Les équations différentielles ordinaires (EDO) décrivent les systèmes dynamiques dont l'évolution est déterministe dans le temps continu. La modélisation précise des systèmes EDO à partir de données est un problème fondamental en sciences naturelles, mais reste difficile en cas de données éparses ou bruitées. Cet article présente FIM-EDO (Foundation Inference Model for ODEs), un modèle neuronal pré-entraîné conçu pour estimer les EDO à partir d'observations éparses et bruitées sans apprentissage supplémentaire (c'est-à-dire en contexte). Le modèle est entraîné sur des données synthétiques et utilise des opérateurs neuraux flexibles pour une inférence robuste des EDO, fonctionnant même sur des données corrompues. Les validations expérimentales montrent que FIM-EDO fournit des estimations précises, avec des performances comparables aux méthodes de pointe en réseaux de neurones, et permet une comparaison qualitative de la structure des champs de vecteurs estimés.
Le problème fondamental abordé par cette recherche est le problème d'identification de systèmes EDO: estimer à partir d'observations de séries temporelles l'EDO (c'est-à-dire le champ de vecteurs) qui décrit le mieux le système. Ceci a des applications largement répandues en sciences naturelles, allant des lois du mouvement de Newton à la dynamique des populations en biologie, en passant par la convection atmosphérique en météorologie.
- Applicabilité générale: Les EDO sont des outils de modélisation fondamentaux dans plusieurs domaines: physique, biologie, météorologie, etc.
- Capacité prédictive: Un modèle EDO précis peut caractériser les phénomènes latents (tels que les points fixes ou les cycles limites) et prédire les états futurs
- Compréhension scientifique: Les modèles EDO aident à comprendre les mécanismes intrinsèques et les caractéristiques dynamiques des systèmes
- Méthodes traditionnelles: Les méthodes non paramétriques ou basées sur la régression symbolique fonctionnent mal avec des données éparses et bruitées
- Limitations d'ODEFormer: Bien qu'il s'agisse de la dernière méthode de régression symbolique neuronale, elle ne peut traiter qu'une seule trajectoire et peut produire des motifs complexes déraisonnables dans la prédiction du champ de vecteurs global
Les auteurs, basés sur le cadre des Foundation Inference Models (FIMs), qui a montré de bons résultats dans l'inférence de chaînes de Markov en temps continu, d'équations différentielles stochastiques et de processus ponctuels, proposent le modèle FIM-EDO spécialement conçu pour l'inférence d'EDO.
- Proposition du modèle FIM-EDO: Premier modèle pré-entraîné d'inférence d'EDO basé sur le cadre des Foundation Inference Models
- Architecture d'opérateurs neuraux: Utilise l'opérateur neuronal DeepONet pour une estimation flexible du champ de vecteurs
- Capacité de traitement multi-trajectoires: Peut traiter simultanément plusieurs trajectoires du même système, améliorant la précision de l'inférence
- Performance supérieure: Surpasse ODEFormer sur l'ensemble de données synthétiques, avec des scores R² respectifs de 0,90 vs 0,65 (tâche de reconstruction) et 0,26 vs 0,19 (tâche de généralisation)
- Prédictions globales plus raisonnables: Par rapport à ODEFormer, fournit des prédictions de champs de vecteurs plus simples et plus raisonnables dans les régions éloignées des points d'observation
Étant donné un ensemble d'observations de séries temporelles D={yk}k=1K, où chaque séquence yk=[(tk1,yk1),…,(tkL,ykL)], l'objectif est d'estimer le champ de vecteurs f^ capable de décrire le système EDO générant ces observations:
dtdx(t)=f(t,x(t))
- Échantillonnage de chaque composante du champ de vecteurs à partir d'une distribution polynomiale multivariée (degré maximal 3)
- Support de systèmes EDO jusqu'à 3 dimensions
- Simulation du système sur une grille irrégulière et ajout de bruit pour générer les données d'entraînement
FIM-EDO adopte l'architecture d'opérateur neuronal DeepONet, comprenant trois composants principaux:
Réseau de Branche (Branch Network):
- Utilise un encodeur Transformer
- Encode les données d'observation D en K(L−1) représentations de dimension E: D∈RE×K(L−1)
- Conserve des encodages indépendants pour presque toutes les observations
Réseau Principal (Trunk Network):
- Mappage linéaire qui encode la position x∈RD en h(x)∈RE
Réseau de Combinaison (Combination Network):
- Séquence de couches d'attention résiduelle, similaire à un décodeur Transformer
- Utilise D comme clés et valeurs, h(x) comme requête
- Projection linéaire finale pour obtenir l'estimation du champ de vecteurs f^(x)
Utilise un objectif d'apprentissage supervisé:
L(x,D,f)=∥f^(x)−f(x)∥2
Correspondance entre les champs de vecteurs prédits et réels sur les points d'échantillonnage x proches des valeurs observées.
- Capacité d'apprentissage en contexte: Traite les nouveaux systèmes EDO sans entraînement ou ajustement supplémentaire
- Fusion multi-trajectoires: Traite simultanément plusieurs trajectoires, extrayant et combinant efficacement toutes les informations disponibles
- Approximation de fonction flexible: Les opérateurs neuraux sont plus flexibles que la régression symbolique pour traiter les données éparses et bruitées
- Équilibre local-global: Fournit des prédictions complexes près des points d'observation et des prédictions simples et raisonnables dans les régions éloignées
- Données d'entraînement: 600 000 équations EDO synthétiques, modèles d'environ 20 millions de paramètres
- Données de test: 4 000 champs de vecteurs polynomiaux EDO (degré maximal 3, jusqu'à 3 dimensions)
- Configuration des trajectoires: 9 trajectoires générées par EDO, états initiaux échantillonnés à partir de N(0,1)
- Configuration des observations: 200 points d'observation par trajectoire, grille régulière, intervalle de temps Δτ=0,05
Utilise le score R²: Pourcentage de scores R² supérieurs à 0,9
ODEFormer: Méthode de régression symbolique neuronale pré-entraînée, entraînée sur 50 millions d'équations, avec 86 millions de paramètres
- Tâche de reconstruction: Mesure la performance de reconstruction sur les trajectoires contextuelles
- Tâche de généralisation: Mesure la performance de reconstruction sur les trajectoires retenues
| Modèle | Tâche de Reconstruction | Tâche de Généralisation |
|---|
| ODEFormer | 0,65 | 0,19 |
| FIM-EDO | 0,90 | 0,26 |
Découvertes Clés:
- FIM-EDO surpasse significativement ODEFormer dans les deux tâches
- La tâche de généralisation est plus difficile que la tâche de reconstruction, ce qui est conforme à l'intuition
- Malgré l'entraînement d'ODEFormer sur une distribution plus large et plus de paramètres, FIM-EDO affiche de meilleures performances
La Figure 1 montre l'estimation du champ de vecteurs de FIM-EDO avec différents nombres de trajectoires contextuelles:
- Trajectoire unique: Estimation inexacte dans les positions éloignées des observations
- Multi-trajectoires: Avec l'augmentation du nombre de trajectoires, FIM-EDO corrige ces estimations, couvrant efficacement un espace plus grand
La Figure 2 compare les estimations du champ de vecteurs de FIM-EDO et ODEFormer:
- FIM-EDO:
- Local: Prédit des motifs complexes aux points d'observation pour reconstruire les trajectoires
- Global: Prédit des champs de vecteurs plus simples loin des points d'observation
- ODEFormer: Prédit des champs de vecteurs plus complexes, entraînant des prédictions de motifs globaux complexes et manquant de support d'une seule trajectoire simple
Les différences entre les deux modèles proviennent de paramétrages différents du champ de vecteurs:
- ODEFormer: Limité aux équations symboliques polynomiales (rationnelles), qui peuvent ne pas se réduire par défaut à des expressions simples avec des observations éparses ou bruitées
- FIM-EDO: L'opérateur neuronal traite ces cas de manière plus flexible
- Méthodes non paramétriques: Telles que les processus gaussiens, etc.
- Méthodes de régression symbolique: Régression symbolique traditionnelle basée sur des algorithmes génétiques ou d'autres méthodes d'optimisation
- FIM-CTMC: Inférence de chaînes de Markov en temps continu
- FIM-SDE: Inférence d'équations différentielles stochastiques
- FIM-PP: Inférence de processus ponctuels
- Le FIM-EDO de cet article est l'extension du cadre à l'inférence d'EDO
ODEFormer: Méthode neuronale pré-entraînée convertissant les observations de séries temporelles en équations symboliques
- FIM-EDO étend avec succès le cadre des Foundation Inference Models au problème d'inférence d'EDO
- Sur l'ensemble de données synthétiques, FIM-EDO surpasse significativement la méthode de pointe existante ODEFormer
- La flexibilité de l'opérateur neuronal permet à FIM-EDO de fournir des prédictions de champs de vecteurs globaux plus raisonnables
- La capacité de traitement multi-trajectoires est un avantage important de FIM-EDO par rapport à ODEFormer
- Restrictions de distribution de données: Actuellement validé uniquement sur des champs de vecteurs polynomiaux, les systèmes réels peuvent être plus complexes
- Restrictions de dimensionnalité: Les expériences actuelles sont limitées aux systèmes 3D
- Portée d'évaluation: Nécessite une validation sur une gamme plus large de systèmes EDO
- Efficacité computationnelle: L'article ne discute pas en détail de la complexité computationnelle et de la vitesse d'inférence
- Évaluation sur EDOBench: Comparaison des méthodes sur un ensemble de données de référence contenant 63 EDO sélectionnés manuellement
- Découverte de dynamiques latentes: Exploration de l'utilisation du FIM-EDO pré-entraîné pour découvrir les dynamiques latentes
- Extensions d'applications:
- Dynamiques de populations neurales
- Cinétique des réactions chimiques
- Évolution du contenu en langage naturel
- Innovativité de la méthode: Première application du cadre FIM à l'inférence d'EDO, conception architecturale raisonnée
- Avantages techniques:
- Capacité de traitement multi-trajectoires
- Architecture d'opérateur neuronal flexible
- Capacité d'apprentissage en contexte
- Suffisance expérimentale:
- Comparaison directe avec des références fortes
- Analyse multi-angles (reconstruction vs généralisation, local vs global)
- L'analyse de visualisation améliore la compréhension
- Pouvoir de conviction des résultats: Surpasse significativement les méthodes de comparaison sur tous les indicateurs
- Portée expérimentale limitée:
- Validation uniquement sur des données polynomiales synthétiques
- Absence de validation sur des données du monde réel
- Dimensionnalité et complexité limitées
- Comparaison insuffisante:
- Comparaison uniquement avec ODEFormer, absence de comparaison avec d'autres méthodes traditionnelles
- Pas de comparaison d'efficacité computationnelle
- Absence d'analyse théorique:
- Manque de garanties théoriques de convergence ou de capacité de généralisation
- Pas d'analyse des avantages théoriques de la méthode
- Détails techniques insuffisants:
- Description sommaire des détails d'entraînement
- Manque d'explication sur le choix des hyperparamètres
- Contribution académique:
- Extension de la portée d'application du cadre FIM
- Nouvelle méthode de réseau de neurones pour l'inférence d'EDO
- Valeur pratique:
- La capacité d'inférence sans apprentissage supplémentaire a un potentiel d'application pratique
- Le traitement multi-trajectoires est plus pratique dans les scénarios réels
- Reproductibilité:
- Basé sur l'architecture FIM-SDE existante, la trajectoire technique est claire
- Mais manque de détails d'implémentation détaillés
- Calcul scientifique: Modélisation de systèmes dynamiques dans les domaines de la physique, biologie, chimie, etc.
- Applications d'ingénierie: Systèmes de contrôle, traitement du signal et autres scénarios nécessitant l'identification de systèmes
- Scénarios de données éparses: Particulièrement adapté aux cas où les données d'observation sont limitées ou bruitées
- Données multi-trajectoires: Avantages évidents lorsque le même système a plusieurs trajectoires d'observation
Cet article référence principalement les travaux clés suivants:
- d'Ascoli et al. (2024): Article original d'ODEFormer
- Seifner et al. (2025a): Cadre FIM-SDE
- Lu et al. (2021): Opérateur neuronal DeepONet
- Berghaus et al. (2024): Travaux fondamentaux du cadre FIM
Évaluation Globale: Cet article est techniquement solide et étend avec succès le cadre des Foundation Inference Models au problème d'inférence d'EDO. Bien que la portée expérimentale soit limitée, il démontre des avantages évidents dans le cadre établi. Ce travail fournit une nouvelle méthode précieuse pour le problème d'identification de systèmes en calcul scientifique, avec de bonnes perspectives de développement.