Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
- Paper-ID: 2510.12650
- Titel: Towards Foundation Inference Models that Learn ODEs In-Context
- Autoren: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
- Klassifizierung: cs.LG (Maschinelles Lernen)
- Veröffentlichungszeit/Konferenz: AI in Science (AIS), 2025, Kopenhagen, Dänemark
- Paper-Link: https://arxiv.org/abs/2510.12650
Gewöhnliche Differentialgleichungen (ODEs) beschreiben dynamische Systeme mit deterministischer Entwicklung in kontinuierlicher Zeit. Die datengesteuerte Modellierung von ODE-Systemen aus Beobachtungen ist ein Kernproblem der Naturwissenschaften, bleibt aber bei spärlichen oder verrauschten Daten eine Herausforderung. Dieser Artikel stellt FIM-ODE (Foundation Inference Model for ODEs) vor, ein vortrainiertes neuronales Modell, das darauf abzielt, ODEs aus spärlichen und verrauschten Beobachtungen nullschussweise (d. h. im Kontext) zu schätzen. Das Modell wird auf synthetischen Daten trainiert und nutzt flexible neuronale Operatoren für robuste ODE-Inferenz, die auch bei beschädigten Daten funktioniert. Experimentelle Validierungen zeigen, dass FIM-ODE genaue Schätzungen liefert, mit einer Leistung, die mit modernen neuronalen Netzwerkmethoden vergleichbar ist, und bietet qualitative Vergleiche ihrer Schätzungen von Vektorfeldern.
Das Kernproblem dieser Forschung ist das ODE-Systemidentifikationsproblem: Schätzung der ODE (d. h. des Vektorfeldes), die das System am besten aus Zeitreihenbeobachtungen beschreibt. Dies hat breite Anwendungen in den Naturwissenschaften, von Newtons Bewegungsgesetzen über Populationsdynamik in biologischen Systemen bis zur atmosphärischen Konvektion in der Meteorologie.
- Breite Anwendbarkeit: ODEs sind grundlegende Modellierungswerkzeuge in Physik, Biologie, Meteorologie und vielen anderen Bereichen
- Vorhersagefähigkeit: Genaue ODE-Modelle können zugrunde liegende Phänomene (wie Fixpunkte oder Grenzzyklen) charakterisieren und zukünftige Zustände vorhersagen
- Wissenschaftliches Verständnis: ODE-Modelle helfen, die inneren Mechanismen und dynamischen Eigenschaften von Systemen zu verstehen
- Traditionelle Methoden: Nichtparametrische Methoden oder auf symbolischer Regression basierende Methoden schneiden bei spärlichen, verrauschten Daten schlecht ab
- ODEFormer-Einschränkungen: Obwohl es die neueste Methode der neuronalen symbolischen Regression ist, kann es nur einzelne Trajektorien verarbeiten und kann bei der globalen Vektorfeldvorhersage zu unrealistischen komplexen Mustern führen
Die Autoren basieren auf dem Framework der Foundation Inference Models (FIMs), das bereits gute Ergebnisse bei der Inferenz von kontinuierlichen Markov-Ketten, stochastischen Differentialgleichungen und Punktprozessen gezeigt hat, und schlagen das spezialisierte FIM-ODE-Modell für die ODE-Inferenz vor.
- Vorstellung des FIM-ODE-Modells: Erstes vortrainiertes ODE-Inferenzmodell basierend auf dem Foundation Inference Models Framework
- Neuronale Operatorarchitektur: Einsatz des DeepONet-Neuronaloperators für flexible Vektorfeldschätzung
- Mehrtrajectory-Verarbeitungsfähigkeit: Kann mehrere Trajektorien desselben Systems gleichzeitig verarbeiten und verbessert die Inferenzgenauigkeit
- Überlegene Leistung: Übertrifft ODEFormer auf synthetischen Datensätzen mit R²-Genauigkeit von 0,90 vs. 0,65 (Rekonstruktionsaufgabe) und 0,26 vs. 0,19 (Verallgemeinerungsaufgabe)
- Rationalere globale Vorhersage: Bietet im Vergleich zu ODEFormer einfachere und rationalere Vektorfeldvorhersagen in Bereichen weit entfernt von Beobachtungspunkten
Gegeben eine Menge von Zeitreihenbeobachtungen D={yk}k=1K, wobei jede Sequenz yk=[(tk1,yk1),…,(tkL,ykL)], besteht das Ziel darin, das Vektorfeld f^ zu schätzen, das das ODE-System beschreiben kann, das diese Beobachtungen erzeugt:
dtdx(t)=f(t,x(t))
- Stichprobenentnahme jeder Komponente des Vektorfeldes aus multivariaten Polynomverteilungen (maximal 3. Grad)
- Unterstützung für ODE-Systeme bis zu 3 Dimensionen
- Simulation des Systems auf unregelmäßigen Gittern und Hinzufügen von Rauschen zur Generierung von Trainingsdaten
FIM-ODE nutzt die DeepONet-Neuronaloperatorarchitektur mit drei Hauptkomponenten:
Branch Network (Verzweigungsnetzwerk):
- Verwendet Transformer-Encoder
- Kodiert Beobachtungsdaten D in K(L−1) E-dimensionale Darstellungen D∈RE×K(L−1)
- Behält unabhängige Kodierungen für fast alle Beobachtungen bei
Trunk Network (Stammnetzwerk):
- Lineare Abbildung, die Position x∈RD in h(x)∈RE kodiert
Combination Network (Kombinationsnetzwerk):
- Sequenz von Residual-Attention-Schichten, ähnlich einem Transformer-Decoder
- Verwendet D als Schlüssel und Wert, h(x) als Abfrage
- Endgültige lineare Projektion zur Vektorfeldschätzung f^(x)
Nutzt ein überwachtes Lernziel:
L(x,D,f)=∥f^(x)−f(x)∥2
Passt vorhergesagte und echte Vektorfelder an Stichprobenpunkten x in der Nähe von Beobachtungswerten an.
- Kontextlernfähigkeit: Kann neue ODE-Systeme ohne weiteres Training oder Feinabstimmung verarbeiten
- Mehrtrajectory-Fusion: Kann mehrere Trajektorien gleichzeitig verarbeiten und alle verfügbaren Informationen effektiv extrahieren und kombinieren
- Flexible Funktionsapproximation: Neuronale Operatoren sind bei der Verarbeitung spärlicher, verrauschter Daten flexibler als symbolische Regression
- Lokal-globales Gleichgewicht: Bietet komplexe Vorhersagen in der Nähe von Beobachtungspunkten und einfache, rationale Vorhersagen in Bereichen weit entfernt von Beobachtungen
- Trainingsdaten: 600.000 synthetische ODE-Gleichungen, Modell mit etwa 20 Millionen Parametern
- Testdaten: 4.000 polynomiale Vektorfeldgleichungen (maximal 3. Grad, maximal 3 Dimensionen)
- Trajektorieneinstellung: Jede ODE erzeugt 9 Trajektorien, Anfangszustände aus N(0,1) entnommen
- Beobachtungseinstellung: 200 Beobachtungspunkte pro Trajektorie, reguläres Gitter, Zeitintervall Δτ=0,05
Verwendung der R²-Genauigkeit: Prozentsatz der Scores mit R² größer als 0,9
ODEFormer: Vortrainierte neuronale symbolische Regressionsmethode, auf 50 Millionen Gleichungen trainiert, mit 86 Millionen Parametern
- Rekonstruktionsaufgabe: Messung der Rekonstruktionsleistung auf Kontexttrajektorien
- Verallgemeinerungsaufgabe: Messung der Rekonstruktionsleistung auf zurückgehaltenen Trajektorien
| Modell | Rekonstruktionsaufgabe | Verallgemeinerungsaufgabe |
|---|
| ODEFormer | 0,65 | 0,19 |
| FIM-ODE | 0,90 | 0,26 |
Schlüsselfunde:
- FIM-ODE übertrifft ODEFormer bei beiden Aufgaben erheblich
- Die Verallgemeinerungsaufgabe ist schwieriger als die Rekonstruktionsaufgabe, was intuitiv ist
- Trotz des Trainings von ODEFormer auf einer breiteren Verteilung und mit mehr Parametern zeigt FIM-ODE eine bessere Leistung
Abbildung 1 zeigt die Vektorfeldschätzung von FIM-ODE mit unterschiedlichen Anzahlen von Kontexttrajektorien:
- Einzelne Trajektorie: Ungenaue Schätzung an Positionen weit entfernt von Beobachtungen
- Mehrere Trajektorien: Mit zunehmender Trajektorienzahl kann FIM-ODE diese Schätzungen korrigieren und einen größeren Raum effektiv abdecken
Abbildung 2 vergleicht die Vektorfeldschätzungen von FIM-ODE und ODEFormer:
- FIM-ODE:
- Lokal: Vorhersage komplexer Muster an Beobachtungspunkten zur Trajektorienrekonstruktion
- Global: Einfachere Vorhersagen weit entfernt von Beobachtungspunkten
- ODEFormer: Vorhersage komplexerer Vektorfelder, was zu komplexen globalen Mustern führt, die von einer einzelnen einfachen Trajektorie nicht unterstützt werden
Die Unterschiede zwischen den beiden Modellen stammen aus unterschiedlichen Vektorfeldparametrisierungen:
- ODEFormer: Beschränkt auf (rationale) polynomiale symbolische Gleichungen, die bei spärlichen oder verrauschten Beobachtungen möglicherweise nicht standardmäßig zu einfachen Ausdrücken führen
- FIM-ODE: Neuronale Operatoren können diese Situationen flexibler handhaben
- Nichtparametrische Methoden: Wie Gaußsche Prozesse usw.
- Symbolische Regressionsmethoden: Traditionelle symbolische Regression basierend auf genetischen Algorithmen oder anderen Optimierungsmethoden
- FIM-CTMC: Inferenz kontinuierlicher Markov-Ketten
- FIM-SDE: Inferenz stochastischer Differentialgleichungen
- FIM-PP: Inferenz von Punktprozessen
- Das FIM-ODE dieses Papiers ist eine Erweiterung des Frameworks auf die ODE-Inferenz
ODEFormer: Vortrainierte neuronale Methode zur Umwandlung von Zeitreihenbeobachtungen in symbolische Gleichungen
- FIM-ODE erweitert erfolgreich das Foundation Inference Models Framework auf das ODE-Inferenzproblem
- Auf synthetischen Datensätzen übertrifft FIM-ODE erheblich die bestehende modernste Methode ODEFormer
- Die Flexibilität von Neuronaloperatoren ermöglicht es FIM-ODE, rationalere globale Vektorfeldvorhersagen zu treffen
- Die Mehrtrajectory-Verarbeitungsfähigkeit ist ein wichtiger Vorteil von FIM-ODE gegenüber ODEFormer
- Datenverteilungsbeschränkungen: Derzeit nur auf polynomialen Vektorfeldern validiert, echte Systeme können komplexer sein
- Dimensionsbeschränkungen: Aktuelle Experimente beschränken sich auf 3-dimensionale Systeme
- Bewertungsumfang: Validierung auf einem breiteren Spektrum von ODE-Systemen erforderlich
- Rechnerische Effizienz: Das Papier diskutiert Rechenkomplexität und Inferenzgeschwindigkeit nicht ausführlich
- ODEBench-Bewertung: Vergleich von Methoden auf einem Benchmark-Datensatz mit 63 handverlesenen ODEs
- Entdeckung latenter Dynamik: Erforschung der Verwendung des vortrainierten FIM-ODE zur Entdeckung latenter Dynamik
- Anwendungserweiterungen:
- Neuronale Populationsdynamik
- Chemische Reaktionsdynamik
- Entwicklung natürlichsprachlicher Inhalte
- Methodische Innovation: Erste Anwendung des FIM-Frameworks auf die ODE-Inferenz, rationales Architekturdesign
- Technische Vorteile:
- Mehrtrajectory-Verarbeitungsfähigkeit
- Flexible Neuronaloperatorarchitektur
- Kontextlernfähigkeit
- Experimentelle Vollständigkeit:
- Direkter Vergleich mit starken Baselines
- Mehrwinklige Analyse (Rekonstruktion vs. Verallgemeinerung, lokal vs. global)
- Visualisierungsanalyse verbessert das Verständnis
- Überzeugungskraft der Ergebnisse: Signifikant bessere Leistung als Vergleichsmethoden bei allen Metriken
- Begrenzte experimentelle Reichweite:
- Validierung nur auf synthetischen Polynomialdaten
- Fehlende Validierung auf realen Daten
- Begrenzte Dimensionalität und Komplexität
- Unzureichender Vergleich:
- Nur Vergleich mit ODEFormer, fehlende Vergleiche mit anderen traditionellen Methoden
- Keine Vergleiche der Rechnerischen Effizienz
- Fehlende theoretische Analyse:
- Fehlende theoretische Garantien für Konvergenz oder Verallgemeinerungsfähigkeit
- Keine Analyse der theoretischen Vorteile der Methode
- Unzureichende technische Details:
- Kurze Beschreibung von Trainingsdetails
- Fehlende Erklärung der Hyperparameterwahl
- Akademische Beiträge:
- Erweiterung des FIM-Frameworks auf neue Anwendungsbereiche
- Neue neuronale Netzwerkmethode für die ODE-Inferenz
- Praktischer Wert:
- Nullschuss-Inferenzfähigkeit hat praktisches Anwendungspotenzial
- Mehrtrajectory-Verarbeitung ist in realen Szenarien praktischer
- Reproduzierbarkeit:
- Basierend auf bestehender FIM-SDE-Architektur, klare technische Route
- Aber fehlende detaillierte Implementierungsdetails
- Wissenschaftliche Berechnung: Modellierung dynamischer Systeme in Physik, Biologie, Chemie und anderen Bereichen
- Ingenieuranwendungen: Kontrollsysteme, Signalverarbeitung und andere Szenarien, die Systemidentifikation erfordern
- Spärliche Datenszenarios: Besonders geeignet für Situationen mit begrenzten oder verrauschten Beobachtungsdaten
- Mehrtrajectory-Daten: Deutliche Vorteile, wenn mehrere Beobachtungstrajektorien desselben Systems vorhanden sind
Dieses Papier bezieht sich hauptsächlich auf die folgenden Schlüsselarbeiten:
- d'Ascoli et al. (2024): Originalarbeit zu ODEFormer
- Seifner et al. (2025a): FIM-SDE Framework
- Lu et al. (2021): DeepONet Neuronaloperator
- Berghaus et al. (2024): Grundlagenarbeit des FIM-Frameworks
Gesamtbewertung: Dies ist ein technisch solides Papier, das das Foundation Inference Models Framework erfolgreich auf das ODE-Inferenzproblem erweitert. Obwohl die experimentelle Reichweite begrenzt ist, zeigt es unter den gegebenen Bedingungen deutliche Vorteile. Diese Arbeit bietet eine wertvolle neue Methode für das Systemidentifikationsproblem in der wissenschaftlichen Berechnung und hat gute Entwicklungsperspektiven.