Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
- ID Articolo: 2510.12650
- Titolo: Towards Foundation Inference Models that Learn ODEs In-Context
- Autori: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
- Classificazione: cs.LG (Machine Learning)
- Data di Pubblicazione/Conferenza: AI in Science (AIS), 2025, Copenaghen, Danimarca
- Link Articolo: https://arxiv.org/abs/2510.12650
Le equazioni differenziali ordinarie (ODE) descrivono sistemi dinamici con evoluzione deterministica nel tempo continuo. La modellazione accurata di sistemi ODE da una prospettiva guidata dai dati rappresenta un problema centrale nelle scienze naturali, ma rimane impegnativa in condizioni di dati sparsi o rumorosi. Questo articolo introduce FIM-ODE (Foundation Inference Model for ODEs), un modello neurale pre-addestrato progettato per stimare le ODE da osservazioni sparse e rumorose in modo zero-shot (cioè nel contesto). Il modello è addestrato su dati sintetici, sfruttando operatori neurali flessibili per un'inferenza robusta delle ODE, funzionando anche su dati corrotti. La validazione sperimentale dimostra che FIM-ODE fornisce stime accurate, con prestazioni comparabili ai metodi all'avanguardia delle reti neurali, e confronta qualitativamente come questi stimano la struttura del campo vettoriale.
Il problema centrale affrontato da questa ricerca è il problema di identificazione del sistema ODE: stimare l'ODE (cioè il campo vettoriale) che meglio descrive il sistema basandosi unicamente su osservazioni di serie temporali. Questo ha applicazioni diffuse nelle scienze naturali, dalle leggi del moto di Newton alla dinamica delle popolazioni nei sistemi biologici, fino alla convezione atmosferica in meteorologia.
- Ampia Applicabilità: Le ODE sono strumenti di modellazione fondamentali in fisica, biologia, meteorologia e altri campi
- Capacità Predittiva: I modelli ODE accurati possono caratterizzare fenomeni latenti (come punti fissi o cicli limite) e prevedere stati futuri
- Comprensione Scientifica: I modelli ODE facilitano la comprensione dei meccanismi intrinseci del sistema e delle caratteristiche dinamiche
- Metodi Tradizionali: I metodi non parametrici o basati su regressione simbolica mostrano prestazioni scadenti nel trattare dati sparsi e rumorosi
- Limitazioni di ODEFormer: Sebbene sia il metodo più recente di regressione neurale-simbolica, può elaborare solo singole traiettorie e potrebbe produrre pattern complessi irragionevoli nella previsione del campo vettoriale globale
Gli autori, basandosi sul framework dei Foundation Inference Models (FIMs), che ha dimostrato buoni risultati nell'inferenza di catene di Markov a tempo continuo, equazioni differenziali stocastiche e processi puntuali, propongono il modello FIM-ODE specificamente per l'inferenza delle ODE.
- Proposta del Modello FIM-ODE: Primo modello pre-addestrato per l'inferenza delle ODE basato sul framework dei Foundation Inference Models
- Architettura dell'Operatore Neurale: Implementazione di DeepONet per la stima flessibile del campo vettoriale
- Capacità di Elaborazione Multi-Traiettoria: Capacità di elaborare simultaneamente più traiettorie dello stesso sistema, migliorando la precisione dell'inferenza
- Prestazioni Superiori: Superamento di ODEFormer su dataset sintetici, con accuratezza R² rispettivamente di 0.90 vs 0.65 (compito di ricostruzione) e 0.26 vs 0.19 (compito di generalizzazione)
- Previsione Globale Più Ragionevole: Rispetto a ODEFormer, fornisce previsioni del campo vettoriale più semplici e ragionevoli in regioni lontane dai punti osservati
Dato un insieme di osservazioni di serie temporali D={yk}k=1K, dove ogni sequenza yk=[(tk1,yk1),…,(tkL,ykL)], l'obiettivo è stimare il campo vettoriale f^ che possa descrivere il sistema ODE che genera queste osservazioni:
dtdx(t)=f(t,x(t))
- Campionamento di ogni componente del campo vettoriale da una distribuzione polinomiale multivariata (massimo grado 3)
- Supporto per sistemi ODE fino a 3 dimensioni
- Simulazione del sistema su griglie irregolari e aggiunta di rumore per generare dati di addestramento
FIM-ODE adotta l'architettura dell'operatore neurale DeepONet, contenente tre componenti principali:
Branch Network (Rete di Ramo):
- Utilizza un codificatore Transformer
- Codifica i dati osservati D in K(L−1) rappresentazioni E-dimensionali D∈RE×K(L−1)
- Mantiene codifiche indipendenti per quasi tutte le osservazioni
Trunk Network (Rete di Tronco):
- Mappatura lineare che codifica la posizione x∈RD in h(x)∈RE
Combination Network (Rete di Combinazione):
- Sequenza di strati di attenzione residua, simile a un decodificatore Transformer
- Utilizza D come chiavi e valori, h(x) come query
- Proiezione lineare finale per ottenere la stima del campo vettoriale f^(x)
Adotta un obiettivo di apprendimento supervisionato:
L(x,D,f)=∥f^(x)−f(x)∥2
Abbina il campo vettoriale predetto e reale su punti di campionamento x vicini ai valori osservati.
- Capacità di Apprendimento Nel Contesto: Elaborazione di nuovi sistemi ODE senza ulteriore addestramento o fine-tuning
- Fusione Multi-Traiettoria: Capacità di elaborare simultaneamente più traiettorie, estraendo e combinando efficacemente tutte le informazioni disponibili
- Approssimazione Flessibile di Funzioni: L'operatore neurale è più flessibile della regressione simbolica nel trattare dati sparsi e rumorosi
- Equilibrio Locale-Globale: Fornisce previsioni complesse vicino ai punti osservati e previsioni semplici e ragionevoli lontano dalle osservazioni
- Dati di Addestramento: 600.000 equazioni ODE sintetiche, modello con circa 20 milioni di parametri
- Dati di Test: 4.000 campi vettoriali polinomiali ODE (massimo grado 3, massimo 3 dimensioni)
- Configurazione Traiettorie: 9 traiettorie generate per ogni ODE, stati iniziali campionati da N(0,1)
- Configurazione Osservazioni: 200 punti osservati per traiettoria, griglia regolare, intervallo temporale Δτ=0.05
Utilizzo dell'Accuratezza R²: Percentuale di punteggi R² superiori a 0.9
ODEFormer: Metodo di regressione neurale-simbolica pre-addestrato, addestrato su 50 milioni di equazioni, con 86 milioni di parametri
- Compito di Ricostruzione: Misurazione delle prestazioni di ricostruzione su traiettorie di contesto
- Compito di Generalizzazione: Misurazione delle prestazioni di ricostruzione su traiettorie riservate
| Modello | Compito di Ricostruzione | Compito di Generalizzazione |
|---|
| ODEFormer | 0.65 | 0.19 |
| FIM-ODE | 0.90 | 0.26 |
Scoperte Chiave:
- FIM-ODE supera significativamente ODEFormer in entrambi i compiti
- Il compito di generalizzazione è più impegnativo del compito di ricostruzione, il che è intuitivo
- Nonostante ODEFormer sia addestrato su una distribuzione più ampia e abbia più parametri, FIM-ODE mostra prestazioni superiori
La Figura 1 mostra la stima del campo vettoriale di FIM-ODE con diversi numeri di traiettorie di contesto:
- Singola Traiettoria: Stima imprecisa in posizioni lontane dalle osservazioni
- Multi-Traiettoria: Con l'aumento del numero di traiettorie, FIM-ODE corregge queste stime, coprendo efficacemente uno spazio più ampio
La Figura 2 confronta le stime del campo vettoriale di FIM-ODE e ODEFormer:
- FIM-ODE:
- Locale: Predice pattern complessi nei punti osservati per ricostruire le traiettorie
- Globale: Predice pattern più semplici lontano dai punti osservati
- ODEFormer: Predice campi vettoriali più complessi, risultando in previsioni di pattern globali complesse e prive di supporto da singole traiettorie semplici
Le differenze tra i due modelli derivano da diverse parametrizzazioni del campo vettoriale:
- ODEFormer: Limitato a equazioni simboliche polinomiali (razionali), che potrebbero non impostare per impostazione predefinita espressioni semplici con osservazioni sparse o rumorose
- FIM-ODE: L'operatore neurale gestisce questi casi in modo più flessibile
- Metodi Non Parametrici: Come i processi gaussiani, ecc.
- Metodi di Regressione Simbolica: Regressione simbolica tradizionale basata su algoritmi genetici o altri metodi di ottimizzazione
- FIM-CTMC: Inferenza di catene di Markov a tempo continuo
- FIM-SDE: Inferenza di equazioni differenziali stocastiche
- FIM-PP: Inferenza di processi puntuali
- FIM-ODE di questo articolo è l'estensione del framework all'inferenza delle ODE
ODEFormer: Metodo neurale pre-addestrato che converte osservazioni di serie temporali in equazioni simboliche
- FIM-ODE estende con successo il framework dei Foundation Inference Models al problema dell'inferenza delle ODE
- Su dataset sintetici, FIM-ODE supera significativamente il metodo all'avanguardia esistente ODEFormer
- La flessibilità dell'operatore neurale consente a FIM-ODE di fornire previsioni del campo vettoriale globale più ragionevoli
- La capacità di elaborazione multi-traiettoria è un vantaggio importante di FIM-ODE rispetto a ODEFormer
- Limitazioni della Distribuzione dei Dati: Attualmente validato solo su campi vettoriali polinomiali, i sistemi reali potrebbero essere più complessi
- Limitazioni Dimensionali: Gli esperimenti attuali sono limitati a sistemi 3-dimensionali
- Portata della Valutazione: Necessità di validazione su una gamma più ampia di sistemi ODE
- Efficienza Computazionale: L'articolo non discute in dettaglio la complessità computazionale e la velocità di inferenza
- Valutazione su ODEBench: Confronto dei metodi su un dataset di benchmark contenente 63 ODE selezionati manualmente
- Scoperta di Dinamiche Latenti: Esplorazione dell'uso di FIM-ODE pre-addestrato per scoprire dinamiche latenti
- Estensione Applicativa:
- Dinamica neurale di popolazione
- Cinetica di reazioni chimiche
- Evoluzione di contenuti nel linguaggio naturale
- Innovazione Metodologica: Prima applicazione del framework FIM all'inferenza delle ODE, con design architetturale ragionevole
- Vantaggi Tecnici:
- Capacità di elaborazione multi-traiettoria
- Architettura dell'operatore neurale flessibile
- Capacità di apprendimento nel contesto
- Completezza Sperimentale:
- Confronto diretto con baseline forte
- Analisi da molteplici angolazioni (ricostruzione vs generalizzazione, locale vs globale)
- L'analisi di visualizzazione migliora la comprensione
- Convincenza dei Risultati: Superamento significativo del metodo di confronto in tutte le metriche
- Portata Sperimentale Limitata:
- Validazione solo su dati polinomiali sintetici
- Mancanza di validazione su dati del mondo reale
- Dimensione e complessità limitate
- Confronto Insufficiente:
- Confronto solo con ODEFormer, mancanza di confronto con altri metodi tradizionali
- Nessun confronto dell'efficienza computazionale
- Mancanza di Analisi Teorica:
- Mancanza di garanzie teoriche sulla convergenza o sulla capacità di generalizzazione
- Nessuna analisi dei vantaggi teorici del metodo
- Dettagli Tecnici Insufficienti:
- Descrizione sommaria dei dettagli di addestramento
- Mancanza di spiegazione della scelta degli iperparametri
- Contributo Accademico:
- Estensione dell'applicabilità del framework FIM
- Fornisce un nuovo metodo di rete neurale per l'inferenza delle ODE
- Valore Pratico:
- La capacità di inferenza zero-shot ha potenziale di applicazione pratica
- L'elaborazione multi-traiettoria è più pratica in scenari reali
- Riproducibilità:
- Basato su architettura FIM-SDE esistente, il percorso tecnico è chiaro
- Ma mancano dettagli di implementazione dettagliati
- Calcolo Scientifico: Modellazione di sistemi dinamici in fisica, biologia, chimica e altri campi
- Applicazioni Ingegneristiche: Sistemi di controllo, elaborazione dei segnali e altri scenari che richiedono identificazione del sistema
- Scenari di Dati Sparsi: Particolarmente adatto quando i dati osservati sono limitati o rumorosi
- Dati Multi-Traiettoria: Vantaggi evidenti quando il sistema ha più traiettorie osservate
Questo articolo fa principalmente riferimento ai seguenti lavori chiave:
- d'Ascoli et al. (2024): Articolo originale di ODEFormer
- Seifner et al. (2025a): Framework FIM-SDE
- Lu et al. (2021): Operatore neurale DeepONet
- Berghaus et al. (2024): Lavoro fondamentale del framework FIM
Valutazione Complessiva: Questo è un articolo tecnicamente solido che estende con successo il framework dei Foundation Inference Models al problema dell'inferenza delle ODE. Sebbene la portata sperimentale sia limitata, dimostra chiari vantaggi nella configurazione stabilita. Questo lavoro fornisce un nuovo metodo prezioso per il problema dell'identificazione del sistema nel calcolo scientifico, con buone prospettive di sviluppo.