2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.

Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.

academic

Verso Modelli di Inferenza Fondazionali che Apprendono le ODE Nel Contesto

Informazioni Fondamentali

ID Articolo: 2510.12650
Titolo: Towards Foundation Inference Models that Learn ODEs In-Context
Autori: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
Classificazione: cs.LG (Machine Learning)
Data di Pubblicazione/Conferenza: AI in Science (AIS), 2025, Copenaghen, Danimarca
Link Articolo: https://arxiv.org/abs/2510.12650

Riassunto

Le equazioni differenziali ordinarie (ODE) descrivono sistemi dinamici con evoluzione deterministica nel tempo continuo. La modellazione accurata di sistemi ODE da una prospettiva guidata dai dati rappresenta un problema centrale nelle scienze naturali, ma rimane impegnativa in condizioni di dati sparsi o rumorosi. Questo articolo introduce FIM-ODE (Foundation Inference Model for ODEs), un modello neurale pre-addestrato progettato per stimare le ODE da osservazioni sparse e rumorose in modo zero-shot (cioè nel contesto). Il modello è addestrato su dati sintetici, sfruttando operatori neurali flessibili per un'inferenza robusta delle ODE, funzionando anche su dati corrotti. La validazione sperimentale dimostra che FIM-ODE fornisce stime accurate, con prestazioni comparabili ai metodi all'avanguardia delle reti neurali, e confronta qualitativamente come questi stimano la struttura del campo vettoriale.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale affrontato da questa ricerca è il problema di identificazione del sistema ODE: stimare l'ODE (cioè il campo vettoriale) che meglio descrive il sistema basandosi unicamente su osservazioni di serie temporali. Questo ha applicazioni diffuse nelle scienze naturali, dalle leggi del moto di Newton alla dinamica delle popolazioni nei sistemi biologici, fino alla convezione atmosferica in meteorologia.

Importanza del Problema

Ampia Applicabilità: Le ODE sono strumenti di modellazione fondamentali in fisica, biologia, meteorologia e altri campi
Capacità Predittiva: I modelli ODE accurati possono caratterizzare fenomeni latenti (come punti fissi o cicli limite) e prevedere stati futuri
Comprensione Scientifica: I modelli ODE facilitano la comprensione dei meccanismi intrinseci del sistema e delle caratteristiche dinamiche

Limitazioni dei Metodi Esistenti

Metodi Tradizionali: I metodi non parametrici o basati su regressione simbolica mostrano prestazioni scadenti nel trattare dati sparsi e rumorosi
Limitazioni di ODEFormer: Sebbene sia il metodo più recente di regressione neurale-simbolica, può elaborare solo singole traiettorie e potrebbe produrre pattern complessi irragionevoli nella previsione del campo vettoriale globale

Motivazione della Ricerca

Gli autori, basandosi sul framework dei Foundation Inference Models (FIMs), che ha dimostrato buoni risultati nell'inferenza di catene di Markov a tempo continuo, equazioni differenziali stocastiche e processi puntuali, propongono il modello FIM-ODE specificamente per l'inferenza delle ODE.

Contributi Principali

Proposta del Modello FIM-ODE: Primo modello pre-addestrato per l'inferenza delle ODE basato sul framework dei Foundation Inference Models
Architettura dell'Operatore Neurale: Implementazione di DeepONet per la stima flessibile del campo vettoriale
Capacità di Elaborazione Multi-Traiettoria: Capacità di elaborare simultaneamente più traiettorie dello stesso sistema, migliorando la precisione dell'inferenza
Prestazioni Superiori: Superamento di ODEFormer su dataset sintetici, con accuratezza R² rispettivamente di 0.90 vs 0.65 (compito di ricostruzione) e 0.26 vs 0.19 (compito di generalizzazione)
Previsione Globale Più Ragionevole: Rispetto a ODEFormer, fornisce previsioni del campo vettoriale più semplici e ragionevoli in regioni lontane dai punti osservati

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un insieme di osservazioni di serie temporali $\mathcal{D} = \{y_k\}_{k=1}^K$ , dove ogni sequenza $y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})]$ , l'obiettivo è stimare il campo vettoriale $\hat{f}$ che possa descrivere il sistema ODE che genera queste osservazioni:

$\frac{dx(t)}{dt} = f(t, x(t))$

Architettura del Modello

1. Generazione di Dati Sintetici

Campionamento di ogni componente del campo vettoriale da una distribuzione polinomiale multivariata (massimo grado 3)
Supporto per sistemi ODE fino a 3 dimensioni
Simulazione del sistema su griglie irregolari e aggiunta di rumore per generare dati di addestramento

2. Architettura dell'Operatore Neurale (DeepONet)

FIM-ODE adotta l'architettura dell'operatore neurale DeepONet, contenente tre componenti principali:

Branch Network (Rete di Ramo):

Utilizza un codificatore Transformer
Codifica i dati osservati $\mathcal{D}$ in $K(L-1)$ rappresentazioni $E$ -dimensionali $\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}$
Mantiene codifiche indipendenti per quasi tutte le osservazioni

Trunk Network (Rete di Tronco):

Mappatura lineare che codifica la posizione $x \in \mathbb{R}^D$ in $h(x) \in \mathbb{R}^E$

Combination Network (Rete di Combinazione):

Sequenza di strati di attenzione residua, simile a un decodificatore Transformer
Utilizza $\mathcal{D}$ come chiavi e valori, $h(x)$ come query
Proiezione lineare finale per ottenere la stima del campo vettoriale $\hat{f}(x)$

3. Obiettivo di Addestramento

Adotta un obiettivo di apprendimento supervisionato: $L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2$

Abbina il campo vettoriale predetto e reale su punti di campionamento $x$ vicini ai valori osservati.

Punti di Innovazione Tecnica

Capacità di Apprendimento Nel Contesto: Elaborazione di nuovi sistemi ODE senza ulteriore addestramento o fine-tuning
Fusione Multi-Traiettoria: Capacità di elaborare simultaneamente più traiettorie, estraendo e combinando efficacemente tutte le informazioni disponibili
Approssimazione Flessibile di Funzioni: L'operatore neurale è più flessibile della regressione simbolica nel trattare dati sparsi e rumorosi
Equilibrio Locale-Globale: Fornisce previsioni complesse vicino ai punti osservati e previsioni semplici e ragionevoli lontano dalle osservazioni

Configurazione Sperimentale

Dataset

Dati di Addestramento: 600.000 equazioni ODE sintetiche, modello con circa 20 milioni di parametri
Dati di Test: 4.000 campi vettoriali polinomiali ODE (massimo grado 3, massimo 3 dimensioni)
Configurazione Traiettorie: 9 traiettorie generate per ogni ODE, stati iniziali campionati da $N(0,1)$
Configurazione Osservazioni: 200 punti osservati per traiettoria, griglia regolare, intervallo temporale $\Delta\tau = 0.05$

Metriche di Valutazione

Utilizzo dell'Accuratezza R²: Percentuale di punteggi R² superiori a 0.9

Metodi di Confronto

ODEFormer: Metodo di regressione neurale-simbolica pre-addestrato, addestrato su 50 milioni di equazioni, con 86 milioni di parametri

Compiti Sperimentali

Compito di Ricostruzione: Misurazione delle prestazioni di ricostruzione su traiettorie di contesto
Compito di Generalizzazione: Misurazione delle prestazioni di ricostruzione su traiettorie riservate

Risultati Sperimentali

Risultati Principali

Modello	Compito di Ricostruzione	Compito di Generalizzazione
ODEFormer	0.65	0.19
FIM-ODE	0.90	0.26

Scoperte Chiave:

FIM-ODE supera significativamente ODEFormer in entrambi i compiti
Il compito di generalizzazione è più impegnativo del compito di ricostruzione, il che è intuitivo
Nonostante ODEFormer sia addestrato su una distribuzione più ampia e abbia più parametri, FIM-ODE mostra prestazioni superiori

Analisi del Contesto Multi-Traiettoria

La Figura 1 mostra la stima del campo vettoriale di FIM-ODE con diversi numeri di traiettorie di contesto:

Singola Traiettoria: Stima imprecisa in posizioni lontane dalle osservazioni
Multi-Traiettoria: Con l'aumento del numero di traiettorie, FIM-ODE corregge queste stime, coprendo efficacemente uno spazio più ampio

Confronto tra Previsione Locale e Globale

La Figura 2 confronta le stime del campo vettoriale di FIM-ODE e ODEFormer:

FIM-ODE:
- Locale: Predice pattern complessi nei punti osservati per ricostruire le traiettorie
- Globale: Predice pattern più semplici lontano dai punti osservati
ODEFormer: Predice campi vettoriali più complessi, risultando in previsioni di pattern globali complesse e prive di supporto da singole traiettorie semplici

Analisi delle Differenze Strutturali

Le differenze tra i due modelli derivano da diverse parametrizzazioni del campo vettoriale:

ODEFormer: Limitato a equazioni simboliche polinomiali (razionali), che potrebbero non impostare per impostazione predefinita espressioni semplici con osservazioni sparse o rumorose
FIM-ODE: L'operatore neurale gestisce questi casi in modo più flessibile

Lavori Correlati

Metodi Tradizionali di Inferenza delle ODE

Metodi Non Parametrici: Come i processi gaussiani, ecc.
Metodi di Regressione Simbolica: Regressione simbolica tradizionale basata su algoritmi genetici o altri metodi di ottimizzazione

Framework dei Foundation Inference Models

FIM-CTMC: Inferenza di catene di Markov a tempo continuo
FIM-SDE: Inferenza di equazioni differenziali stocastiche
FIM-PP: Inferenza di processi puntuali
FIM-ODE di questo articolo è l'estensione del framework all'inferenza delle ODE

Regressione Neurale-Simbolica

ODEFormer: Metodo neurale pre-addestrato che converte osservazioni di serie temporali in equazioni simboliche

Conclusioni e Discussione

Conclusioni Principali

FIM-ODE estende con successo il framework dei Foundation Inference Models al problema dell'inferenza delle ODE
Su dataset sintetici, FIM-ODE supera significativamente il metodo all'avanguardia esistente ODEFormer
La flessibilità dell'operatore neurale consente a FIM-ODE di fornire previsioni del campo vettoriale globale più ragionevoli
La capacità di elaborazione multi-traiettoria è un vantaggio importante di FIM-ODE rispetto a ODEFormer

Limitazioni

Limitazioni della Distribuzione dei Dati: Attualmente validato solo su campi vettoriali polinomiali, i sistemi reali potrebbero essere più complessi
Limitazioni Dimensionali: Gli esperimenti attuali sono limitati a sistemi 3-dimensionali
Portata della Valutazione: Necessità di validazione su una gamma più ampia di sistemi ODE
Efficienza Computazionale: L'articolo non discute in dettaglio la complessità computazionale e la velocità di inferenza

Direzioni Future

Valutazione su ODEBench: Confronto dei metodi su un dataset di benchmark contenente 63 ODE selezionati manualmente
Scoperta di Dinamiche Latenti: Esplorazione dell'uso di FIM-ODE pre-addestrato per scoprire dinamiche latenti
Estensione Applicativa:
- Dinamica neurale di popolazione
- Cinetica di reazioni chimiche
- Evoluzione di contenuti nel linguaggio naturale

Valutazione Approfondita

Punti di Forza

Innovazione Metodologica: Prima applicazione del framework FIM all'inferenza delle ODE, con design architetturale ragionevole
Vantaggi Tecnici:
- Capacità di elaborazione multi-traiettoria
- Architettura dell'operatore neurale flessibile
- Capacità di apprendimento nel contesto
Completezza Sperimentale:
- Confronto diretto con baseline forte
- Analisi da molteplici angolazioni (ricostruzione vs generalizzazione, locale vs globale)
- L'analisi di visualizzazione migliora la comprensione
Convincenza dei Risultati: Superamento significativo del metodo di confronto in tutte le metriche

Insufficienze

Portata Sperimentale Limitata:
- Validazione solo su dati polinomiali sintetici
- Mancanza di validazione su dati del mondo reale
- Dimensione e complessità limitate
Confronto Insufficiente:
- Confronto solo con ODEFormer, mancanza di confronto con altri metodi tradizionali
- Nessun confronto dell'efficienza computazionale
Mancanza di Analisi Teorica:
- Mancanza di garanzie teoriche sulla convergenza o sulla capacità di generalizzazione
- Nessuna analisi dei vantaggi teorici del metodo
Dettagli Tecnici Insufficienti:
- Descrizione sommaria dei dettagli di addestramento
- Mancanza di spiegazione della scelta degli iperparametri

Impatto

Contributo Accademico:
- Estensione dell'applicabilità del framework FIM
- Fornisce un nuovo metodo di rete neurale per l'inferenza delle ODE
Valore Pratico:
- La capacità di inferenza zero-shot ha potenziale di applicazione pratica
- L'elaborazione multi-traiettoria è più pratica in scenari reali
Riproducibilità:
- Basato su architettura FIM-SDE esistente, il percorso tecnico è chiaro
- Ma mancano dettagli di implementazione dettagliati

Scenari Applicabili

Calcolo Scientifico: Modellazione di sistemi dinamici in fisica, biologia, chimica e altri campi
Applicazioni Ingegneristiche: Sistemi di controllo, elaborazione dei segnali e altri scenari che richiedono identificazione del sistema
Scenari di Dati Sparsi: Particolarmente adatto quando i dati osservati sono limitati o rumorosi
Dati Multi-Traiettoria: Vantaggi evidenti quando il sistema ha più traiettorie osservate

Bibliografia

Questo articolo fa principalmente riferimento ai seguenti lavori chiave:

d'Ascoli et al. (2024): Articolo originale di ODEFormer
Seifner et al. (2025a): Framework FIM-SDE
Lu et al. (2021): Operatore neurale DeepONet
Berghaus et al. (2024): Lavoro fondamentale del framework FIM

Valutazione Complessiva: Questo è un articolo tecnicamente solido che estende con successo il framework dei Foundation Inference Models al problema dell'inferenza delle ODE. Sebbene la portata sperimentale sia limitata, dimostra chiari vantaggi nella configurazione stabilita. Questo lavoro fornisce un nuovo metodo prezioso per il problema dell'identificazione del sistema nel calcolo scientifico, con buone prospettive di sviluppo.