2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.
Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
academic

Verso Modelli di Inferenza Fondazionali che Apprendono le ODE Nel Contesto

Informazioni Fondamentali

  • ID Articolo: 2510.12650
  • Titolo: Towards Foundation Inference Models that Learn ODEs In-Context
  • Autori: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
  • Classificazione: cs.LG (Machine Learning)
  • Data di Pubblicazione/Conferenza: AI in Science (AIS), 2025, Copenaghen, Danimarca
  • Link Articolo: https://arxiv.org/abs/2510.12650

Riassunto

Le equazioni differenziali ordinarie (ODE) descrivono sistemi dinamici con evoluzione deterministica nel tempo continuo. La modellazione accurata di sistemi ODE da una prospettiva guidata dai dati rappresenta un problema centrale nelle scienze naturali, ma rimane impegnativa in condizioni di dati sparsi o rumorosi. Questo articolo introduce FIM-ODE (Foundation Inference Model for ODEs), un modello neurale pre-addestrato progettato per stimare le ODE da osservazioni sparse e rumorose in modo zero-shot (cioè nel contesto). Il modello è addestrato su dati sintetici, sfruttando operatori neurali flessibili per un'inferenza robusta delle ODE, funzionando anche su dati corrotti. La validazione sperimentale dimostra che FIM-ODE fornisce stime accurate, con prestazioni comparabili ai metodi all'avanguardia delle reti neurali, e confronta qualitativamente come questi stimano la struttura del campo vettoriale.

Contesto di Ricerca e Motivazione

Definizione del Problema

Il problema centrale affrontato da questa ricerca è il problema di identificazione del sistema ODE: stimare l'ODE (cioè il campo vettoriale) che meglio descrive il sistema basandosi unicamente su osservazioni di serie temporali. Questo ha applicazioni diffuse nelle scienze naturali, dalle leggi del moto di Newton alla dinamica delle popolazioni nei sistemi biologici, fino alla convezione atmosferica in meteorologia.

Importanza del Problema

  1. Ampia Applicabilità: Le ODE sono strumenti di modellazione fondamentali in fisica, biologia, meteorologia e altri campi
  2. Capacità Predittiva: I modelli ODE accurati possono caratterizzare fenomeni latenti (come punti fissi o cicli limite) e prevedere stati futuri
  3. Comprensione Scientifica: I modelli ODE facilitano la comprensione dei meccanismi intrinseci del sistema e delle caratteristiche dinamiche

Limitazioni dei Metodi Esistenti

  1. Metodi Tradizionali: I metodi non parametrici o basati su regressione simbolica mostrano prestazioni scadenti nel trattare dati sparsi e rumorosi
  2. Limitazioni di ODEFormer: Sebbene sia il metodo più recente di regressione neurale-simbolica, può elaborare solo singole traiettorie e potrebbe produrre pattern complessi irragionevoli nella previsione del campo vettoriale globale

Motivazione della Ricerca

Gli autori, basandosi sul framework dei Foundation Inference Models (FIMs), che ha dimostrato buoni risultati nell'inferenza di catene di Markov a tempo continuo, equazioni differenziali stocastiche e processi puntuali, propongono il modello FIM-ODE specificamente per l'inferenza delle ODE.

Contributi Principali

  1. Proposta del Modello FIM-ODE: Primo modello pre-addestrato per l'inferenza delle ODE basato sul framework dei Foundation Inference Models
  2. Architettura dell'Operatore Neurale: Implementazione di DeepONet per la stima flessibile del campo vettoriale
  3. Capacità di Elaborazione Multi-Traiettoria: Capacità di elaborare simultaneamente più traiettorie dello stesso sistema, migliorando la precisione dell'inferenza
  4. Prestazioni Superiori: Superamento di ODEFormer su dataset sintetici, con accuratezza R² rispettivamente di 0.90 vs 0.65 (compito di ricostruzione) e 0.26 vs 0.19 (compito di generalizzazione)
  5. Previsione Globale Più Ragionevole: Rispetto a ODEFormer, fornisce previsioni del campo vettoriale più semplici e ragionevoli in regioni lontane dai punti osservati

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un insieme di osservazioni di serie temporali D={yk}k=1K\mathcal{D} = \{y_k\}_{k=1}^K, dove ogni sequenza yk=[(tk1,yk1),,(tkL,ykL)]y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})], l'obiettivo è stimare il campo vettoriale f^\hat{f} che possa descrivere il sistema ODE che genera queste osservazioni:

dx(t)dt=f(t,x(t))\frac{dx(t)}{dt} = f(t, x(t))

Architettura del Modello

1. Generazione di Dati Sintetici

  • Campionamento di ogni componente del campo vettoriale da una distribuzione polinomiale multivariata (massimo grado 3)
  • Supporto per sistemi ODE fino a 3 dimensioni
  • Simulazione del sistema su griglie irregolari e aggiunta di rumore per generare dati di addestramento

2. Architettura dell'Operatore Neurale (DeepONet)

FIM-ODE adotta l'architettura dell'operatore neurale DeepONet, contenente tre componenti principali:

Branch Network (Rete di Ramo):

  • Utilizza un codificatore Transformer
  • Codifica i dati osservati D\mathcal{D} in K(L1)K(L-1) rappresentazioni EE-dimensionali DRE×K(L1)\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}
  • Mantiene codifiche indipendenti per quasi tutte le osservazioni

Trunk Network (Rete di Tronco):

  • Mappatura lineare che codifica la posizione xRDx \in \mathbb{R}^D in h(x)REh(x) \in \mathbb{R}^E

Combination Network (Rete di Combinazione):

  • Sequenza di strati di attenzione residua, simile a un decodificatore Transformer
  • Utilizza D\mathcal{D} come chiavi e valori, h(x)h(x) come query
  • Proiezione lineare finale per ottenere la stima del campo vettoriale f^(x)\hat{f}(x)

3. Obiettivo di Addestramento

Adotta un obiettivo di apprendimento supervisionato: L(x,D,f)=f^(x)f(x)2L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2

Abbina il campo vettoriale predetto e reale su punti di campionamento xx vicini ai valori osservati.

Punti di Innovazione Tecnica

  1. Capacità di Apprendimento Nel Contesto: Elaborazione di nuovi sistemi ODE senza ulteriore addestramento o fine-tuning
  2. Fusione Multi-Traiettoria: Capacità di elaborare simultaneamente più traiettorie, estraendo e combinando efficacemente tutte le informazioni disponibili
  3. Approssimazione Flessibile di Funzioni: L'operatore neurale è più flessibile della regressione simbolica nel trattare dati sparsi e rumorosi
  4. Equilibrio Locale-Globale: Fornisce previsioni complesse vicino ai punti osservati e previsioni semplici e ragionevoli lontano dalle osservazioni

Configurazione Sperimentale

Dataset

  • Dati di Addestramento: 600.000 equazioni ODE sintetiche, modello con circa 20 milioni di parametri
  • Dati di Test: 4.000 campi vettoriali polinomiali ODE (massimo grado 3, massimo 3 dimensioni)
  • Configurazione Traiettorie: 9 traiettorie generate per ogni ODE, stati iniziali campionati da N(0,1)N(0,1)
  • Configurazione Osservazioni: 200 punti osservati per traiettoria, griglia regolare, intervallo temporale Δτ=0.05\Delta\tau = 0.05

Metriche di Valutazione

Utilizzo dell'Accuratezza R²: Percentuale di punteggi R² superiori a 0.9

Metodi di Confronto

ODEFormer: Metodo di regressione neurale-simbolica pre-addestrato, addestrato su 50 milioni di equazioni, con 86 milioni di parametri

Compiti Sperimentali

  1. Compito di Ricostruzione: Misurazione delle prestazioni di ricostruzione su traiettorie di contesto
  2. Compito di Generalizzazione: Misurazione delle prestazioni di ricostruzione su traiettorie riservate

Risultati Sperimentali

Risultati Principali

ModelloCompito di RicostruzioneCompito di Generalizzazione
ODEFormer0.650.19
FIM-ODE0.900.26

Scoperte Chiave:

  • FIM-ODE supera significativamente ODEFormer in entrambi i compiti
  • Il compito di generalizzazione è più impegnativo del compito di ricostruzione, il che è intuitivo
  • Nonostante ODEFormer sia addestrato su una distribuzione più ampia e abbia più parametri, FIM-ODE mostra prestazioni superiori

Analisi del Contesto Multi-Traiettoria

La Figura 1 mostra la stima del campo vettoriale di FIM-ODE con diversi numeri di traiettorie di contesto:

  • Singola Traiettoria: Stima imprecisa in posizioni lontane dalle osservazioni
  • Multi-Traiettoria: Con l'aumento del numero di traiettorie, FIM-ODE corregge queste stime, coprendo efficacemente uno spazio più ampio

Confronto tra Previsione Locale e Globale

La Figura 2 confronta le stime del campo vettoriale di FIM-ODE e ODEFormer:

  • FIM-ODE:
    • Locale: Predice pattern complessi nei punti osservati per ricostruire le traiettorie
    • Globale: Predice pattern più semplici lontano dai punti osservati
  • ODEFormer: Predice campi vettoriali più complessi, risultando in previsioni di pattern globali complesse e prive di supporto da singole traiettorie semplici

Analisi delle Differenze Strutturali

Le differenze tra i due modelli derivano da diverse parametrizzazioni del campo vettoriale:

  • ODEFormer: Limitato a equazioni simboliche polinomiali (razionali), che potrebbero non impostare per impostazione predefinita espressioni semplici con osservazioni sparse o rumorose
  • FIM-ODE: L'operatore neurale gestisce questi casi in modo più flessibile

Lavori Correlati

Metodi Tradizionali di Inferenza delle ODE

  1. Metodi Non Parametrici: Come i processi gaussiani, ecc.
  2. Metodi di Regressione Simbolica: Regressione simbolica tradizionale basata su algoritmi genetici o altri metodi di ottimizzazione

Framework dei Foundation Inference Models

  • FIM-CTMC: Inferenza di catene di Markov a tempo continuo
  • FIM-SDE: Inferenza di equazioni differenziali stocastiche
  • FIM-PP: Inferenza di processi puntuali
  • FIM-ODE di questo articolo è l'estensione del framework all'inferenza delle ODE

Regressione Neurale-Simbolica

ODEFormer: Metodo neurale pre-addestrato che converte osservazioni di serie temporali in equazioni simboliche

Conclusioni e Discussione

Conclusioni Principali

  1. FIM-ODE estende con successo il framework dei Foundation Inference Models al problema dell'inferenza delle ODE
  2. Su dataset sintetici, FIM-ODE supera significativamente il metodo all'avanguardia esistente ODEFormer
  3. La flessibilità dell'operatore neurale consente a FIM-ODE di fornire previsioni del campo vettoriale globale più ragionevoli
  4. La capacità di elaborazione multi-traiettoria è un vantaggio importante di FIM-ODE rispetto a ODEFormer

Limitazioni

  1. Limitazioni della Distribuzione dei Dati: Attualmente validato solo su campi vettoriali polinomiali, i sistemi reali potrebbero essere più complessi
  2. Limitazioni Dimensionali: Gli esperimenti attuali sono limitati a sistemi 3-dimensionali
  3. Portata della Valutazione: Necessità di validazione su una gamma più ampia di sistemi ODE
  4. Efficienza Computazionale: L'articolo non discute in dettaglio la complessità computazionale e la velocità di inferenza

Direzioni Future

  1. Valutazione su ODEBench: Confronto dei metodi su un dataset di benchmark contenente 63 ODE selezionati manualmente
  2. Scoperta di Dinamiche Latenti: Esplorazione dell'uso di FIM-ODE pre-addestrato per scoprire dinamiche latenti
  3. Estensione Applicativa:
    • Dinamica neurale di popolazione
    • Cinetica di reazioni chimiche
    • Evoluzione di contenuti nel linguaggio naturale

Valutazione Approfondita

Punti di Forza

  1. Innovazione Metodologica: Prima applicazione del framework FIM all'inferenza delle ODE, con design architetturale ragionevole
  2. Vantaggi Tecnici:
    • Capacità di elaborazione multi-traiettoria
    • Architettura dell'operatore neurale flessibile
    • Capacità di apprendimento nel contesto
  3. Completezza Sperimentale:
    • Confronto diretto con baseline forte
    • Analisi da molteplici angolazioni (ricostruzione vs generalizzazione, locale vs globale)
    • L'analisi di visualizzazione migliora la comprensione
  4. Convincenza dei Risultati: Superamento significativo del metodo di confronto in tutte le metriche

Insufficienze

  1. Portata Sperimentale Limitata:
    • Validazione solo su dati polinomiali sintetici
    • Mancanza di validazione su dati del mondo reale
    • Dimensione e complessità limitate
  2. Confronto Insufficiente:
    • Confronto solo con ODEFormer, mancanza di confronto con altri metodi tradizionali
    • Nessun confronto dell'efficienza computazionale
  3. Mancanza di Analisi Teorica:
    • Mancanza di garanzie teoriche sulla convergenza o sulla capacità di generalizzazione
    • Nessuna analisi dei vantaggi teorici del metodo
  4. Dettagli Tecnici Insufficienti:
    • Descrizione sommaria dei dettagli di addestramento
    • Mancanza di spiegazione della scelta degli iperparametri

Impatto

  1. Contributo Accademico:
    • Estensione dell'applicabilità del framework FIM
    • Fornisce un nuovo metodo di rete neurale per l'inferenza delle ODE
  2. Valore Pratico:
    • La capacità di inferenza zero-shot ha potenziale di applicazione pratica
    • L'elaborazione multi-traiettoria è più pratica in scenari reali
  3. Riproducibilità:
    • Basato su architettura FIM-SDE esistente, il percorso tecnico è chiaro
    • Ma mancano dettagli di implementazione dettagliati

Scenari Applicabili

  1. Calcolo Scientifico: Modellazione di sistemi dinamici in fisica, biologia, chimica e altri campi
  2. Applicazioni Ingegneristiche: Sistemi di controllo, elaborazione dei segnali e altri scenari che richiedono identificazione del sistema
  3. Scenari di Dati Sparsi: Particolarmente adatto quando i dati osservati sono limitati o rumorosi
  4. Dati Multi-Traiettoria: Vantaggi evidenti quando il sistema ha più traiettorie osservate

Bibliografia

Questo articolo fa principalmente riferimento ai seguenti lavori chiave:

  • d'Ascoli et al. (2024): Articolo originale di ODEFormer
  • Seifner et al. (2025a): Framework FIM-SDE
  • Lu et al. (2021): Operatore neurale DeepONet
  • Berghaus et al. (2024): Lavoro fondamentale del framework FIM

Valutazione Complessiva: Questo è un articolo tecnicamente solido che estende con successo il framework dei Foundation Inference Models al problema dell'inferenza delle ODE. Sebbene la portata sperimentale sia limitata, dimostra chiari vantaggi nella configurazione stabilita. Questo lavoro fornisce un nuovo metodo prezioso per il problema dell'identificazione del sistema nel calcolo scientifico, con buone prospettive di sviluppo.