Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
- ID статьи: 2510.12650
- Название: Towards Foundation Inference Models that Learn ODEs In-Context
- Авторы: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
- Классификация: cs.LG (Машинное обучение)
- Дата публикации/конференция: AI in Science (AIS), 2025, Копенгаген, Дания
- Ссылка на статью: https://arxiv.org/abs/2510.12650
Обыкновенные дифференциальные уравнения (ОДУ) описывают детерминированную эволюцию динамических систем в непрерывном времени. Точное моделирование систем ОДУ на основе данных является центральной проблемой в естественных науках, но остаётся сложным при разреженных или зашумленных наблюдениях. В данной работе представляется FIM-ODE (Foundation Inference Model for ODEs) — предварительно обученная нейронная модель, предназначенная для нулевого выстрела (то есть контекстного) оценивания ОДУ из разреженных и зашумленных наблюдений. Модель обучается на синтетических данных с использованием гибких нейронных операторов для надёжного вывода ОДУ, работающего даже с повреждёнными данными. Экспериментальная проверка показывает, что FIM-ODE обеспечивает точные оценки, производительность которых сравнима с современными методами на основе нейронных сетей, и качественно сравнивает их оценки векторных полей.
Основная проблема, которую решает данное исследование, — это задача идентификации системы ОДУ: оценивание ОДУ (то есть векторного поля), которое лучше всего описывает систему, исключительно на основе наблюдений временных рядов. Это имеет широкое применение в естественных науках, от законов движения Ньютона до динамики популяций в биологических системах и конвекции атмосферы в метеорологии.
- Широкая применимость: ОДУ являются фундаментальным инструментом моделирования в физике, биологии, метеорологии и других областях
- Прогностическая способность: точные модели ОДУ способны характеризовать скрытые явления (такие как неподвижные точки или предельные циклы) и предсказывать будущие состояния
- Научное понимание: модели ОДУ помогают понять внутренние механизмы и динамические характеристики систем
- Традиционные методы: непараметрические методы или методы, основанные на символической регрессии, плохо работают с разреженными и зашумленными данными
- Ограничения ODEFormer: хотя это новейший метод нейросимволической регрессии, он может обрабатывать только одну траекторию и может создавать неразумные сложные паттерны при предсказании глобального векторного поля
Авторы, опираясь на фреймворк Foundation Inference Models (FIMs), который показал хорошие результаты при выводе непрерывных цепей Маркова, стохастических дифференциальных уравнений и точечных процессов, предлагают специализированную модель FIM-ODE для вывода ОДУ.
- Предложение модели FIM-ODE: первая предварительно обученная модель вывода ОДУ на основе фреймворка Foundation Inference Models
- Архитектура нейронного оператора: использование нейронного оператора DeepONet для гибкой оценки векторного поля
- Способность обработки множественных траекторий: возможность одновременной обработки нескольких траекторий одной системы для повышения точности вывода
- Превосходная производительность: превышение ODEFormer на синтетических наборах данных с R² точностью 0.90 против 0.65 (задача реконструкции) и 0.26 против 0.19 (задача обобщения)
- Более разумное глобальное предсказание: по сравнению с ODEFormer обеспечивает более простые и разумные предсказания векторного поля в областях, удалённых от точек наблюдения
Дано множество наблюдений временных рядов D={yk}k=1K, где каждая последовательность yk=[(tk1,yk1),…,(tkL,ykL)]. Цель — оценить векторное поле f^, которое может описать систему ОДУ, генерирующую эти наблюдения:
dtdx(t)=f(t,x(t))
- Выборка каждого компонента векторного поля из многомерного полиномиального распределения (максимум 3-й степени)
- Поддержка систем ОДУ размерностью до 3
- Моделирование системы на нерегулярной сетке с добавлением шума для генерации обучающих данных
FIM-ODE использует архитектуру нейронного оператора DeepONet, состоящую из трёх основных компонентов:
Ветвевая сеть (Branch Network):
- Использование кодировщика Transformer
- Кодирование данных наблюдений D в K(L−1) представлений размерности E: D∈RE×K(L−1)
- Сохранение почти независимого кодирования всех наблюдений
Магистральная сеть (Trunk Network):
- Линейное отображение, кодирующее позицию x∈RD в h(x)∈RE
Сеть комбинирования (Combination Network):
- Последовательность слоёв остаточного внимания, аналогичная декодировщику Transformer
- Использование D в качестве ключей и значений, h(x) в качестве запроса
- Финальная линейная проекция для получения оценки векторного поля f^(x)
Использование целевой функции контролируемого обучения:
L(x,D,f)=∥f^(x)−f(x)∥2
Согласование предсказанного и истинного векторного поля на точках выборки x, близких к наблюдаемым значениям.
- Способность контекстного обучения: обработка новых систем ОДУ без дополнительного обучения или тонкой настройки
- Слияние множественных траекторий: одновременная обработка нескольких траекторий с эффективным извлечением и комбинированием всей доступной информации
- Гибкая аппроксимация функций: нейронные операторы более гибки при работе с разреженными и зашумленными данными по сравнению с символической регрессией
- Баланс локального и глобального: обеспечение сложных предсказаний вблизи точек наблюдения и простых разумных предсказаний в удалённых областях
- Обучающие данные: 600 тысяч синтетических уравнений ОДУ, модель с примерно 20 миллионами параметров
- Тестовые данные: 4000 полиномиальных векторных полей ОДУ (максимум 3-й степени, максимум 3 измерения)
- Установка траекторий: каждое ОДУ генерирует 9 траекторий, начальные состояния выбираются из N(0,1)
- Установка наблюдений: 200 точек наблюдения на каждую траекторию, регулярная сетка, временной интервал Δτ=0.05
Использование R² точности: процент оценок с R² баллом больше 0.9
ODEFormer: предварительно обученный метод нейросимволической регрессии, обученный на 50 миллионах уравнений с 86 миллионами параметров
- Задача реконструкции: измерение производительности реконструкции на контекстных траекториях
- Задача обобщения: измерение производительности реконструкции на зарезервированных траекториях
| Модель | Задача реконструкции | Задача обобщения |
|---|
| ODEFormer | 0.65 | 0.19 |
| FIM-ODE | 0.90 | 0.26 |
Ключевые находки:
- FIM-ODE значительно превосходит ODEFormer в обеих задачах
- Задача обобщения более сложна, чем задача реконструкции, что соответствует интуиции
- Несмотря на то, что ODEFormer обучается на более широком распределении и имеет больше параметров, FIM-ODE показывает лучшие результаты
На рисунке 1 показана оценка векторного поля FIM-ODE при различном количестве контекстных траекторий:
- Одна траектория: неточные оценки в позициях, удалённых от наблюдений
- Множественные траектории: с увеличением количества траекторий FIM-ODE способна исправлять эти оценки, эффективно охватывая большее пространство
На рисунке 2 сравниваются оценки векторного поля FIM-ODE и ODEFormer:
- FIM-ODE:
- Локально: предсказывает сложные паттерны в точках наблюдения для реконструкции траекторий
- Глобально: предсказывает более простые паттерны при удалении от точек наблюдения
- ODEFormer: предсказывает более сложные векторные поля, что приводит к сложным глобальным паттернам без поддержки одной простой траектории
Различия между двумя моделями вытекают из различных параметризаций векторного поля:
- ODEFormer: ограничен (рациональными) полиномиальными символическими уравнениями, которые при разреженных или зашумленных наблюдениях могут не по умолчанию переходить к простым выражениям
- FIM-ODE: нейронный оператор более гибко обрабатывает эти ситуации
- Непараметрические методы: такие как гауссовские процессы и т.д.
- Методы символической регрессии: традиционная символическая регрессия, основанная на генетических алгоритмах или других методах оптимизации
- FIM-CTMC: вывод непрерывных цепей Маркова
- FIM-SDE: вывод стохастических дифференциальных уравнений
- FIM-PP: вывод точечных процессов
- FIM-ODE данной работы является расширением этого фреймворка на задачу вывода ОДУ
ODEFormer: предварительно обученный нейронный метод преобразования наблюдений временных рядов в символические уравнения
- FIM-ODE успешно расширяет фреймворк Foundation Inference Models на задачу вывода ОДУ
- На синтетическом наборе данных FIM-ODE значительно превосходит существующий современный метод ODEFormer
- Гибкость нейронного оператора позволяет FIM-ODE обеспечивать более разумные предсказания глобального векторного поля
- Способность обработки множественных траекторий является важным преимуществом FIM-ODE перед ODEFormer
- Ограничения распределения данных: в настоящее время проверено только на полиномиальных векторных полях, реальные системы могут быть более сложными
- Ограничение размерности: текущие эксперименты ограничены системами размерностью 3
- Ограниченный диапазон оценки: требуется проверка на более широком диапазоне систем ОДУ
- Вычислительная эффективность: статья не обсуждает подробно вычислительную сложность и скорость вывода
- Оценка ODEBench: сравнение методов на эталонном наборе данных, содержащем 63 вручную отобранных ОДУ
- Обнаружение скрытой динамики: исследование использования предварительно обученной FIM-ODE для обнаружения скрытой динамики
- Расширение приложений:
- Нейронная динамика популяций
- Динамика химических реакций
- Эволюция содержания на естественном языке
- Методологическая инновативность: первое применение фреймворка FIM к выводу ОДУ с разумным проектированием архитектуры
- Технические преимущества:
- Способность обработки множественных траекторий
- Гибкая архитектура нейронного оператора
- Способность контекстного обучения
- Полнота экспериментов:
- Прямое сравнение с сильным базовым методом
- Многоаспектный анализ (реконструкция vs обобщение, локальное vs глобальное)
- Визуализационный анализ улучшает понимание
- Убедительность результатов: значительное превосходство над методом сравнения по всем метрикам
- Ограниченный диапазон экспериментов:
- Проверка только на синтетических полиномиальных данных
- Отсутствие проверки на реальных данных
- Ограниченная размерность и сложность
- Недостаточное сравнение:
- Сравнение только с ODEFormer, отсутствие сравнения с другими традиционными методами
- Отсутствие сравнения вычислительной эффективности
- Отсутствие теоретического анализа:
- Отсутствие теоретических гарантий сходимости или способности обобщения
- Отсутствие анализа теоретических преимуществ метода
- Недостаточность технических деталей:
- Краткое описание деталей обучения
- Отсутствие объяснения выбора гиперпараметров
- Академический вклад:
- Расширение области применения фреймворка FIM
- Предоставление нового нейросетевого метода для вывода ОДУ
- Практическая ценность:
- Способность нулевого выстрела имеет потенциал практического применения
- Обработка множественных траекторий более практична в реальных сценариях
- Воспроизводимость:
- Опирается на существующую архитектуру FIM-SDE, технологический маршрут ясен
- Но отсутствуют подробные детали реализации
- Научные вычисления: моделирование динамических систем в физике, биологии, химии и других областях
- Инженерные приложения: системы управления, обработка сигналов и другие сценарии, требующие идентификации систем
- Сценарии с разреженными данными: особенно подходит для ситуаций с ограниченными или зашумленными данными наблюдений
- Данные множественных траекторий: явное преимущество при наличии нескольких траекторий наблюдения одной системы
Данная работа в основном ссылается на следующие ключевые работы:
- d'Ascoli et al. (2024): оригинальная статья ODEFormer
- Seifner et al. (2025a): фреймворк FIM-SDE
- Lu et al. (2021): нейронный оператор DeepONet
- Berghaus et al. (2024): базовая работа фреймворка FIM
Общая оценка: Это технически обоснованная статья, которая успешно расширяет фреймворк Foundation Inference Models на задачу вывода ОДУ. Хотя диапазон экспериментов ограничен, в установленных условиях демонстрируются явные преимущества. Данная работа предоставляет ценный новый метод для задачи идентификации систем в научных вычислениях и имеет хорошие перспективы развития.