2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.

Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.

academic

상황 내 학습 ODE를 위한 기초 추론 모델을 향하여

기본 정보

논문 ID: 2510.12650
제목: Towards Foundation Inference Models that Learn ODEs In-Context
저자: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
분류: cs.LG (기계학습)
발표 시간/학회: AI in Science (AIS), 2025, Copenhagen, Denmark
논문 링크: https://arxiv.org/abs/2510.12650

초록

상미분방정식(ODE)은 연속 시간에서 결정론적 진화를 나타내는 동역학 시스템을 기술합니다. 데이터 기반 관점에서 ODE 시스템을 정확하게 모델링하는 것은 자연과학의 핵심 문제이지만, 데이터가 희소하거나 노이즈가 있는 경우에는 여전히 도전적입니다. 본 논문은 희소하고 노이즈가 있는 관측으로부터 ODE를 영점 샷(즉, 상황 내) 추정하도록 설계된 사전학습된 신경 모델인 FIM-ODE(Foundation Inference Model for ODEs)를 소개합니다. 이 모델은 합성 데이터에서 학습되며, 손상된 데이터에서도 작동하는 견고한 ODE 추론을 위해 유연한 신경 연산자를 활용합니다. 실험 검증은 FIM-ODE가 정확한 추정을 제공하며, 신경망 최첨단 방법과 비교할 수 있는 성능을 보이고, 벡터장 추정의 구조를 정성적으로 비교함을 보여줍니다.

연구 배경 및 동기

문제 정의

본 연구가 해결하려는 핵심 문제는 ODE 시스템 식별 문제입니다: 시계열 관측만으로부터 시스템을 가장 잘 설명하는 ODE(즉, 벡터장)를 추정하는 것입니다. 이는 뉴턴 운동 법칙에서 생물 시스템의 개체군 동역학, 기상학의 대기 대류에 이르기까지 자연과학에서 광범위한 응용을 가집니다.

문제의 중요성

광범위한 적용성: ODE는 물리학, 생물학, 기상학 등 여러 분야에서 기본 모델링 도구입니다
예측 능력: 정확한 ODE 모델은 잠재 현상(예: 고정점 또는 극한 순환)을 특성화하고 미래 상태를 예측할 수 있습니다
과학적 이해: ODE 모델은 시스템의 내재적 메커니즘과 동역학 특성을 이해하는 데 도움이 됩니다

기존 방법의 한계

전통적 방법: 비모수 방법 또는 기호 회귀 기반 방법은 희소하고 노이즈가 있는 데이터를 처리할 때 성능이 좋지 않습니다
ODEFormer 제한: 신경 기호 회귀의 최신 방법이지만 단일 궤적만 처리할 수 있으며, 전역 벡터장 예측에서 불합리한 복잡한 패턴을 생성할 수 있습니다

연구 동기

저자들은 연속 시간 마르코프 체인, 확률 미분방정식 및 점 과정 추론에서 좋은 결과를 보인 Foundation Inference Models (FIMs) 프레임워크를 기반으로 ODE 추론을 위해 특별히 설계된 FIM-ODE 모델을 제안합니다.

핵심 기여

FIM-ODE 모델 제안: Foundation Inference Models 프레임워크 기반의 첫 번째 ODE 추론 사전학습 모델
신경 연산자 아키텍처: 유연한 벡터장 추정을 위해 DeepONet 신경 연산자 채택
다중 궤적 처리 능력: 동일 시스템의 여러 궤적을 동시에 처리하여 추론 정확도 향상
우수한 성능: 합성 데이터셋에서 ODEFormer를 초과하며, R² 정확도는 각각 0.90 vs 0.65(재구성 작업)와 0.26 vs 0.19(일반화 작업)
더 합리적인 전역 예측: ODEFormer와 비교하여 관측점에서 멀리 떨어진 영역에서 더 간단하고 합리적인 벡터장 예측 제공

방법 상세 설명

작업 정의

시계열 관측 집합 $\mathcal{D} = \{y_k\}_{k=1}^K$ 가 주어졌을 때, 여기서 각 수열 $y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})]$ 이고, 목표는 이러한 관측을 생성하는 ODE 시스템을 설명할 수 있는 벡터장 $\hat{f}$ 를 추정하는 것입니다:

$\frac{dx(t)}{dt} = f(t, x(t))$

모델 아키텍처

1. 합성 데이터 생성

다변량 다항식 분포에서 벡터장의 각 성분 샘플링(최대 3차)
최대 3차원 ODE 시스템 지원
불규칙 격자에서 시스템을 시뮬레이션하고 노이즈를 추가하여 학습 데이터 생성

2. 신경 연산자 아키텍처(DeepONet)

FIM-ODE는 세 가지 주요 구성 요소를 포함하는 DeepONet 신경 연산자 아키텍처를 채택합니다:

분기 네트워크(Branch Network):

Transformer 인코더 사용
관측 데이터 $\mathcal{D}$ 를 $K(L-1)$ 개의 $E$ 차원 표현 $\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}$ 로 인코딩
거의 모든 관측의 독립적 인코딩 유지

트렁크 네트워크(Trunk Network):

선형 매핑으로 위치 $x \in \mathbb{R}^D$ 를 $h(x) \in \mathbb{R}^E$ 로 인코딩

조합 네트워크(Combination Network):

Transformer 디코더와 유사한 잔여 주의 계층 수열
$\mathcal{D}$ 를 키와 값으로, $h(x)$ 를 쿼리로 사용
최종 선형 투영으로 벡터장 추정 $\hat{f}(x)$ 획득

3. 학습 목표

감독 학습 목표 채택: $L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2$

관측값 근처의 샘플링된 점 $x$ 에서 예측 및 실제 벡터장을 일치시킵니다.

기술 혁신 포인트

상황 내 학습 능력: 추가 학습이나 미세 조정 없이 새로운 ODE 시스템 처리
다중 궤적 융합: 여러 궤적을 동시에 처리하여 모든 가용 정보를 효과적으로 추출 및 결합
유연한 함수 근사: 신경 연산자는 희소하고 노이즈가 있는 데이터 처리에서 기호 회귀보다 더 유연합니다
국소-전역 균형: 관측점 근처에서 복잡한 예측을 제공하고, 관측에서 멀리 떨어진 영역에서는 간단하고 합리적인 예측을 제공합니다

실험 설정

데이터셋

학습 데이터: 60만 개의 합성 ODE 방정식, 약 2000만 매개변수 모델
테스트 데이터: 4000개의 다항식 벡터장 ODE(최대 3차, 최대 3차원)
궤적 설정: 각 ODE는 9개의 궤적 생성, 초기 상태는 $N(0,1)$ 에서 샘플링
관측 설정: 각 궤적 200개 관측점, 규칙 격자, 시간 간격 $\Delta\tau = 0.05$

평가 지표

R² 정확도 사용: R² 점수가 0.9보다 큰 백분율

비교 방법

ODEFormer: 5000만 방정식에서 학습된 사전학습된 신경 기호 회귀 방법, 8600만 매개변수 보유

실험 작업

재구성 작업: 상황 내 궤적에서 재구성 성능 측정
일반화 작업: 보유된 궤적에서 재구성 성능 측정

실험 결과

주요 결과

모델	재구성 작업	일반화 작업
ODEFormer	0.65	0.19
FIM-ODE	0.90	0.26

주요 발견:

FIM-ODE는 두 작업 모두에서 ODEFormer를 크게 능가합니다
일반화 작업이 재구성 작업보다 더 도전적이며, 이는 직관과 일치합니다
ODEFormer가 더 광범위한 분포에서 학습되고 더 많은 매개변수를 가지고 있음에도 불구하고 FIM-ODE가 더 나은 성능을 보입니다

다중 궤적 상황 내 분석

그림 1은 다양한 수의 상황 내 궤적에서 FIM-ODE의 벡터장 추정을 보여줍니다:

단일 궤적: 관측에서 멀리 떨어진 위치에서 부정확한 추정
다중 궤적: 궤적 수가 증가함에 따라 FIM-ODE는 이러한 추정을 수정하여 더 큰 공간을 효과적으로 커버합니다

국소 및 전역 예측 비교

그림 2는 FIM-ODE와 ODEFormer의 벡터장 추정을 비교합니다:

FIM-ODE:
- 국소: 관측점에서 궤적을 재구성하기 위해 복잡한 패턴 예측
- 전역: 관측점에서 멀리 떨어졌을 때 더 간단한 예측
ODEFormer: 더 복잡한 벡터장을 예측하여 전역 패턴 예측이 복잡하고 단일 간단한 궤적의 지원이 부족합니다

구조 차이 분석

두 모델의 차이는 다양한 벡터장 매개변수화에서 비롯됩니다:

ODEFormer: (유리) 다항식 기호 방정식으로 제한되며, 희소하거나 노이즈가 있는 관측에서 기본적으로 간단한 표현으로 돌아가지 않을 수 있습니다
FIM-ODE: 신경 연산자는 이러한 상황을 더 유연하게 처리할 수 있습니다

결론 및 논의

주요 결론

FIM-ODE는 Foundation Inference Models 프레임워크를 ODE 추론 문제로 성공적으로 확장합니다
합성 데이터셋에서 FIM-ODE는 기존 최첨단 방법인 ODEFormer를 크게 능가합니다
신경 연산자의 유연성으로 인해 FIM-ODE는 더 합리적인 전역 벡터장 예측을 제공할 수 있습니다
다중 궤적 처리 능력은 ODEFormer에 대한 FIM-ODE의 중요한 장점입니다

한계

데이터 분포 제한: 현재 다항식 벡터장에서만 검증되었으며, 실제 시스템은 더 복잡할 수 있습니다
차원 제한: 현재 실험은 3차원 시스템으로 제한됩니다
평가 범위: 더 광범위한 ODE 시스템에서 검증이 필요합니다
계산 효율성: 논문에서 계산 복잡도 및 추론 속도를 자세히 논의하지 않습니다

향후 방향

ODEBench 평가: 63개의 수작업으로 선택된 ODE를 포함하는 벤치마크 데이터셋에서 방법 비교
잠재 동역학 발견: 사전학습된 FIM-ODE를 사용하여 잠재 동역학 발견 탐색
응용 확장:
- 신경 개체군 동역학
- 화학 반응 동역학
- 자연어 콘텐츠 진화

심층 평가

장점

방법의 혁신성: FIM 프레임워크를 ODE 추론에 처음 적용하며, 아키텍처 설계가 합리적입니다
기술적 장점:
- 다중 궤적 처리 능력
- 유연한 신경 연산자 아키텍처
- 상황 내 학습 능력
실험의 충분성:
- 강력한 기준선과의 직접 비교
- 다각적 분석(재구성 vs 일반화, 국소 vs 전역)
- 시각화 분석으로 이해도 향상
결과의 설득력: 모든 지표에서 비교 방법을 크게 능가합니다

부족한 점

실험 범위 제한:
- 합성 다항식 데이터에서만 검증
- 실제 데이터 검증 부족
- 차원 및 복잡도 제한
비교 불충분:
- ODEFormer와만 비교하며, 다른 전통 방법과의 비교 부족
- 계산 효율성 비교 없음
이론적 분석 부재:
- 수렴성 또는 일반화 능력에 대한 이론적 보장 부족
- 방법의 이론적 장점 분석 없음
기술 세부사항 부족:
- 학습 세부사항 설명 간략함
- 하이퍼파라미터 선택 설명 부족

영향력

학술적 기여:
- FIM 프레임워크의 응용 범위 확장
- ODE 추론을 위한 새로운 신경망 방법 제공
실용적 가치:
- 영점 샷 추론 능력이 실제 응용 잠재력을 가집니다
- 다중 궤적 처리가 실제 시나리오에서 더 실용적입니다
재현성:
- 기존 FIM-SDE 아키텍처 기반으로 기술 경로가 명확합니다
- 그러나 상세한 구현 세부사항이 부족합니다

적용 시나리오

과학 계산: 물리학, 생물학, 화학 등 분야의 동역학 시스템 모델링
공학 응용: 제어 시스템, 신호 처리 등 시스템 식별이 필요한 시나리오
데이터 희소 시나리오: 특히 관측 데이터가 제한적이거나 노이즈가 있는 경우에 적합
다중 궤적 데이터: 동일 시스템의 여러 관측 궤적이 있을 때 장점이 명확합니다

참고문헌

본 논문은 주로 다음의 핵심 연구를 참고합니다:

d'Ascoli et al. (2024): ODEFormer의 원본 논문
Seifner et al. (2025a): FIM-SDE 프레임워크
Lu et al. (2021): DeepONet 신경 연산자
Berghaus et al. (2024): FIM 프레임워크의 기초 연구

종합 평가: 이는 기술적으로 견고한 논문으로, Foundation Inference Models 프레임워크를 ODE 추론 문제로 성공적으로 확장합니다. 실험 범위는 제한적이지만 주어진 설정에서 명확한 장점을 보여줍니다. 이 연구는 과학 계산의 시스템 식별 문제에 가치 있는 새로운 방법을 제공하며 좋은 발전 전망을 가집니다.