Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
- 논문 ID: 2510.12650
- 제목: Towards Foundation Inference Models that Learn ODEs In-Context
- 저자: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
- 분류: cs.LG (기계학습)
- 발표 시간/학회: AI in Science (AIS), 2025, Copenhagen, Denmark
- 논문 링크: https://arxiv.org/abs/2510.12650
상미분방정식(ODE)은 연속 시간에서 결정론적 진화를 나타내는 동역학 시스템을 기술합니다. 데이터 기반 관점에서 ODE 시스템을 정확하게 모델링하는 것은 자연과학의 핵심 문제이지만, 데이터가 희소하거나 노이즈가 있는 경우에는 여전히 도전적입니다. 본 논문은 희소하고 노이즈가 있는 관측으로부터 ODE를 영점 샷(즉, 상황 내) 추정하도록 설계된 사전학습된 신경 모델인 FIM-ODE(Foundation Inference Model for ODEs)를 소개합니다. 이 모델은 합성 데이터에서 학습되며, 손상된 데이터에서도 작동하는 견고한 ODE 추론을 위해 유연한 신경 연산자를 활용합니다. 실험 검증은 FIM-ODE가 정확한 추정을 제공하며, 신경망 최첨단 방법과 비교할 수 있는 성능을 보이고, 벡터장 추정의 구조를 정성적으로 비교함을 보여줍니다.
본 연구가 해결하려는 핵심 문제는 ODE 시스템 식별 문제입니다: 시계열 관측만으로부터 시스템을 가장 잘 설명하는 ODE(즉, 벡터장)를 추정하는 것입니다. 이는 뉴턴 운동 법칙에서 생물 시스템의 개체군 동역학, 기상학의 대기 대류에 이르기까지 자연과학에서 광범위한 응용을 가집니다.
- 광범위한 적용성: ODE는 물리학, 생물학, 기상학 등 여러 분야에서 기본 모델링 도구입니다
- 예측 능력: 정확한 ODE 모델은 잠재 현상(예: 고정점 또는 극한 순환)을 특성화하고 미래 상태를 예측할 수 있습니다
- 과학적 이해: ODE 모델은 시스템의 내재적 메커니즘과 동역학 특성을 이해하는 데 도움이 됩니다
- 전통적 방법: 비모수 방법 또는 기호 회귀 기반 방법은 희소하고 노이즈가 있는 데이터를 처리할 때 성능이 좋지 않습니다
- ODEFormer 제한: 신경 기호 회귀의 최신 방법이지만 단일 궤적만 처리할 수 있으며, 전역 벡터장 예측에서 불합리한 복잡한 패턴을 생성할 수 있습니다
저자들은 연속 시간 마르코프 체인, 확률 미분방정식 및 점 과정 추론에서 좋은 결과를 보인 Foundation Inference Models (FIMs) 프레임워크를 기반으로 ODE 추론을 위해 특별히 설계된 FIM-ODE 모델을 제안합니다.
- FIM-ODE 모델 제안: Foundation Inference Models 프레임워크 기반의 첫 번째 ODE 추론 사전학습 모델
- 신경 연산자 아키텍처: 유연한 벡터장 추정을 위해 DeepONet 신경 연산자 채택
- 다중 궤적 처리 능력: 동일 시스템의 여러 궤적을 동시에 처리하여 추론 정확도 향상
- 우수한 성능: 합성 데이터셋에서 ODEFormer를 초과하며, R² 정확도는 각각 0.90 vs 0.65(재구성 작업)와 0.26 vs 0.19(일반화 작업)
- 더 합리적인 전역 예측: ODEFormer와 비교하여 관측점에서 멀리 떨어진 영역에서 더 간단하고 합리적인 벡터장 예측 제공
시계열 관측 집합 D={yk}k=1K가 주어졌을 때, 여기서 각 수열 yk=[(tk1,yk1),…,(tkL,ykL)]이고, 목표는 이러한 관측을 생성하는 ODE 시스템을 설명할 수 있는 벡터장 f^를 추정하는 것입니다:
dtdx(t)=f(t,x(t))
- 다변량 다항식 분포에서 벡터장의 각 성분 샘플링(최대 3차)
- 최대 3차원 ODE 시스템 지원
- 불규칙 격자에서 시스템을 시뮬레이션하고 노이즈를 추가하여 학습 데이터 생성
FIM-ODE는 세 가지 주요 구성 요소를 포함하는 DeepONet 신경 연산자 아키텍처를 채택합니다:
분기 네트워크(Branch Network):
- Transformer 인코더 사용
- 관측 데이터 D를 K(L−1)개의 E 차원 표현 D∈RE×K(L−1)로 인코딩
- 거의 모든 관측의 독립적 인코딩 유지
트렁크 네트워크(Trunk Network):
- 선형 매핑으로 위치 x∈RD를 h(x)∈RE로 인코딩
조합 네트워크(Combination Network):
- Transformer 디코더와 유사한 잔여 주의 계층 수열
- D를 키와 값으로, h(x)를 쿼리로 사용
- 최종 선형 투영으로 벡터장 추정 f^(x) 획득
감독 학습 목표 채택:
L(x,D,f)=∥f^(x)−f(x)∥2
관측값 근처의 샘플링된 점 x에서 예측 및 실제 벡터장을 일치시킵니다.
- 상황 내 학습 능력: 추가 학습이나 미세 조정 없이 새로운 ODE 시스템 처리
- 다중 궤적 융합: 여러 궤적을 동시에 처리하여 모든 가용 정보를 효과적으로 추출 및 결합
- 유연한 함수 근사: 신경 연산자는 희소하고 노이즈가 있는 데이터 처리에서 기호 회귀보다 더 유연합니다
- 국소-전역 균형: 관측점 근처에서 복잡한 예측을 제공하고, 관측에서 멀리 떨어진 영역에서는 간단하고 합리적인 예측을 제공합니다
- 학습 데이터: 60만 개의 합성 ODE 방정식, 약 2000만 매개변수 모델
- 테스트 데이터: 4000개의 다항식 벡터장 ODE(최대 3차, 최대 3차원)
- 궤적 설정: 각 ODE는 9개의 궤적 생성, 초기 상태는 N(0,1)에서 샘플링
- 관측 설정: 각 궤적 200개 관측점, 규칙 격자, 시간 간격 Δτ=0.05
R² 정확도 사용: R² 점수가 0.9보다 큰 백분율
ODEFormer: 5000만 방정식에서 학습된 사전학습된 신경 기호 회귀 방법, 8600만 매개변수 보유
- 재구성 작업: 상황 내 궤적에서 재구성 성능 측정
- 일반화 작업: 보유된 궤적에서 재구성 성능 측정
| 모델 | 재구성 작업 | 일반화 작업 |
|---|
| ODEFormer | 0.65 | 0.19 |
| FIM-ODE | 0.90 | 0.26 |
주요 발견:
- FIM-ODE는 두 작업 모두에서 ODEFormer를 크게 능가합니다
- 일반화 작업이 재구성 작업보다 더 도전적이며, 이는 직관과 일치합니다
- ODEFormer가 더 광범위한 분포에서 학습되고 더 많은 매개변수를 가지고 있음에도 불구하고 FIM-ODE가 더 나은 성능을 보입니다
그림 1은 다양한 수의 상황 내 궤적에서 FIM-ODE의 벡터장 추정을 보여줍니다:
- 단일 궤적: 관측에서 멀리 떨어진 위치에서 부정확한 추정
- 다중 궤적: 궤적 수가 증가함에 따라 FIM-ODE는 이러한 추정을 수정하여 더 큰 공간을 효과적으로 커버합니다
그림 2는 FIM-ODE와 ODEFormer의 벡터장 추정을 비교합니다:
- FIM-ODE:
- 국소: 관측점에서 궤적을 재구성하기 위해 복잡한 패턴 예측
- 전역: 관측점에서 멀리 떨어졌을 때 더 간단한 예측
- ODEFormer: 더 복잡한 벡터장을 예측하여 전역 패턴 예측이 복잡하고 단일 간단한 궤적의 지원이 부족합니다
두 모델의 차이는 다양한 벡터장 매개변수화에서 비롯됩니다:
- ODEFormer: (유리) 다항식 기호 방정식으로 제한되며, 희소하거나 노이즈가 있는 관측에서 기본적으로 간단한 표현으로 돌아가지 않을 수 있습니다
- FIM-ODE: 신경 연산자는 이러한 상황을 더 유연하게 처리할 수 있습니다
- 비모수 방법: 가우스 과정 등
- 기호 회귀 방법: 유전 알고리즘 또는 기타 최적화 방법 기반의 전통적 기호 회귀
- FIM-CTMC: 연속 시간 마르코프 체인 추론
- FIM-SDE: 확률 미분방정식 추론
- FIM-PP: 점 과정 추론
- 본 논문의 FIM-ODE는 ODE 추론에 대한 이 프레임워크의 확장입니다
ODEFormer: 시계열 관측을 기호 방정식으로 변환하는 사전학습된 신경 방법
- FIM-ODE는 Foundation Inference Models 프레임워크를 ODE 추론 문제로 성공적으로 확장합니다
- 합성 데이터셋에서 FIM-ODE는 기존 최첨단 방법인 ODEFormer를 크게 능가합니다
- 신경 연산자의 유연성으로 인해 FIM-ODE는 더 합리적인 전역 벡터장 예측을 제공할 수 있습니다
- 다중 궤적 처리 능력은 ODEFormer에 대한 FIM-ODE의 중요한 장점입니다
- 데이터 분포 제한: 현재 다항식 벡터장에서만 검증되었으며, 실제 시스템은 더 복잡할 수 있습니다
- 차원 제한: 현재 실험은 3차원 시스템으로 제한됩니다
- 평가 범위: 더 광범위한 ODE 시스템에서 검증이 필요합니다
- 계산 효율성: 논문에서 계산 복잡도 및 추론 속도를 자세히 논의하지 않습니다
- ODEBench 평가: 63개의 수작업으로 선택된 ODE를 포함하는 벤치마크 데이터셋에서 방법 비교
- 잠재 동역학 발견: 사전학습된 FIM-ODE를 사용하여 잠재 동역학 발견 탐색
- 응용 확장:
- 신경 개체군 동역학
- 화학 반응 동역학
- 자연어 콘텐츠 진화
- 방법의 혁신성: FIM 프레임워크를 ODE 추론에 처음 적용하며, 아키텍처 설계가 합리적입니다
- 기술적 장점:
- 다중 궤적 처리 능력
- 유연한 신경 연산자 아키텍처
- 상황 내 학습 능력
- 실험의 충분성:
- 강력한 기준선과의 직접 비교
- 다각적 분석(재구성 vs 일반화, 국소 vs 전역)
- 시각화 분석으로 이해도 향상
- 결과의 설득력: 모든 지표에서 비교 방법을 크게 능가합니다
- 실험 범위 제한:
- 합성 다항식 데이터에서만 검증
- 실제 데이터 검증 부족
- 차원 및 복잡도 제한
- 비교 불충분:
- ODEFormer와만 비교하며, 다른 전통 방법과의 비교 부족
- 계산 효율성 비교 없음
- 이론적 분석 부재:
- 수렴성 또는 일반화 능력에 대한 이론적 보장 부족
- 방법의 이론적 장점 분석 없음
- 기술 세부사항 부족:
- 학습 세부사항 설명 간략함
- 하이퍼파라미터 선택 설명 부족
- 학술적 기여:
- FIM 프레임워크의 응용 범위 확장
- ODE 추론을 위한 새로운 신경망 방법 제공
- 실용적 가치:
- 영점 샷 추론 능력이 실제 응용 잠재력을 가집니다
- 다중 궤적 처리가 실제 시나리오에서 더 실용적입니다
- 재현성:
- 기존 FIM-SDE 아키텍처 기반으로 기술 경로가 명확합니다
- 그러나 상세한 구현 세부사항이 부족합니다
- 과학 계산: 물리학, 생물학, 화학 등 분야의 동역학 시스템 모델링
- 공학 응용: 제어 시스템, 신호 처리 등 시스템 식별이 필요한 시나리오
- 데이터 희소 시나리오: 특히 관측 데이터가 제한적이거나 노이즈가 있는 경우에 적합
- 다중 궤적 데이터: 동일 시스템의 여러 관측 궤적이 있을 때 장점이 명확합니다
본 논문은 주로 다음의 핵심 연구를 참고합니다:
- d'Ascoli et al. (2024): ODEFormer의 원본 논문
- Seifner et al. (2025a): FIM-SDE 프레임워크
- Lu et al. (2021): DeepONet 신경 연산자
- Berghaus et al. (2024): FIM 프레임워크의 기초 연구
종합 평가: 이는 기술적으로 견고한 논문으로, Foundation Inference Models 프레임워크를 ODE 추론 문제로 성공적으로 확장합니다. 실험 범위는 제한적이지만 주어진 설정에서 명확한 장점을 보여줍니다. 이 연구는 과학 계산의 시스템 식별 문제에 가치 있는 새로운 방법을 제공하며 좋은 발전 전망을 가집니다.