2025-11-22T21:49:17.013774

Towards Foundation Inference Models that Learn ODEs In-Context

Mauel, Hinz, Seifner et al.
Ordinary differential equations (ODEs) describe dynamical systems evolving deterministically in continuous time. Accurate data-driven modeling of systems as ODEs, a central problem across the natural sciences, remains challenging, especially if the data is sparse or noisy. We introduce FIM-ODE (Foundation Inference Model for ODEs), a pretrained neural model designed to estimate ODEs zero-shot (i.e., in context) from sparse and noisy observations. Trained on synthetic data, the model utilizes a flexible neural operator for robust ODE inference, even from corrupted data. We empirically verify that FIM-ODE provides accurate estimates, on par with a neural state-of-the-art method, and qualitatively compare the structure of their estimated vector fields.
academic

상황 내 학습 ODE를 위한 기초 추론 모델을 향하여

기본 정보

  • 논문 ID: 2510.12650
  • 제목: Towards Foundation Inference Models that Learn ODEs In-Context
  • 저자: Maximilian Mauel, Manuel Hinz, Patrick Seifner, David Berghaus, Ramsés J. Sánchez
  • 분류: cs.LG (기계학습)
  • 발표 시간/학회: AI in Science (AIS), 2025, Copenhagen, Denmark
  • 논문 링크: https://arxiv.org/abs/2510.12650

초록

상미분방정식(ODE)은 연속 시간에서 결정론적 진화를 나타내는 동역학 시스템을 기술합니다. 데이터 기반 관점에서 ODE 시스템을 정확하게 모델링하는 것은 자연과학의 핵심 문제이지만, 데이터가 희소하거나 노이즈가 있는 경우에는 여전히 도전적입니다. 본 논문은 희소하고 노이즈가 있는 관측으로부터 ODE를 영점 샷(즉, 상황 내) 추정하도록 설계된 사전학습된 신경 모델인 FIM-ODE(Foundation Inference Model for ODEs)를 소개합니다. 이 모델은 합성 데이터에서 학습되며, 손상된 데이터에서도 작동하는 견고한 ODE 추론을 위해 유연한 신경 연산자를 활용합니다. 실험 검증은 FIM-ODE가 정확한 추정을 제공하며, 신경망 최첨단 방법과 비교할 수 있는 성능을 보이고, 벡터장 추정의 구조를 정성적으로 비교함을 보여줍니다.

연구 배경 및 동기

문제 정의

본 연구가 해결하려는 핵심 문제는 ODE 시스템 식별 문제입니다: 시계열 관측만으로부터 시스템을 가장 잘 설명하는 ODE(즉, 벡터장)를 추정하는 것입니다. 이는 뉴턴 운동 법칙에서 생물 시스템의 개체군 동역학, 기상학의 대기 대류에 이르기까지 자연과학에서 광범위한 응용을 가집니다.

문제의 중요성

  1. 광범위한 적용성: ODE는 물리학, 생물학, 기상학 등 여러 분야에서 기본 모델링 도구입니다
  2. 예측 능력: 정확한 ODE 모델은 잠재 현상(예: 고정점 또는 극한 순환)을 특성화하고 미래 상태를 예측할 수 있습니다
  3. 과학적 이해: ODE 모델은 시스템의 내재적 메커니즘과 동역학 특성을 이해하는 데 도움이 됩니다

기존 방법의 한계

  1. 전통적 방법: 비모수 방법 또는 기호 회귀 기반 방법은 희소하고 노이즈가 있는 데이터를 처리할 때 성능이 좋지 않습니다
  2. ODEFormer 제한: 신경 기호 회귀의 최신 방법이지만 단일 궤적만 처리할 수 있으며, 전역 벡터장 예측에서 불합리한 복잡한 패턴을 생성할 수 있습니다

연구 동기

저자들은 연속 시간 마르코프 체인, 확률 미분방정식 및 점 과정 추론에서 좋은 결과를 보인 Foundation Inference Models (FIMs) 프레임워크를 기반으로 ODE 추론을 위해 특별히 설계된 FIM-ODE 모델을 제안합니다.

핵심 기여

  1. FIM-ODE 모델 제안: Foundation Inference Models 프레임워크 기반의 첫 번째 ODE 추론 사전학습 모델
  2. 신경 연산자 아키텍처: 유연한 벡터장 추정을 위해 DeepONet 신경 연산자 채택
  3. 다중 궤적 처리 능력: 동일 시스템의 여러 궤적을 동시에 처리하여 추론 정확도 향상
  4. 우수한 성능: 합성 데이터셋에서 ODEFormer를 초과하며, R² 정확도는 각각 0.90 vs 0.65(재구성 작업)와 0.26 vs 0.19(일반화 작업)
  5. 더 합리적인 전역 예측: ODEFormer와 비교하여 관측점에서 멀리 떨어진 영역에서 더 간단하고 합리적인 벡터장 예측 제공

방법 상세 설명

작업 정의

시계열 관측 집합 D={yk}k=1K\mathcal{D} = \{y_k\}_{k=1}^K가 주어졌을 때, 여기서 각 수열 yk=[(tk1,yk1),,(tkL,ykL)]y_k = [(t_{k1}, y_{k1}), \ldots, (t_{kL}, y_{kL})]이고, 목표는 이러한 관측을 생성하는 ODE 시스템을 설명할 수 있는 벡터장 f^\hat{f}를 추정하는 것입니다:

dx(t)dt=f(t,x(t))\frac{dx(t)}{dt} = f(t, x(t))

모델 아키텍처

1. 합성 데이터 생성

  • 다변량 다항식 분포에서 벡터장의 각 성분 샘플링(최대 3차)
  • 최대 3차원 ODE 시스템 지원
  • 불규칙 격자에서 시스템을 시뮬레이션하고 노이즈를 추가하여 학습 데이터 생성

2. 신경 연산자 아키텍처(DeepONet)

FIM-ODE는 세 가지 주요 구성 요소를 포함하는 DeepONet 신경 연산자 아키텍처를 채택합니다:

분기 네트워크(Branch Network):

  • Transformer 인코더 사용
  • 관측 데이터 D\mathcal{D}K(L1)K(L-1)개의 EE 차원 표현 DRE×K(L1)\mathcal{D} \in \mathbb{R}^{E \times K(L-1)}로 인코딩
  • 거의 모든 관측의 독립적 인코딩 유지

트렁크 네트워크(Trunk Network):

  • 선형 매핑으로 위치 xRDx \in \mathbb{R}^Dh(x)REh(x) \in \mathbb{R}^E로 인코딩

조합 네트워크(Combination Network):

  • Transformer 디코더와 유사한 잔여 주의 계층 수열
  • D\mathcal{D}를 키와 값으로, h(x)h(x)를 쿼리로 사용
  • 최종 선형 투영으로 벡터장 추정 f^(x)\hat{f}(x) 획득

3. 학습 목표

감독 학습 목표 채택: L(x,D,f)=f^(x)f(x)2L(x, \mathcal{D}, f) = \|\hat{f}(x) - f(x)\|^2

관측값 근처의 샘플링된 점 xx에서 예측 및 실제 벡터장을 일치시킵니다.

기술 혁신 포인트

  1. 상황 내 학습 능력: 추가 학습이나 미세 조정 없이 새로운 ODE 시스템 처리
  2. 다중 궤적 융합: 여러 궤적을 동시에 처리하여 모든 가용 정보를 효과적으로 추출 및 결합
  3. 유연한 함수 근사: 신경 연산자는 희소하고 노이즈가 있는 데이터 처리에서 기호 회귀보다 더 유연합니다
  4. 국소-전역 균형: 관측점 근처에서 복잡한 예측을 제공하고, 관측에서 멀리 떨어진 영역에서는 간단하고 합리적인 예측을 제공합니다

실험 설정

데이터셋

  • 학습 데이터: 60만 개의 합성 ODE 방정식, 약 2000만 매개변수 모델
  • 테스트 데이터: 4000개의 다항식 벡터장 ODE(최대 3차, 최대 3차원)
  • 궤적 설정: 각 ODE는 9개의 궤적 생성, 초기 상태는 N(0,1)N(0,1)에서 샘플링
  • 관측 설정: 각 궤적 200개 관측점, 규칙 격자, 시간 간격 Δτ=0.05\Delta\tau = 0.05

평가 지표

R² 정확도 사용: R² 점수가 0.9보다 큰 백분율

비교 방법

ODEFormer: 5000만 방정식에서 학습된 사전학습된 신경 기호 회귀 방법, 8600만 매개변수 보유

실험 작업

  1. 재구성 작업: 상황 내 궤적에서 재구성 성능 측정
  2. 일반화 작업: 보유된 궤적에서 재구성 성능 측정

실험 결과

주요 결과

모델재구성 작업일반화 작업
ODEFormer0.650.19
FIM-ODE0.900.26

주요 발견:

  • FIM-ODE는 두 작업 모두에서 ODEFormer를 크게 능가합니다
  • 일반화 작업이 재구성 작업보다 더 도전적이며, 이는 직관과 일치합니다
  • ODEFormer가 더 광범위한 분포에서 학습되고 더 많은 매개변수를 가지고 있음에도 불구하고 FIM-ODE가 더 나은 성능을 보입니다

다중 궤적 상황 내 분석

그림 1은 다양한 수의 상황 내 궤적에서 FIM-ODE의 벡터장 추정을 보여줍니다:

  • 단일 궤적: 관측에서 멀리 떨어진 위치에서 부정확한 추정
  • 다중 궤적: 궤적 수가 증가함에 따라 FIM-ODE는 이러한 추정을 수정하여 더 큰 공간을 효과적으로 커버합니다

국소 및 전역 예측 비교

그림 2는 FIM-ODE와 ODEFormer의 벡터장 추정을 비교합니다:

  • FIM-ODE:
    • 국소: 관측점에서 궤적을 재구성하기 위해 복잡한 패턴 예측
    • 전역: 관측점에서 멀리 떨어졌을 때 더 간단한 예측
  • ODEFormer: 더 복잡한 벡터장을 예측하여 전역 패턴 예측이 복잡하고 단일 간단한 궤적의 지원이 부족합니다

구조 차이 분석

두 모델의 차이는 다양한 벡터장 매개변수화에서 비롯됩니다:

  • ODEFormer: (유리) 다항식 기호 방정식으로 제한되며, 희소하거나 노이즈가 있는 관측에서 기본적으로 간단한 표현으로 돌아가지 않을 수 있습니다
  • FIM-ODE: 신경 연산자는 이러한 상황을 더 유연하게 처리할 수 있습니다

관련 연구

전통적 ODE 추론 방법

  1. 비모수 방법: 가우스 과정 등
  2. 기호 회귀 방법: 유전 알고리즘 또는 기타 최적화 방법 기반의 전통적 기호 회귀

Foundation Inference Models 프레임워크

  • FIM-CTMC: 연속 시간 마르코프 체인 추론
  • FIM-SDE: 확률 미분방정식 추론
  • FIM-PP: 점 과정 추론
  • 본 논문의 FIM-ODE는 ODE 추론에 대한 이 프레임워크의 확장입니다

신경 기호 회귀

ODEFormer: 시계열 관측을 기호 방정식으로 변환하는 사전학습된 신경 방법

결론 및 논의

주요 결론

  1. FIM-ODE는 Foundation Inference Models 프레임워크를 ODE 추론 문제로 성공적으로 확장합니다
  2. 합성 데이터셋에서 FIM-ODE는 기존 최첨단 방법인 ODEFormer를 크게 능가합니다
  3. 신경 연산자의 유연성으로 인해 FIM-ODE는 더 합리적인 전역 벡터장 예측을 제공할 수 있습니다
  4. 다중 궤적 처리 능력은 ODEFormer에 대한 FIM-ODE의 중요한 장점입니다

한계

  1. 데이터 분포 제한: 현재 다항식 벡터장에서만 검증되었으며, 실제 시스템은 더 복잡할 수 있습니다
  2. 차원 제한: 현재 실험은 3차원 시스템으로 제한됩니다
  3. 평가 범위: 더 광범위한 ODE 시스템에서 검증이 필요합니다
  4. 계산 효율성: 논문에서 계산 복잡도 및 추론 속도를 자세히 논의하지 않습니다

향후 방향

  1. ODEBench 평가: 63개의 수작업으로 선택된 ODE를 포함하는 벤치마크 데이터셋에서 방법 비교
  2. 잠재 동역학 발견: 사전학습된 FIM-ODE를 사용하여 잠재 동역학 발견 탐색
  3. 응용 확장:
    • 신경 개체군 동역학
    • 화학 반응 동역학
    • 자연어 콘텐츠 진화

심층 평가

장점

  1. 방법의 혁신성: FIM 프레임워크를 ODE 추론에 처음 적용하며, 아키텍처 설계가 합리적입니다
  2. 기술적 장점:
    • 다중 궤적 처리 능력
    • 유연한 신경 연산자 아키텍처
    • 상황 내 학습 능력
  3. 실험의 충분성:
    • 강력한 기준선과의 직접 비교
    • 다각적 분석(재구성 vs 일반화, 국소 vs 전역)
    • 시각화 분석으로 이해도 향상
  4. 결과의 설득력: 모든 지표에서 비교 방법을 크게 능가합니다

부족한 점

  1. 실험 범위 제한:
    • 합성 다항식 데이터에서만 검증
    • 실제 데이터 검증 부족
    • 차원 및 복잡도 제한
  2. 비교 불충분:
    • ODEFormer와만 비교하며, 다른 전통 방법과의 비교 부족
    • 계산 효율성 비교 없음
  3. 이론적 분석 부재:
    • 수렴성 또는 일반화 능력에 대한 이론적 보장 부족
    • 방법의 이론적 장점 분석 없음
  4. 기술 세부사항 부족:
    • 학습 세부사항 설명 간략함
    • 하이퍼파라미터 선택 설명 부족

영향력

  1. 학술적 기여:
    • FIM 프레임워크의 응용 범위 확장
    • ODE 추론을 위한 새로운 신경망 방법 제공
  2. 실용적 가치:
    • 영점 샷 추론 능력이 실제 응용 잠재력을 가집니다
    • 다중 궤적 처리가 실제 시나리오에서 더 실용적입니다
  3. 재현성:
    • 기존 FIM-SDE 아키텍처 기반으로 기술 경로가 명확합니다
    • 그러나 상세한 구현 세부사항이 부족합니다

적용 시나리오

  1. 과학 계산: 물리학, 생물학, 화학 등 분야의 동역학 시스템 모델링
  2. 공학 응용: 제어 시스템, 신호 처리 등 시스템 식별이 필요한 시나리오
  3. 데이터 희소 시나리오: 특히 관측 데이터가 제한적이거나 노이즈가 있는 경우에 적합
  4. 다중 궤적 데이터: 동일 시스템의 여러 관측 궤적이 있을 때 장점이 명확합니다

참고문헌

본 논문은 주로 다음의 핵심 연구를 참고합니다:

  • d'Ascoli et al. (2024): ODEFormer의 원본 논문
  • Seifner et al. (2025a): FIM-SDE 프레임워크
  • Lu et al. (2021): DeepONet 신경 연산자
  • Berghaus et al. (2024): FIM 프레임워크의 기초 연구

종합 평가: 이는 기술적으로 견고한 논문으로, Foundation Inference Models 프레임워크를 ODE 추론 문제로 성공적으로 확장합니다. 실험 범위는 제한적이지만 주어진 설정에서 명확한 장점을 보여줍니다. 이 연구는 과학 계산의 시스템 식별 문제에 가치 있는 새로운 방법을 제공하며 좋은 발전 전망을 가집니다.