2025-11-13T04:10:10.339085

MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series

Hsieh, Chien, Huang et al.

Clinical time series derived from electronic health records (EHRs) are inherently irregular, with asynchronous sampling, missing values, and heterogeneous feature dynamics. While numerical laboratory measurements are highly informative, existing embedding strategies usually combine feature identity and value embeddings through additive operations, which constrains their ability to capture value-dependent feature interactions. We propose MedFuse, a framework for irregular clinical time series centered on the MuFuse (Multiplicative Embedding Fusion) module. MuFuse fuses value and feature embeddings through multiplicative modulation, preserving feature-specific information while modeling higher-order dependencies across features. Experiments on three real-world datasets covering both intensive and chronic care show that MedFuse consistently outperforms state-of-the-art baselines on key predictive tasks. Analysis of the learned representations further demonstrates that multiplicative fusion enhances expressiveness and supports cross-dataset pretraining. These results establish MedFuse as a generalizable approach for modeling irregular clinical time series.

academic

MedFuse: 불규칙 임상 시계열을 위한 승법 임베딩 융합

기본 정보

논문 ID: 2511.09247
제목: MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series
저자: Yi-Hsien Hsieh, Ta-Jung Chien, Chun-Kai Huang, Shao-Hua Sun, Che Lin (국립대만대학교)
분류: cs.AI
발표 시간: 2025년 11월 12일 (arXiv 제출)
논문 상태: 논문 제출 중
논문 링크: https://arxiv.org/abs/2511.09247

초록

전자건강기록(EHR)의 임상 시계열은 비동기 샘플링, 결측값, 이질적 특성 동역학을 포함한 내재적 불규칙성을 가지고 있습니다. 기존의 임베딩 전략은 일반적으로 가법 연산을 통해 특성 신원과 수치 임베딩을 결합하므로, 값 의존적 특성 상호작용을 포착하는 능력이 제한됩니다. 본 논문은 MedFuse 프레임워크를 제안하며, 그 핵심은 MuFuse(승법 임베딩 융합) 모듈입니다. MuFuse는 승법 변조를 통해 수치 및 특성 임베딩을 융합하여 특성별 정보를 보존하면서 고차 의존성을 모델링합니다. 세 개의 실제 데이터셋에 대한 실험은 MedFuse가 주요 예측 작업에서 최첨단 기준선을 지속적으로 능가함을 보여줍니다. 학습된 표현의 분석은 승법 융합이 표현력을 향상시키고 데이터셋 간 사전학습을 지원함을 추가로 증명합니다.

연구 배경 및 동기

1. 핵심 문제

임상 시계열 모델링은 세 가지 주요 과제에 직면합니다:

불규칙 샘플링: 생명 징후는 자주 모니터링될 수 있지만, 실험실 검사는 임상적 필요에 따라서만 수행되며, 환자는 예정된 방문을 놓칠 수 있습니다
높은 결측률: 데이터셋의 평균 결측률이 73.77%-88.14%에 달합니다
수치 표현의 어려움: 실험실 수치는 연속 범위에서 복잡한 정보를 인코딩하므로 원칙적으로 무한히 많은 표현이 필요합니다

2. 문제의 중요성

임상 시계열은 의료 예측 및 모니터링 작업의 핵심입니다
효과적인 모델링은 ICU 사망률 예측, 만성질환 위험 평가 등 중요한 의료 작업에 필수적입니다
불규칙성과 결측값은 기존 방법의 직접 적용을 어렵게 합니다

3. 기존 방법의 한계

기존의 EVAT(각 값을 토큰으로) 방법은 주로 가법 융합을 채택합니다:

수치 임베딩을 특성 임베딩의 가법 오프셋으로 취급
표현력 제한: 값 의존적 비선형 상호작용을 포착하기 어려움
임상 의미 손실: 실험실 검사의 작은 편차와 큰 편차의 질적 차이를 구별할 수 없음(예: 크레아티닌의 경미한 상승 vs 급격한 상승)

4. 연구 동기

승법 융합은 다른 분야에서 가법 또는 연결보다 더 강한 의미 통합을 제공하는 것으로 입증되었습니다
임상 데이터의 특수성(예: 의학적 동등성: 서로 다른 이상 편차가 동일한 임상 위험에 대응할 수 있음)은 더 유연한 융합 메커니즘이 필요합니다
보간 없이 불규칙 관측을 직접 처리할 수 있는 범용 프레임워크가 필요합니다

핵심 기여

승법 값-특성 융합: 임베딩 어휘를 확장하지 않고 값 조건 승법 융합을 통해 비선형, 특성별 변조를 수행하는 MuFuse 모듈을 제안합니다
범용 무보간 프레임워크: MuFuse를 기반으로 MedFuse를 구축하여 (특성, 수치, 타임스탬프) 삼중항 토큰화 방식으로 불규칙 측정을 직접 모델링합니다
포괄적 검증 및 이전 가능성:
- ICU 및 만성질환 데이터셋에서 강력한 기준선을 지속적으로 능가
- 소거 연구는 승법이 가법 융합보다 우수함을 확인
- 이전 실험은 학습된 특성 임베딩이 데이터셋 간에 재사용될 수 있음을 보여줍니다
이론적 통찰: 최근 SOTA 방법인 SCANE이 실제로 MuFuse의 특수한 경우(d'=1)임을 증명하여 더 범용적인 융합 메커니즘을 확립합니다

방법 상세 설명

작업 정의

관측 집합 O = {(f, v, t)}이 주어질 때:

입력: f ∈ {1,...,F} 특성 신원(예: 실험실 검사 유형), v ∈ ℝ 기록된 값, t ∈ ℝ⁺ 타임스탬프
출력: 예측 작업 레이블(예: ICU 사망률, HCC 발병 위험)
제약: 실제 관측된 기록만 처리(Mf,t = 1), 결측값 보간 불필요

모델 아키텍처

전체 아키텍처(MedFuse)

관측 삼중항 (f,v,t) 
    ↓
MuFuse 임베딩 모듈
    ├─ 특성 신원 임베딩: ef ∈ ℝᵈ
    ├─ 수치 임베딩: ev ∈ ℝᵈ'
    └─ 승법 융합: ef,v = ef ⊙ ev
    ↓
시간 인코딩 가법: ef,v,t = ef,v + pt
    ↓
Transformer 인코더(N층)
    ↓
선형 분류 헤드 + Softmax

핵심 모듈: MuFuse

1. 특성 신원 임베딩

ef ∈ ℝᵈ  (표준 조회 테이블)

2. 수치 임베딩

zv = φ(v) ∈ ℝᵈ'           # 공유 비선형 프로젝터
ev|f = γf ⊙ zv + βf       # 특성별 아핀 변환

여기서 γf, βf ∈ ℝᵈ'는 학습 가능한 특성별 매개변수입니다

3. 승법 융합

d' = d일 때:

MuFuse(ef, ev) = ef ⊙ ev = ef,v

d ≠ d'일 때(d = d' × k라고 가정):

ef를 k개의 연속 블록으로 분할: ef = e⁽¹⁾f; e⁽²⁾f; ...; e⁽ᵏ⁾f
ev의 각 항목은 시그모이드를 통해 게이트로 작동: g(vj) = σ(vj) ∈ (0,1)
스칼라 게이트가 해당 블록에 적용: e⁽ⁱ⁾f,v = g(vj) · e⁽ⁱ⁾f

4. 분류 특성 처리

ef,c = Wcat · Concat(ef, ec) ∈ ℝᵈ

5. 시간 임베딩(정현 위치 인코딩)

pt[2i] = sin(t/ωi)
pt[2i+1] = cos(t/ωi)
ef,v,t = ef,v + pt

기술 혁신 포인트

1. 승법 융합의 장점

수학적 표현:

MuFuse: ef,v = ef ⊙ ev = ef ⊙ (1 + e'v) = ef + ef ⊙ e'v
가법 융합: ef,v = ef + ev

MuFuse는 상호작용 항 ef ⊙ e'v를 도입하여 수치 변조가 특성 신원에 의존하도록 합니다
가법 융합에서 ev는 ef의 영향을 받지 않는 독립 항입니다

2. 의학적 동등성 모델링(마스킹 및 축소)

임상 시나리오: 저나트륨혈증과 고나트륨혈증 모두 발작을 유발할 수 있습니다

가법 융합: 서로 다른 값 범위에 동일한 임베딩을 할당해야 하므로 유연성이 떨어집니다
MuFuse: 요소별 승법을 통해 ev가 다르더라도 ef를 마스크로 사용하여 서로 다른 임베딩을 동일한 표현으로 축소할 수 있습니다

3. SCANE과의 관계

SCANE은 관측값 스칼라에 특성 임베딩을 직접 곱하므로, 실제로는 MuFuse의 특수한 경우(d'=1, 값 변환 없음)입니다. MuFuse는 유연한 차원 선택과 비선형 프로젝션을 통해 더 강한 표현력을 제공합니다.

4. 시간 인코딩이 가법을 사용하는 이유는?

실험은 시간 인코딩에 가법이 승법보다 우수함을 보여줍니다(AUPRC: 0.6717 vs 0.6495):

가법: 정현 인코딩의 AC 신호 진폭과 스펙트럼 패턴을 보존하며, 특성 임베딩은 DC 오프셋으로만 작용합니다
승법: AC 진폭과 스펙트럼 구성을 변경하여 순서 있는 위치 인코딩의 규칙성 표현을 파괴합니다

실험 설정

데이터셋

데이터셋	유형	샘플 수	양성 비율	결측률	관측 윈도우	수치 특성	분류 특성
P12	ICU 사망률	11,988	14.2%	73.77%	48시간/2시간 윈도우	40	2
MI3	ICU 사망률	52,871	14.0%	88.14%	48시간/2시간 윈도우	128	4
HCC	간암 발병	34,296	4.6%	74.64%	1년/90일 윈도우	30	8

전처리 프로토콜:

ICU 작업: 48시간 관측 윈도우, 2시간 집계(24개 타임스탬프)
HCC 작업: 1년 관측 윈도우, 90일 집계(4개 타임스탬프)
수치 변수는 중앙값, 분류 변수는 최빈값 사용
보간 없음, 관측값만으로 토큰 생성

평가 지표

주요 지표: AUPRC(정밀도-재현율 곡선 아래 면적) - 클래스 불균형에 더 적합
보조 지표: AUROC, 정확도(ICU) / c-지수(HCC)
통계적 유의성: 95% 신뢰 구간, 1000회 부트스트랩으로 추정

비교 방법

전통적 앙상블: Random Forest, XGBoost
범용 시계열 모델: Transformer 인코더, TCN
임상 시계열 전용:
- SAnD: 마스크 자기주의
- mTAN: 연속 시간 주의
- STraTS: 자기감독 삼중항 학습
- SUMMIT(SCANE): 현재 SOTA, 수치 스케일링 메커니즘

구현 세부사항

최적화기: Adam
학습률: 3e-5(MedFuse), 5e-4(대부분의 기준선)
하이퍼파라미터 튜닝: Optuna(검증 집합)
조기 중단: 30-380 에포크(데이터셋 의존)
모델 차원: d=144, d' 변화(소거 연구)
Transformer 층 수: 32층(MedFuse)

실험 결과

주요 결과

표1: 성능 비교(최고 굵게, 차고 밑줄)

방법	MI3 AUPRC	P12 AUPRC	HCC AUPRC
Random Forest	0.4367±0.0517	0.4805±0.0533	0.3934±0.0583
XGBoost	0.4553±0.0527	0.4980±0.0544	0.3887±0.0592
Transformer	0.5074±0.0510	0.5435±0.0560	0.4139±0.0571
SAnD	0.5463±0.0462	0.4615±0.0598	0.3769±0.0337
mTAN	0.5536±0.0359	0.4991±0.0521	0.4545±0.0264
STraTS	0.5886±0.0546	0.5206±0.0534	0.4270±0.0186
SUMMIT	0.6328±0.0277	0.5504±0.0563	0.4553±0.0577
MedFuse	0.6574±0.0270	0.5612±0.0558	0.4595±0.0556

주요 발견:

MedFuse는 세 데이터셋 모두에서 주요 지표 AUPRC에서 최고 성능을 달성합니다
SUMMIT 대비 개선: MI3 +3.9%, P12 +2.0%, HCC +0.9%
AUROC 및 정확도도 MI3에서 최고(0.9078 및 0.9153)

소거 실험

표2: 특성-값 융합 전략 소거(P12)

방법	AUPRC	AUROC	정확도
MuFuse(승법)	0.5612±0.0558	0.8686±0.0190	0.8837±0.0558
가법	0.5317±0.0546	0.8549±0.0205	0.8754±0.0131
연결	0.5291±0.0564	0.8518±0.0204	0.8779±0.0129

결론: 승법 융합은 가법 대비 AUPRC에서 5.5% 개선, 값 조건 승법 변조의 효과성을 증명합니다

차원 분할 계수 k의 영향

실험 설정: d=144 고정, k 변화(즉, d'=d/k)

P12 결과:

k=1일 때(d'=144): AUPRC 0.539
k=9일 때(d'=16): AUPRC 0.561(최적)
k=144일 때(d'=1, SCANE 동등): AUPRC 0.548

통찰:

중간 차원 분할이 최적 균형을 제공합니다
과도히 거친 경우(k 작음): 값 효과 매개변수화 부족
과도히 세밀한 경우(k 큼): 특성-값 상호작용 과적합
광송 Hadamard 곱의 유연한 정렬 설계를 검증합니다

데이터셋 간 이전 학습

실험 프로토콜:

소스 데이터셋 사전학습
겹치는 특성(F∩)의 특성 신원 임베딩만 이전
P12와 MI3는 25개 특성 겹침(P12의 59.5%, MI3의 18.9%)

표3: 데이터셋 간 이전 결과

이전 방향	AUPRC	개선
MI3→P12(대→소)	0.5454	+1.7%
P12 무작위 학습	0.5361	기준선
MI3 부분표본→P12	0.5276	-1.6%
P12→MI3(소→대)	0.6422	-3.3%
MI3 무작위 학습	0.6639	기준선

주요 발견:

소스 데이터셋 규모가 핵심: 대규모 데이터셋→소규모 데이터셋에서 긍정적 이전
데이터셋 신원은 주요 인자가 아님: MI3 부분표본→P12도 여전히 음의 이전
특성 임베딩은 재사용 가능한, 코호트 무관의 의미를 포착합니다

임베딩 시각화

t-SNE 시각화(HCC 데이터셋):

융합 전: 동일 특성 유형의 토큰 클러스터링이 명확합니다
Transformer 첫 번째 층 후: 클러스터링 특성이 유지되어 MuFuse의 견고성을 증명합니다

결론 및 논의

주요 결론

승법 융합이 가법보다 우수: MuFuse는 값 조건 변조를 통해 특성별 비선형 상호작용을 실현합니다
범용 무보간 프레임워크: MedFuse는 ICU 및 만성질환 시나리오 모두에서 효과적입니다
이전 가능성: 학습된 특성 임베딩은 데이터셋 간 적응을 지원합니다(충분한 소스 데이터 규모 필요)
이론적 통일: MuFuse는 SCANE을 일반화하여 더 명확한 설계 원리를 제공합니다

한계

계산 비용: 32층 Transformer는 실시간 응용을 제한할 수 있습니다
이전 조건: 데이터셋 간 이전은 대규모 소스 데이터셋이 필요합니다
특성 겹침: 이전은 충분한 특성 겹침에 의존합니다(본 실험 18.9%-59.5%)
해석 가능성: 승법 상호작용의 임상 의미는 추가 탐구가 필요합니다
다중모달 확장: 현재 수치 및 분류 특성만 처리하며, 텍스트, 이미지는 미포함

향후 방향

대규모 다중모달 사전학습: 임상 노트, 의료 영상으로 확장
인과 추론: 반사실 분석을 통합하여 해석 가능성 향상
신뢰할 수 있는 임상 의사결정 지원: 실제 임상 환경에 배포
효율적 아키텍처: 자원 제한 시나리오를 위한 경량 변형 탐색
시간 인코딩 개선: 불규칙 샘플링에 더 적합한 위치 인코딩 연구

심층 평가

장점

1. 방법 혁신성(★★★★★)

핵심 혁신 견고함: 승법 융합은 명확한 이론적 동기를 가집니다(의학적 동등성, 상호작용 항)
SOTA 일반화: SCANE이 특수한 경우(d'=1)임을 우아하게 증명하여 통일 프레임워크 제공
설계 유연성: 광송 Hadamard 곱은 임의의 차원 비율을 지원합니다

2. 실험 충분성(★★★★★)

다양한 데이터셋: ICU(급성) 및 HCC(만성) 시나리오 포함
포괄적 소거: 융합 전략, 차원 계수, 이전 학습 세 가지 차원
통계적 엄밀성: 부트스트랩 신뢰 구간, 다중 지표 평가
시각화 분석: t-SNE로 임베딩 품질 검증

3. 작성 명확성(★★★★☆)

구조가 명확하고 동기 설명이 충분합니다
수학 표현이 정확합니다(공식 4-11)
부록이 상세합니다(하이퍼파라미터, 데이터셋 통계, 추가 실험)
경미한 부족: 일부 임상 용어는 더 많은 설명이 필요할 수 있습니다

4. 실용적 가치(★★★★☆)

보간 불필요로 전처리 복잡도 감소
코드 미공개(제출 중)이지만 방법 설명이 상세합니다
계산 비용이 높습니다(32층 Transformer)

부족점

1. 방법 한계

시간 인코딩 모순: 승법 융합이 시간 인코딩에 부적합함을 인정하지만 심층 이론적 설명 부족
차원 선택: k의 최적값이 데이터셋에 의존하며, 자동 선택 메커니즘 부족
분류 특성 처리: 단순 연결+선형 변환으로, 승법 융합의 잠재력을 충분히 탐색하지 않음

2. 실험 결함

이전 실험 제한: 두 ICU 데이터셋 간에만 테스트, HCC 미참여
특성 겹침 낮음: MI3 측에서 18.9% 특성 겹침만으로 이전 잠재력 평가 제한
계산 비용 분석 부재: 학습 시간, 메모리 사용량 미보고
하이퍼파라미터 민감성: 서로 다른 데이터셋에서 층 수를 크게 조정 필요(1-32층)

3. 분석 부족

특성 상호작용 시각화: 구체적 임상 특성의 상호작용 분석 부족
실패 사례 분석: 모델 예측 오류 상황 미논의
SCANE 대비 부족: 특수한 경우임을 증명했지만 다양한 d' 설정에서 직접 성능 비교 미실시

4. 재현성 문제

코드 미공개: 결과 검증에 영향
비공개 데이터셋: HCC 데이터셋 공개 불가
무작위 시드: 고정 여부 명확하지 않음

영향력 평가

분야에 대한 기여(★★★★☆)

이론적 기여: EHR 모델링에서 승법 융합의 이론적 기초 수립
방법적 기여: 다른 불규칙 시계열로 확장 가능한 범용 프레임워크 제공
실증적 기여: 표준 벤치마크에서 새로운 SOTA 수립

실용적 가치(★★★☆☆)

장점: 보간 불필요, 불규칙 데이터 직접 처리
제한: 계산 비용 높음, 이전을 위해 대규모 소스 데이터셋 필요
적용 시나리오: 충분한 계산 자원이 있는 연구 기관 및 대형 의료 센터에 적합

재현성(★★★☆☆)

방법 설명 상세: 공식과 아키텍처가 명확합니다
코드 부재: 재현성 저하
데이터 부분 공개: P12 및 MI3 공개, HCC 비공개

적용 시나리오

최적 적합

높은 결측률 시나리오(>70%): 보간 불필요의 장점이 명확합니다
불규칙 샘플링: ICU 모니터링, 외래 추적 등 비동기 데이터
수치 특성 주도: 실험실 검사, 생명 징후 등 연속 측정
사전학습 필요: 대규모 소스 데이터셋 활용 가능

부적합

실시간 예측: 32층 Transformer 추론 지연이 높습니다
소표본 시나리오: 이전 학습이 대규모 소스 데이터 필요
순수 분류 특성: 승법 융합 장점이 명확하지 않습니다
자원 제한 환경: 엣지 디바이스, 모바일 헬스 응용

개선 제안

자동 차원 선택: k를 자동으로 결정하는 방법 개발(예: 신경 아키텍처 탐색)
경량 변형: 지식 증류 또는 가지치기로 계산 비용 감소
다중모달 확장: 임상 노트, 의료 영상 통합
해석 가능성 강화: 특성 상호작용의 임상 의미 설명 제공
코드 및 모델 공개: 커뮤니티 검증 및 응용 촉진

참고문헌(정선)

Huang et al. (2024): SCANE/SUMMIT - 본 논문이 개선한 SOTA 기준선
Chrysos et al. (2025): 심층 학습에서 Hadamard 곱의 종합 검토
Tipirneni & Reddy (2022): STraTS - EVAT 패러다임의 대표 연구
Shukla & Marlin (2021): mTAN - 연속 시간 주의 메커니즘
Vaswani et al. (2017): Transformer - 본 논문 백본 아키텍처
Johnson et al. (2016): MIMIC-III 데이터베이스 - 주요 평가 데이터셋

요약

MedFuse는 임상 시계열 모델링 분야에서 실질적 기여를 하는 논문입니다. 핵심 혁신인 승법 임베딩 융합(MuFuse)은 이론적으로 우아하게 기존 SOTA 방법을 일반화할 뿐만 아니라, 여러 실제 데이터셋에서 일관된 성능 개선을 달성합니다. 논문의 실험 설계는 주요 성능 비교에서 소거 연구, 차원 분석, 이전 학습까지 체계적으로 방법의 효과성을 검증합니다.

특히 주목할 점은 의학적 동등성(서로 다른 이상 편차가 동일한 임상 위험에 대응할 수 있는 현상)에 대한 통찰입니다. 승법 융합의 마스킹 효과를 통해 이를 자연스럽게 모델링할 수 있다는 것은 저자의 임상 분야에 대한 깊은 이해를 보여줍니다.

그러나 논문에는 몇 가지 부족점도 있습니다: 계산 비용이 높고, 이전 학습 실험이 제한적이며, 코드가 공개되지 않았습니다. 이에도 불구하고 MedFuse는 불규칙 임상 시계열 모델링을 위한 강력하고 범용적인 프레임워크를 제공하며, 의료 AI 분야의 발전을 추진하는 데 중요한 의미가 있습니다. 향후 다중모달 확장, 해석 가능성, 실제 임상 배포 측면의 진전을 기대합니다.

추천 지수: 8.5/10