Clinical time series derived from electronic health records (EHRs) are inherently irregular, with asynchronous sampling, missing values, and heterogeneous feature dynamics. While numerical laboratory measurements are highly informative, existing embedding strategies usually combine feature identity and value embeddings through additive operations, which constrains their ability to capture value-dependent feature interactions. We propose MedFuse, a framework for irregular clinical time series centered on the MuFuse (Multiplicative Embedding Fusion) module. MuFuse fuses value and feature embeddings through multiplicative modulation, preserving feature-specific information while modeling higher-order dependencies across features. Experiments on three real-world datasets covering both intensive and chronic care show that MedFuse consistently outperforms state-of-the-art baselines on key predictive tasks. Analysis of the learned representations further demonstrates that multiplicative fusion enhances expressiveness and supports cross-dataset pretraining. These results establish MedFuse as a generalizable approach for modeling irregular clinical time series.
논문 ID : 2511.09247제목 : MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series저자 : Yi-Hsien Hsieh, Ta-Jung Chien, Chun-Kai Huang, Shao-Hua Sun, Che Lin (국립대만대학교)분류 : cs.AI발표 시간 : 2025년 11월 12일 (arXiv 제출)논문 상태 : 논문 제출 중논문 링크 : https://arxiv.org/abs/2511.09247 전자건강기록(EHR)의 임상 시계열은 비동기 샘플링, 결측값, 이질적 특성 동역학을 포함한 내재적 불규칙성을 가지고 있습니다. 기존의 임베딩 전략은 일반적으로 가법 연산을 통해 특성 신원과 수치 임베딩을 결합하므로, 값 의존적 특성 상호작용을 포착하는 능력이 제한됩니다. 본 논문은 MedFuse 프레임워크를 제안하며, 그 핵심은 MuFuse(승법 임베딩 융합) 모듈입니다. MuFuse는 승법 변조를 통해 수치 및 특성 임베딩을 융합하여 특성별 정보를 보존하면서 고차 의존성을 모델링합니다. 세 개의 실제 데이터셋에 대한 실험은 MedFuse가 주요 예측 작업에서 최첨단 기준선을 지속적으로 능가함을 보여줍니다. 학습된 표현의 분석은 승법 융합이 표현력을 향상시키고 데이터셋 간 사전학습을 지원함을 추가로 증명합니다.
임상 시계열 모델링은 세 가지 주요 과제에 직면합니다:
불규칙 샘플링 : 생명 징후는 자주 모니터링될 수 있지만, 실험실 검사는 임상적 필요에 따라서만 수행되며, 환자는 예정된 방문을 놓칠 수 있습니다높은 결측률 : 데이터셋의 평균 결측률이 73.77%-88.14%에 달합니다수치 표현의 어려움 : 실험실 수치는 연속 범위에서 복잡한 정보를 인코딩하므로 원칙적으로 무한히 많은 표현이 필요합니다임상 시계열은 의료 예측 및 모니터링 작업의 핵심입니다 효과적인 모델링은 ICU 사망률 예측, 만성질환 위험 평가 등 중요한 의료 작업에 필수적입니다 불규칙성과 결측값은 기존 방법의 직접 적용을 어렵게 합니다 기존의 EVAT(각 값을 토큰으로) 방법은 주로 가법 융합 을 채택합니다:
수치 임베딩을 특성 임베딩의 가법 오프셋으로 취급 표현력 제한 : 값 의존적 비선형 상호작용을 포착하기 어려움임상 의미 손실 : 실험실 검사의 작은 편차와 큰 편차의 질적 차이를 구별할 수 없음(예: 크레아티닌의 경미한 상승 vs 급격한 상승)승법 융합은 다른 분야에서 가법 또는 연결보다 더 강한 의미 통합을 제공하는 것으로 입증되었습니다 임상 데이터의 특수성(예: 의학적 동등성: 서로 다른 이상 편차가 동일한 임상 위험에 대응할 수 있음)은 더 유연한 융합 메커니즘이 필요합니다 보간 없이 불규칙 관측을 직접 처리할 수 있는 범용 프레임워크가 필요합니다 승법 값-특성 융합 : 임베딩 어휘를 확장하지 않고 값 조건 승법 융합을 통해 비선형, 특성별 변조를 수행하는 MuFuse 모듈을 제안합니다범용 무보간 프레임워크 : MuFuse를 기반으로 MedFuse를 구축하여 (특성, 수치, 타임스탬프) 삼중항 토큰화 방식으로 불규칙 측정을 직접 모델링합니다포괄적 검증 및 이전 가능성 :ICU 및 만성질환 데이터셋에서 강력한 기준선을 지속적으로 능가 소거 연구는 승법이 가법 융합보다 우수함을 확인 이전 실험은 학습된 특성 임베딩이 데이터셋 간에 재사용될 수 있음을 보여줍니다 이론적 통찰 : 최근 SOTA 방법인 SCANE이 실제로 MuFuse의 특수한 경우(d'=1)임을 증명하여 더 범용적인 융합 메커니즘을 확립합니다관측 집합 O = {(f, v, t)}이 주어질 때:
입력 : f ∈ {1,...,F} 특성 신원(예: 실험실 검사 유형), v ∈ ℝ 기록된 값, t ∈ ℝ⁺ 타임스탬프출력 : 예측 작업 레이블(예: ICU 사망률, HCC 발병 위험)제약 : 실제 관측된 기록만 처리(Mf,t = 1), 결측값 보간 불필요관측 삼중항 (f,v,t)
↓
MuFuse 임베딩 모듈
├─ 특성 신원 임베딩: ef ∈ ℝᵈ
├─ 수치 임베딩: ev ∈ ℝᵈ'
└─ 승법 융합: ef,v = ef ⊙ ev
↓
시간 인코딩 가법: ef,v,t = ef,v + pt
↓
Transformer 인코더(N층)
↓
선형 분류 헤드 + Softmax
1. 특성 신원 임베딩
2. 수치 임베딩
zv = φ(v) ∈ ℝᵈ' # 공유 비선형 프로젝터
ev|f = γf ⊙ zv + βf # 특성별 아핀 변환
여기서 γf, βf ∈ ℝᵈ'는 학습 가능한 특성별 매개변수입니다
3. 승법 융합
d' = d일 때:
MuFuse(ef, ev) = ef ⊙ ev = ef,v
d ≠ d'일 때(d = d' × k라고 가정):
ef를 k개의 연속 블록으로 분할: ef = e⁽¹⁾f; e⁽²⁾f; ...; e⁽ᵏ⁾f ev의 각 항목은 시그모이드를 통해 게이트로 작동: g(vj) = σ(vj) ∈ (0,1) 스칼라 게이트가 해당 블록에 적용: e⁽ⁱ⁾f,v = g(vj) · e⁽ⁱ⁾f 4. 분류 특성 처리
ef,c = Wcat · Concat(ef, ec) ∈ ℝᵈ
5. 시간 임베딩(정현 위치 인코딩)
pt[2i] = sin(t/ωi)
pt[2i+1] = cos(t/ωi)
ef,v,t = ef,v + pt
수학적 표현 :
MuFuse: ef,v = ef ⊙ ev = ef ⊙ (1 + e'v) = ef + ef ⊙ e'v
가법 융합: ef,v = ef + ev
MuFuse는 상호작용 항 ef ⊙ e'v를 도입하여 수치 변조가 특성 신원에 의존하도록 합니다 가법 융합에서 ev는 ef의 영향을 받지 않는 독립 항입니다 임상 시나리오: 저나트륨혈증과 고나트륨혈증 모두 발작을 유발할 수 있습니다
가법 융합 : 서로 다른 값 범위에 동일한 임베딩을 할당해야 하므로 유연성이 떨어집니다MuFuse : 요소별 승법을 통해 ev가 다르더라도 ef를 마스크로 사용하여 서로 다른 임베딩을 동일한 표현으로 축소할 수 있습니다SCANE은 관측값 스칼라에 특성 임베딩을 직접 곱하므로, 실제로는 MuFuse의 특수한 경우(d'=1, 값 변환 없음)입니다. MuFuse는 유연한 차원 선택과 비선형 프로젝션을 통해 더 강한 표현력을 제공합니다.
실험은 시간 인코딩에 가법이 승법보다 우수함을 보여줍니다(AUPRC: 0.6717 vs 0.6495):
가법 : 정현 인코딩의 AC 신호 진폭과 스펙트럼 패턴을 보존하며, 특성 임베딩은 DC 오프셋으로만 작용합니다승법 : AC 진폭과 스펙트럼 구성을 변경하여 순서 있는 위치 인코딩의 규칙성 표현을 파괴합니다데이터셋 유형 샘플 수 양성 비율 결측률 관측 윈도우 수치 특성 분류 특성 P12 ICU 사망률 11,988 14.2% 73.77% 48시간/2시간 윈도우 40 2 MI3 ICU 사망률 52,871 14.0% 88.14% 48시간/2시간 윈도우 128 4 HCC 간암 발병 34,296 4.6% 74.64% 1년/90일 윈도우 30 8
전처리 프로토콜 :
ICU 작업: 48시간 관측 윈도우, 2시간 집계(24개 타임스탬프) HCC 작업: 1년 관측 윈도우, 90일 집계(4개 타임스탬프) 수치 변수는 중앙값, 분류 변수는 최빈값 사용 보간 없음, 관측값만으로 토큰 생성 주요 지표 : AUPRC(정밀도-재현율 곡선 아래 면적) - 클래스 불균형에 더 적합보조 지표 : AUROC, 정확도(ICU) / c-지수(HCC)통계적 유의성 : 95% 신뢰 구간, 1000회 부트스트랩으로 추정전통적 앙상블 : Random Forest, XGBoost범용 시계열 모델 : Transformer 인코더, TCN임상 시계열 전용 :
SAnD: 마스크 자기주의 mTAN: 연속 시간 주의 STraTS: 자기감독 삼중항 학습 SUMMIT(SCANE): 현재 SOTA, 수치 스케일링 메커니즘 최적화기 : Adam학습률 : 3e-5(MedFuse), 5e-4(대부분의 기준선)하이퍼파라미터 튜닝 : Optuna(검증 집합)조기 중단 : 30-380 에포크(데이터셋 의존)모델 차원 : d=144, d' 변화(소거 연구)Transformer 층 수 : 32층(MedFuse)표1: 성능 비교(최고 굵게, 차고 밑줄)
방법 MI3 AUPRC P12 AUPRC HCC AUPRC Random Forest 0.4367±0.0517 0.4805±0.0533 0.3934±0.0583 XGBoost 0.4553±0.0527 0.4980±0.0544 0.3887±0.0592 Transformer 0.5074±0.0510 0.5435±0.0560 0.4139±0.0571 SAnD 0.5463±0.0462 0.4615±0.0598 0.3769±0.0337 mTAN 0.5536±0.0359 0.4991±0.0521 0.4545±0.0264 STraTS 0.5886±0.0546 0.5206±0.0534 0.4270±0.0186 SUMMIT 0.6328±0.0277 0.5504±0.0563 0.4553±0.0577 MedFuse 0.6574±0.0270 0.5612±0.0558 0.4595±0.0556
주요 발견 :
MedFuse는 세 데이터셋 모두에서 주요 지표 AUPRC에서 최고 성능 을 달성합니다 SUMMIT 대비 개선: MI3 +3.9%, P12 +2.0%, HCC +0.9% AUROC 및 정확도도 MI3에서 최고(0.9078 및 0.9153) 표2: 특성-값 융합 전략 소거(P12)
방법 AUPRC AUROC 정확도 MuFuse(승법) 0.5612±0.0558 0.8686±0.0190 0.8837±0.0558 가법 0.5317±0.0546 0.8549±0.0205 0.8754±0.0131 연결 0.5291±0.0564 0.8518±0.0204 0.8779±0.0129
결론 : 승법 융합은 가법 대비 AUPRC에서 5.5% 개선 , 값 조건 승법 변조의 효과성을 증명합니다
실험 설정 : d=144 고정, k 변화(즉, d'=d/k)
P12 결과 :
k=1일 때(d'=144): AUPRC 0.539 k=9일 때(d'=16): AUPRC 0.561(최적) k=144일 때(d'=1, SCANE 동등): AUPRC 0.548 통찰 :
중간 차원 분할이 최적 균형을 제공합니다 과도히 거친 경우(k 작음): 값 효과 매개변수화 부족 과도히 세밀한 경우(k 큼): 특성-값 상호작용 과적합 광송 Hadamard 곱의 유연한 정렬 설계를 검증합니다 실험 프로토콜 :
소스 데이터셋 사전학습 겹치는 특성(F∩)의 특성 신원 임베딩만 이전 P12와 MI3는 25개 특성 겹침(P12의 59.5%, MI3의 18.9%) 표3: 데이터셋 간 이전 결과
이전 방향 AUPRC 개선 MI3→P12(대→소) 0.5454 +1.7% P12 무작위 학습 0.5361 기준선 MI3 부분표본→P12 0.5276 -1.6% P12→MI3(소→대) 0.6422 -3.3% MI3 무작위 학습 0.6639 기준선
주요 발견 :
소스 데이터셋 규모가 핵심 : 대규모 데이터셋→소규모 데이터셋에서 긍정적 이전데이터셋 신원은 주요 인자가 아님: MI3 부분표본→P12도 여전히 음의 이전 특성 임베딩은 재사용 가능한, 코호트 무관의 의미를 포착합니다 t-SNE 시각화(HCC 데이터셋) :
융합 전 : 동일 특성 유형의 토큰 클러스터링이 명확합니다Transformer 첫 번째 층 후 : 클러스터링 특성이 유지되어 MuFuse의 견고성을 증명합니다고전 RNN : LSTM, GRU - 기준선 수립Transformer : 장거리 의존성 포착효율적 변형 : Informer(희소 자기주의)보간 방법 : BRITS(보간과 예측의 결합 학습)그리드 재샘플링 : SAnD(마스크 자기주의, 규칙 그리드 필요)연속 시간 주의 : mTAN(불규칙 관측 직접 처리)STraTS : 자기감독 삼중항 학습SCANE/SUMMIT : 수치 스케일링 메커니즘(SOTA)본 논문 기여 : SCANE이 MuFuse의 특수한 경우임을 증명, 더 범용적인 프레임워크 제공Chrysos et al. (2025): 심층 학습에서 Hadamard 곱의 장점 본 논문: 임상 EHR 수치 모델링에 승법 융합의 첫 체계적 적용 승법 융합이 가법보다 우수 : MuFuse는 값 조건 변조를 통해 특성별 비선형 상호작용을 실현합니다범용 무보간 프레임워크 : MedFuse는 ICU 및 만성질환 시나리오 모두에서 효과적입니다이전 가능성 : 학습된 특성 임베딩은 데이터셋 간 적응을 지원합니다(충분한 소스 데이터 규모 필요)이론적 통일 : MuFuse는 SCANE을 일반화하여 더 명확한 설계 원리를 제공합니다계산 비용 : 32층 Transformer는 실시간 응용을 제한할 수 있습니다이전 조건 : 데이터셋 간 이전은 대규모 소스 데이터셋이 필요합니다특성 겹침 : 이전은 충분한 특성 겹침에 의존합니다(본 실험 18.9%-59.5%)해석 가능성 : 승법 상호작용의 임상 의미는 추가 탐구가 필요합니다다중모달 확장 : 현재 수치 및 분류 특성만 처리하며, 텍스트, 이미지는 미포함대규모 다중모달 사전학습 : 임상 노트, 의료 영상으로 확장인과 추론 : 반사실 분석을 통합하여 해석 가능성 향상신뢰할 수 있는 임상 의사결정 지원 : 실제 임상 환경에 배포효율적 아키텍처 : 자원 제한 시나리오를 위한 경량 변형 탐색시간 인코딩 개선 : 불규칙 샘플링에 더 적합한 위치 인코딩 연구핵심 혁신 견고함 : 승법 융합은 명확한 이론적 동기를 가집니다(의학적 동등성, 상호작용 항)SOTA 일반화 : SCANE이 특수한 경우(d'=1)임을 우아하게 증명하여 통일 프레임워크 제공설계 유연성 : 광송 Hadamard 곱은 임의의 차원 비율을 지원합니다다양한 데이터셋 : ICU(급성) 및 HCC(만성) 시나리오 포함포괄적 소거 : 융합 전략, 차원 계수, 이전 학습 세 가지 차원통계적 엄밀성 : 부트스트랩 신뢰 구간, 다중 지표 평가시각화 분석 : t-SNE로 임베딩 품질 검증구조가 명확하고 동기 설명이 충분합니다 수학 표현이 정확합니다(공식 4-11) 부록이 상세합니다(하이퍼파라미터, 데이터셋 통계, 추가 실험) 경미한 부족: 일부 임상 용어는 더 많은 설명이 필요할 수 있습니다 보간 불필요로 전처리 복잡도 감소 코드 미공개(제출 중)이지만 방법 설명이 상세합니다 계산 비용이 높습니다(32층 Transformer) 시간 인코딩 모순 : 승법 융합이 시간 인코딩에 부적합함을 인정하지만 심층 이론적 설명 부족차원 선택 : k의 최적값이 데이터셋에 의존하며, 자동 선택 메커니즘 부족분류 특성 처리 : 단순 연결+선형 변환으로, 승법 융합의 잠재력을 충분히 탐색하지 않음이전 실험 제한 : 두 ICU 데이터셋 간에만 테스트, HCC 미참여특성 겹침 낮음 : MI3 측에서 18.9% 특성 겹침만으로 이전 잠재력 평가 제한계산 비용 분석 부재 : 학습 시간, 메모리 사용량 미보고하이퍼파라미터 민감성 : 서로 다른 데이터셋에서 층 수를 크게 조정 필요(1-32층)특성 상호작용 시각화 : 구체적 임상 특성의 상호작용 분석 부족실패 사례 분석 : 모델 예측 오류 상황 미논의SCANE 대비 부족 : 특수한 경우임을 증명했지만 다양한 d' 설정에서 직접 성능 비교 미실시코드 미공개 : 결과 검증에 영향비공개 데이터셋 : HCC 데이터셋 공개 불가무작위 시드 : 고정 여부 명확하지 않음이론적 기여 : EHR 모델링에서 승법 융합의 이론적 기초 수립방법적 기여 : 다른 불규칙 시계열로 확장 가능한 범용 프레임워크 제공실증적 기여 : 표준 벤치마크에서 새로운 SOTA 수립장점 : 보간 불필요, 불규칙 데이터 직접 처리제한 : 계산 비용 높음, 이전을 위해 대규모 소스 데이터셋 필요적용 시나리오 : 충분한 계산 자원이 있는 연구 기관 및 대형 의료 센터에 적합방법 설명 상세 : 공식과 아키텍처가 명확합니다코드 부재 : 재현성 저하데이터 부분 공개 : P12 및 MI3 공개, HCC 비공개높은 결측률 시나리오 (>70%): 보간 불필요의 장점이 명확합니다불규칙 샘플링 : ICU 모니터링, 외래 추적 등 비동기 데이터수치 특성 주도 : 실험실 검사, 생명 징후 등 연속 측정사전학습 필요 : 대규모 소스 데이터셋 활용 가능실시간 예측 : 32층 Transformer 추론 지연이 높습니다소표본 시나리오 : 이전 학습이 대규모 소스 데이터 필요순수 분류 특성 : 승법 융합 장점이 명확하지 않습니다자원 제한 환경 : 엣지 디바이스, 모바일 헬스 응용자동 차원 선택 : k를 자동으로 결정하는 방법 개발(예: 신경 아키텍처 탐색)경량 변형 : 지식 증류 또는 가지치기로 계산 비용 감소다중모달 확장 : 임상 노트, 의료 영상 통합해석 가능성 강화 : 특성 상호작용의 임상 의미 설명 제공코드 및 모델 공개 : 커뮤니티 검증 및 응용 촉진Huang et al. (2024) : SCANE/SUMMIT - 본 논문이 개선한 SOTA 기준선Chrysos et al. (2025) : 심층 학습에서 Hadamard 곱의 종합 검토Tipirneni & Reddy (2022) : STraTS - EVAT 패러다임의 대표 연구Shukla & Marlin (2021) : mTAN - 연속 시간 주의 메커니즘Vaswani et al. (2017) : Transformer - 본 논문 백본 아키텍처Johnson et al. (2016) : MIMIC-III 데이터베이스 - 주요 평가 데이터셋MedFuse는 임상 시계열 모델링 분야에서 실질적 기여 를 하는 논문입니다. 핵심 혁신인 승법 임베딩 융합(MuFuse)은 이론적으로 우아하게 기존 SOTA 방법을 일반화할 뿐만 아니라, 여러 실제 데이터셋에서 일관된 성능 개선을 달성합니다. 논문의 실험 설계는 주요 성능 비교에서 소거 연구, 차원 분석, 이전 학습까지 체계적으로 방법의 효과성을 검증합니다.
특히 주목할 점은 의학적 동등성 (서로 다른 이상 편차가 동일한 임상 위험에 대응할 수 있는 현상)에 대한 통찰입니다. 승법 융합의 마스킹 효과를 통해 이를 자연스럽게 모델링할 수 있다는 것은 저자의 임상 분야에 대한 깊은 이해를 보여줍니다.
그러나 논문에는 몇 가지 부족점도 있습니다: 계산 비용이 높고, 이전 학습 실험이 제한적이며, 코드가 공개되지 않았습니다. 이에도 불구하고 MedFuse는 불규칙 임상 시계열 모델링을 위한 강력하고 범용적인 프레임워크를 제공하며, 의료 AI 분야의 발전을 추진하는 데 중요한 의미가 있습니다. 향후 다중모달 확장, 해석 가능성, 실제 임상 배포 측면의 진전을 기대합니다.
추천 지수: 8.5/10