Clinical time series derived from electronic health records (EHRs) are inherently irregular, with asynchronous sampling, missing values, and heterogeneous feature dynamics. While numerical laboratory measurements are highly informative, existing embedding strategies usually combine feature identity and value embeddings through additive operations, which constrains their ability to capture value-dependent feature interactions. We propose MedFuse, a framework for irregular clinical time series centered on the MuFuse (Multiplicative Embedding Fusion) module. MuFuse fuses value and feature embeddings through multiplicative modulation, preserving feature-specific information while modeling higher-order dependencies across features. Experiments on three real-world datasets covering both intensive and chronic care show that MedFuse consistently outperforms state-of-the-art baselines on key predictive tasks. Analysis of the learned representations further demonstrates that multiplicative fusion enhances expressiveness and supports cross-dataset pretraining. These results establish MedFuse as a generalizable approach for modeling irregular clinical time series.
論文ID : 2511.09247タイトル : MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series著者 : Yi-Hsien Hsieh, Ta-Jung Chien, Chun-Kai Huang, Shao-Hua Sun, Che Lin (国立台湾大学)分類 : cs.AI発表日時 : 2025年11月12日 (arXiv投稿)論文状態 : 論文投稿中論文リンク : https://arxiv.org/abs/2511.09247 電子健康記録(EHR)における臨床時系列は、非同期サンプリング、欠損値、および異質な特徴動態を含む固有の不規則性を有している。既存の埋め込み戦略は、通常、加法演算を通じて特徴アイデンティティと数値埋め込みを組み合わせており、これは値依存特徴相互作用をキャプチャする能力を制限している。本論文では、MedFuseフレームワークを提案し、その核心はMuFuse(乗法埋め込み融合)モジュールである。MuFuseは乗法変調を通じて数値と特徴埋め込みを融合させ、特徴固有情報を保持しながら高次依存関係をモデル化する。3つの実世界データセットでの実験により、MedFuseが重要な予測タスクで最先端のベースラインを継続的に上回ることが示されている。学習表現の分析は、乗法融合が表現能力を向上させ、データセット間の事前学習をサポートすることをさらに証明している。
臨床時系列モデリングは3つの主要な課題に直面している:
不規則なサンプリング : 生命徴候は頻繁に監視される可能性があり、一方で検査室検査は臨床的必要性に応じてのみ実施され、患者は予定された訪問を逃す可能性がある高い欠損率 : データセットの平均欠損率は73.77%-88.14%に達する数値表現の困難さ : 検査室の数値は連続範囲内で複雑な情報をエンコードしており、原則的には無限に多くの表現が必要である臨床時系列は医療予測および監視タスクの中核である 効果的なモデリングはICU死亡率予測、慢性疾患リスク評価などの重要な医療タスクに不可欠である 不規則性と欠損値により、従来の方法の直接的な適用が困難になる 既存のEVAT(Each Value As Token)方法は主に加法融合 を採用している:
数値埋め込みを特徴埋め込みの加法オフセットとして扱う 表現能力の制限 : 値依存の非線形相互作用をキャプチャするのが困難臨床的意味論の喪失 : 検査室検査の小さな偏差と大きな偏差の質的差異を区別できない(例えば、クレアチニンのわずかな上昇対急激な上昇)乗法融合は他の領域で加法または連結より強い意味的統合を提供することが証明されている 臨床データの特殊性(例えば医学的等終性: 異なる異常偏差が同じ臨床リスクに対応する可能性がある)は、より柔軟な融合メカニズムを必要とする 補完を必要とせず、不規則な観測を直接処理できる汎用フレームワークが必要である 乗法値-特徴融合 : 値条件付き乗法融合を実行する非線形、特徴固有の変調を行うMuFuseモジュールを提案し、埋め込み語彙表の拡張を不要にする汎用補完不要フレームワーク : MuFuseに基づいてMedFuseを構築し、(特徴、数値、タイムスタンプ)三つ組トークン化スキームを採用して不規則な測定を直接モデル化する包括的な検証と転移可能性 :ICUおよび慢性疾患データセットで強いベースラインを継続的に上回る アブレーション研究は乗法融合が加法融合より優れていることを確認する 転移実験は学習された特徴埋め込みがデータセット間で再利用可能であることを示す 理論的洞察 : 最近のSOTA方法SCANEが実際にはMuFuseの特例(d'=1)であることを証明し、より汎用的な融合メカニズムを確立する観測集合O = {(f, v, t)}が与えられた場合:
入力 : f ∈ {1,...,F}特徴アイデンティティ(例えば検査室検査タイプ)、v ∈ ℝ記録値、t ∈ ℝ⁺タイムスタンプ出力 : 予測タスクラベル(例えばICU死亡率、HCC発症リスク)制約 : 実際に観測された記録のみを処理(Mf,t = 1)、欠損値の補完は不要観測三つ組 (f,v,t)
↓
MuFuse埋め込みモジュール
├─ 特徴アイデンティティ埋め込み: ef ∈ ℝᵈ
├─ 数値埋め込み: ev ∈ ℝᵈ'
└─ 乗法融合: ef,v = ef ⊙ ev
↓
時間エンコーディング加法: ef,v,t = ef,v + pt
↓
Transformerエンコーダ(N層)
↓
線形分類ヘッド + Softmax
1. 特徴アイデンティティ埋め込み
2. 数値埋め込み
zv = φ(v) ∈ ℝᵈ' # 共有非線形プロジェクタ
ev|f = γf ⊙ zv + βf # 特徴固有アフィン変換
ここでγf, βf ∈ ℝᵈ'は学習可能な特徴固有パラメータである
3. 乗法融合
d' = dの場合:
MuFuse(ef, ev) = ef ⊙ ev = ef,v
d ≠ d'の場合(d = d' × kと仮定):
efをk個の連続ブロックに分割: ef = e⁽¹⁾f; e⁽²⁾f; ...; e⁽ᵏ⁾f evの各エントリはシグモイドを通じてゲート化: g(vj) = σ(vj) ∈ (0,1) スカラーゲートは対応するブロックに適用: e⁽ⁱ⁾f,v = g(vj) · e⁽ⁱ⁾f 4. 分類特徴処理
ef,c = Wcat · Concat(ef, ec) ∈ ℝᵈ
5. 時間埋め込み(正弦位置エンコーディング)
pt[2i] = sin(t/ωi)
pt[2i+1] = cos(t/ωi)
ef,v,t = ef,v + pt
数学的表現 :
MuFuse: ef,v = ef ⊙ ev = ef ⊙ (1 + e'v) = ef + ef ⊙ e'v
加法融合: ef,v = ef + ev
MuFuseは相互作用項 ef ⊙ e'vを導入し、数値変調を特徴アイデンティティに依存させる 加法融合ではevは独立項として機能し、efの影響を受けない 臨床シナリオ: 低ナトリウム血症と高ナトリウム血症の両方が痙攣を引き起こす可能性がある
加法融合 : 異なる値範囲に対して同じ埋め込みを割り当てる必要があり、柔軟性が失われるMuFuse : 要素ごとの乗法を通じて、evが異なっていても、efをマスクとして使用して異なる埋め込みを同じ表現に折りたたむことができるSCANEは観測値スカラーを特徴埋め込みで直接乗算し、実際にはMuFuseの特例(d'=1、値変換なし)である。MuFuseは柔軟な次元選択と非線形投影を通じてより強い表現能力を提供する。
実験は時間エンコーディングに加法を使用することが乗法より優れていることを示している(AUPRC: 0.6717 vs 0.6495):
加法 : 正弦エンコーディングのAC信号振幅とスペクトルパターンを保持し、特徴埋め込みはDCオフセットとしてのみ機能する乗法 : AC振幅とスペクトル構成を変更し、順序付き位置エンコーディングの規則的な表現を破壊するデータセット タイプ サンプル数 正クラス率 欠損率 観測ウィンドウ 数値特徴 分類特徴 P12 ICU死亡率 11,988 14.2% 73.77% 48時間/2時間ウィンドウ 40 2 MI3 ICU死亡率 52,871 14.0% 88.14% 48時間/2時間ウィンドウ 128 4 HCC 肝癌発症 34,296 4.6% 74.64% 1年/90日ウィンドウ 30 8
前処理プロトコル :
ICUタスク: 48時間観測ウィンドウ、2時間集約(24タイムスタンプ) HCCタスク: 1年観測ウィンドウ、90日集約(4タイムスタンプ) 数値変数は中央値、分類変数は最頻値を取得 補完なし、観測値のみからトークンを生成 主要指標 : AUPRC(適合率-再現率曲線下面積) - クラス不均衡に適している補助指標 : AUROC、精度(ICU) / c-index(HCC)統計的有意性 : 95%信頼区間、1000回のブートストラップ推定を通じて従来的アンサンブル : ランダムフォレスト、XGBoost汎用シーケンスモデル : Transformerエンコーダ、TCN臨床時系列専用 :
SAnD: マスク付き自己注意 mTAN: 連続時間注意 STraTS: 自己教師付き三つ組学習 SUMMIT(SCANE): 現在のSOTA、数値スケーリングメカニズム オプティマイザ : Adam学習率 : 3e-5(MedFuse)、5e-4(多くのベースライン)ハイパーパラメータ調整 : Optuna(検証セット)早期停止 : 30-380エポック(データセット依存)モデル次元 : d=144、d'は変化(アブレーション研究)Transformer層数 : 32層(MedFuse)表1: 性能比較(最良は太字、次点は下線)
方法 MI3 AUPRC P12 AUPRC HCC AUPRC ランダムフォレスト 0.4367±0.0517 0.4805±0.0533 0.3934±0.0583 XGBoost 0.4553±0.0527 0.4980±0.0544 0.3887±0.0592 Transformer 0.5074±0.0510 0.5435±0.0560 0.4139±0.0571 SAnD 0.5463±0.0462 0.4615±0.0598 0.3769±0.0337 mTAN 0.5536±0.0359 0.4991±0.0521 0.4545±0.0264 STraTS 0.5886±0.0546 0.5206±0.0534 0.4270±0.0186 SUMMIT 0.6328±0.0277 0.5504±0.0563 0.4553±0.0577 MedFuse 0.6574±0.0270 0.5612±0.0558 0.4595±0.0556
主要な発見 :
MedFuseは3つのデータセット全てで主要指標AUPRCで最良 を達成 SUMMITと比較した改善: MI3 +3.9%, P12 +2.0%, HCC +0.9% AUROCと精度もMI3で最良を達成(0.9078および0.9153) 表2: 特徴-値融合戦略のアブレーション(P12)
方法 AUPRC AUROC 精度 MuFuse(乗法) 0.5612±0.0558 0.8686±0.0190 0.8837±0.0558 加法 0.5317±0.0546 0.8549±0.0205 0.8754±0.0131 連結 0.5291±0.0564 0.8518±0.0204 0.8779±0.0129
結論 : 乗法融合は加法と比較してAUPRCで**5.5%**改善し、値条件付き乗法変調の有効性を証明する
実験設定 : d=144を固定、kを変化(すなわちd'=d/k)
P12結果 :
k=1の場合(d'=144): AUPRC 0.539 k=9の場合(d'=16): AUPRC 0.561(最適) k=144の場合(d'=1、SCANEと等価): AUPRC 0.548 洞察 :
中程度の次元分割が最適なバランスを提供する 粗すぎる(k小): 値効果パラメータ化が不十分 細かすぎる(k大): 特徴-値相互作用が過剰適合 ブロードキャストHadamard積の柔軟なアライメント設計を検証 実験プロトコル :
ソースデータセットで事前学習 重複特徴(F∩)の特徴アイデンティティ埋め込みのみを転移 P12とMI3は25個の重複特徴(P12の59.5%、MI3の18.9%) 表3: クロスデータセット転移結果
転移方向 AUPRC 改善 MI3→P12(大→小) 0.5454 +1.7% P12ランダム訓練 0.5361 ベースライン MI3部分標本→P12 0.5276 -1.6% P12→MI3(小→大) 0.6422 -3.3% MI3ランダム訓練 0.6639 ベースライン
主要な発見 :
ソースデータセットサイズが重要 : 大規模データセット→小規模データセットで正の転移データセットアイデンティティは主因ではない: MI3部分標本→P12でも負の転移 特徴埋め込みはコホート無関連で再利用可能な意味論をキャプチャ t-SNE可視化(HCCデータセット) :
融合前 : 同じ特徴タイプのトークンのクラスタリングが明確Transformer第1層後 : クラスタリング特性が保持され、MuFuseの堅牢性を証明古典的RNN : LSTM、GRU - ベースラインを確立Transformer : 長距離依存をキャプチャ効率的な変種 : Informer(スパース自己注意)補完方法 : BRITS(補完と予測の共同学習)グリッド再サンプリング : SAnD(マスク付き自己注意、規則的グリッドが必要)連続時間注意 : mTAN(不規則な観測を直接処理)STraTS : 自己教師付き三つ組学習SCANE/SUMMIT : 数値スケーリングメカニズム(SOTA)本論文の貢献 : SCANEがMuFuseの特例であることを証明し、より汎用的なフレームワークを提供Chrysos et al. (2025): 深層学習におけるHadamard積の利点 本論文: 臨床EHR数値モデリングへの乗法融合の初の体系的応用 乗法融合は加法より優れている : MuFuseは値条件付き変調を通じて特徴固有の非線形相互作用を実現汎用補完不要フレームワーク : MedFuseはICUおよび慢性疾患シナリオの両方で有効転移可能性 : 学習された特徴埋め込みはデータセット間の適応をサポート(十分なソースデータ規模が必要)理論的統一 : MuFuseはSCANEを一般化し、より明確な設計原理を提供計算コスト : 32層Transformerはリアルタイムアプリケーションを制限する可能性がある転移条件 : クロスデータセット転移は大規模ソースデータセットを必要とする特徴重複 : 転移は十分な特徴重複に依存(本実験18.9%-59.5%)解釈可能性 : 乗法相互作用の臨床的意味論はさらなる探索が必要マルチモーダル拡張 : 現在は数値および分類特徴のみを処理、テキストおよび画像は含まない大規模マルチモーダル事前学習 : テキスト記録、医療画像への拡張因果推論 : 反事実分析を統合して解釈可能性を向上信頼できる臨床意思決定支援 : 実際の臨床環境への展開効率的なアーキテクチャ : リソース制限環境用の軽量変種の探索時間エンコーディングの改善 : 不規則なサンプリングに適した位置エンコーディングの研究核心的革新が堅実 : 乗法融合は明確な理論的動機を持つ(医学的等終性、相互作用項)SOTAの一般化 : SCANEが特例(d'=1)であることを優雅に証明し、統一フレームワークを提供設計の柔軟性 : ブロードキャストHadamard積は任意の次元比率をサポート多様なデータセット : ICU(急性)およびHCC(慢性)シナリオをカバー包括的なアブレーション : 融合戦略、次元係数、転移学習の3つの次元統計的厳密性 : ブートストラップ信頼区間、複数指標評価可視化分析 : t-SNEで埋め込み品質を検証構造が明確で、動機が十分に説明されている 数学的表現が正確(式4-11) 付録が詳細(ハイパーパラメータ、データセット統計、追加実験) 軽微な不足: 一部の臨床用語はさらなる説明が必要な場合がある 補完不要で、前処理の複雑さを軽減 コード未公開(投稿中)だが、方法記述は詳細 計算コストが高い(32層Transformer) 時間エンコーディングの矛盾 : 乗法融合が時間エンコーディングに不適切であることを認めるが、深い理論的説明が不足次元選択 : kの最適値はデータセット依存で、自動選択メカニズムが不足分類特徴処理 : 単純な連結+線形変換で、乗法融合の可能性を十分に探索していない転移実験が限定的 : 2つのICUデータセット間のみでテスト、HCCは参加していない特徴重複が低い : MI3側で18.9%の特徴重複のみで、転移可能性評価を制限計算コスト分析の欠落 : 訓練時間、メモリ使用量が報告されていないハイパーパラメータ感度 : 異なるデータセットで層数を大幅に調整が必要(1-32層)特徴相互作用の可視化 : 具体的な臨床特徴の相互作用分析が不足失敗ケース分析 : モデル予測エラーの状況が議論されていないSCANEとの比較が不十分 : 異なるd'設定での性能の直接比較が不足コード未公開 : 結果検証に影響プライベートデータセット : HCCデータセットは公開アクセス不可ランダムシード : 固定されているかどうかが明確に述べられていない理論的貢献 : EHRモデリングにおける乗法融合の理論的基礎を確立方法的貢献 : 他の不規則時系列に拡張可能な汎用フレームワークを提供実証的貢献 : 標準ベンチマークで新しいSOTAを確立利点 : 補完不要で、不規則データを直接処理制限 : 計算コストが高く、転移学習には大規模ソースデータセットが必要適用シナリオ : 十分な計算リソースを持つ研究機関および大規模医療センターに適している方法記述が詳細 : 式とアーキテクチャが明確コード不足 : 再現可能性を低下データ部分利用可能 : P12とMI3は公開、HCCはプライベート高欠損率シナリオ (>70%): 補完不要の利点が明確不規則なサンプリング : ICU監視、外来フォローアップなどの非同期データ数値特徴主導 : 検査室検査、生命徴候などの連続測定事前学習の必要性 : 大規模ソースデータセットを活用可能リアルタイム予測 : 32層Transformerの推論遅延が高い小標本シナリオ : 転移学習は大規模ソースデータを必要とする純分類特徴 : 乗法融合の利点が明確でないリソース制限環境 : エッジデバイス、モバイルヘルスアプリケーション自適応次元選択 : kを自動決定する方法を開発(ニューラルアーキテクチャサーチなど)軽量変種 : 知識蒸留またはプルーニングで計算コストを削減マルチモーダル拡張 : 臨床記録、医療画像データを統合解釈可能性向上 : 特徴相互作用の臨床的意味論を説明コードとモデルの公開 : コミュニティ検証と応用を促進Huang et al. (2024) : SCANE/SUMMIT - 本論文が改善したSOTAベースラインChrysos et al. (2025) : 深層学習におけるHadamard積の総説Tipirneni & Reddy (2022) : STraTS - EVAT範式の代表的研究Shukla & Marlin (2021) : mTAN - 連続時間注意メカニズムVaswani et al. (2017) : Transformer - 本論文のバックボーンアーキテクチャJohnson et al. (2016) : MIMIC-IIIデータベース - 重要な評価データセットMedFuseは臨床時系列モデリング領域における実質的な貢献 を持つ論文である。その核心的革新である乗法埋め込み融合(MuFuse)は、理論的には既存のSOTA方法を優雅に一般化し、複数の実世界データセットで一貫した性能改善を達成している。論文の実験設計は包括的で、主要性能比較からアブレーション研究、次元分析、転移学習まで、方法の有効性を体系的に検証している。
特に称賛に値するのは、論文が医学的等終性 (医学的等終性)に対する洞察である。乗法融合のマスキング効果を通じて、異なる異常偏差が同じ臨床リスクに対応する現象を自然にモデル化することで、著者の臨床領域に対する深い理解を示している。
しかし、論文にも不足がある: 計算コストが高い、転移学習実験が限定的、コード未公開など。それでも、MedFuseは不規則臨床時系列モデリングに強力で汎用的なフレームワークを提供し、医療AI領域の発展を推進する上で重要な意義を持つ。マルチモーダル拡張、解釈可能性、実際の臨床展開における後続研究の進展を期待する。
推奨指数: 8.5/10