2025-11-13T04:10:10.339085

MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series

Hsieh, Chien, Huang et al.

Clinical time series derived from electronic health records (EHRs) are inherently irregular, with asynchronous sampling, missing values, and heterogeneous feature dynamics. While numerical laboratory measurements are highly informative, existing embedding strategies usually combine feature identity and value embeddings through additive operations, which constrains their ability to capture value-dependent feature interactions. We propose MedFuse, a framework for irregular clinical time series centered on the MuFuse (Multiplicative Embedding Fusion) module. MuFuse fuses value and feature embeddings through multiplicative modulation, preserving feature-specific information while modeling higher-order dependencies across features. Experiments on three real-world datasets covering both intensive and chronic care show that MedFuse consistently outperforms state-of-the-art baselines on key predictive tasks. Analysis of the learned representations further demonstrates that multiplicative fusion enhances expressiveness and supports cross-dataset pretraining. These results establish MedFuse as a generalizable approach for modeling irregular clinical time series.

academic

MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series

基本信息

论文ID: 2511.09247
标题: MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series
作者: Yi-Hsien Hsieh, Ta-Jung Chien, Chun-Kai Huang, Shao-Hua Sun, Che Lin (National Taiwan University)
分类: cs.AI
发表时间: 2025年11月12日 (arXiv提交)
论文状态: Under paper submission
论文链接: https://arxiv.org/abs/2511.09247

摘要

电子健康记录（EHR）中的临床时间序列具有固有的不规则性，包括异步采样、缺失值和异质性特征动态。现有的嵌入策略通常通过加法操作组合特征身份和数值嵌入，这限制了捕获值依赖特征交互的能力。本文提出MedFuse框架，核心是MuFuse（乘法嵌入融合）模块。MuFuse通过乘法调制融合数值和特征嵌入，在保留特征特定信息的同时建模高阶依赖关系。在三个真实世界数据集上的实验表明，MedFuse在关键预测任务上持续优于最先进基线。学习表示的分析进一步证明乘法融合增强了表达能力并支持跨数据集预训练。

研究背景与动机

1. 核心问题

临床时间序列建模面临三大挑战：

不规则采样：生命体征可能频繁监测，而实验室检查仅在临床需要时进行，患者可能错过预定访问
高缺失率：数据集平均缺失率达到73.77%-88.14%
数值表示困难：实验室数值在连续范围内编码复杂信息，原则上需要无限多的表示

2. 问题重要性

临床时间序列是医疗预测和监控任务的核心
有效建模对于ICU死亡率预测、慢性病风险评估等关键医疗任务至关重要
不规则性和缺失值使得传统方法难以直接应用

3. 现有方法局限性

现有的EVAT（Each Value As Token）方法主要采用加法融合：

将数值嵌入作为特征嵌入的加法偏移
限制表达能力：难以捕获值依赖的非线性交互
临床语义丢失：无法区分实验室检测的小偏差与大偏差的质性差异（如肌酐的轻微升高vs急剧上升）

4. 研究动机

乘法融合在其他领域已被证明比加法或拼接提供更强的语义整合
临床数据的特殊性质（如医学等终性：不同异常偏差可对应相同临床风险）需要更灵活的融合机制
需要一个无需插补、能直接处理不规则观测的通用框架

核心贡献

乘法值-特征融合：提出MuFuse模块，通过值条件乘法融合执行非线性、特征特定的调制，无需扩展嵌入词汇表
通用无插补框架：基于MuFuse构建MedFuse，采用（特征、数值、时间戳）三元组标记化方案直接建模不规则测量
全面验证与可迁移性：
- 在ICU和慢性病数据集上持续优于强基线
- 消融研究证实乘法优于加法融合
- 迁移实验显示学习的特征嵌入可跨数据集重用
理论洞察：证明最近的SOTA方法SCANE实际上是MuFuse的特例（d'=1），建立了更通用的融合机制

方法详解

任务定义

给定观测集合 O = {(f, v, t)}：

输入：f ∈ {1,...,F} 特征身份（如实验室检测类型），v ∈ ℝ 记录值，t ∈ ℝ⁺ 时间戳
输出：预测任务标签（如ICU死亡率、HCC发病风险）
约束：仅处理实际观测的记录（Mf,t = 1），无需插补缺失值

模型架构

整体架构（MedFuse）

观测三元组 (f,v,t) 
    ↓
MuFuse嵌入模块
    ├─ 特征身份嵌入: ef ∈ ℝᵈ
    ├─ 数值嵌入: ev ∈ ℝᵈ'
    └─ 乘法融合: ef,v = ef ⊙ ev
    ↓
时间编码加法: ef,v,t = ef,v + pt
    ↓
Transformer编码器（N层）
    ↓
线性分类头 + Softmax

核心模块：MuFuse

1. 特征身份嵌入

ef ∈ ℝᵈ  (标准查找表)

2. 数值嵌入

zv = φ(v) ∈ ℝᵈ'           # 共享非线性投影器
ev|f = γf ⊙ zv + βf       # 特征特定仿射变换

其中γf, βf ∈ ℝᵈ' 是可学习的特征特定参数

3. 乘法融合

当 d' = d 时：

MuFuse(ef, ev) = ef ⊙ ev = ef,v

当 d ≠ d' 时（假设 d = d' × k）：

将ef分割为k个连续块：ef = e⁽¹⁾f; e⁽²⁾f; ...; e⁽ᵏ⁾f
每个ev的条目通过sigmoid作为门控：g(vj) = σ(vj) ∈ (0,1)
标量门控应用到对应块：e⁽ⁱ⁾f,v = g(vj) · e⁽ⁱ⁾f

4. 分类特征处理

ef,c = Wcat · Concat(ef, ec) ∈ ℝᵈ

5. 时间嵌入（正弦位置编码）

pt[2i] = sin(t/ωi)
pt[2i+1] = cos(t/ωi)
ef,v,t = ef,v + pt

技术创新点

1. 乘法融合的优势

数学表达：

MuFuse: ef,v = ef ⊙ ev = ef ⊙ (1 + e'v) = ef + ef ⊙ e'v
加法融合: ef,v = ef + ev

MuFuse引入交互项 ef ⊙ e'v，使数值调制依赖于特征身份
加法融合中ev作为独立项，不受ef影响

2. 医学等终性建模（Masking & Collapse）

临床场景：低钠血症和高钠血症都可能导致癫痫发作

加法融合：需要为不同值范围分配相同嵌入，失去灵活性
MuFuse：通过元素级乘法，即使ev不同，也可通过ef作为掩码将不同嵌入折叠为相同表示

3. 与SCANE的关系

SCANE直接将观测值标量乘以特征嵌入，实际是MuFuse的特例（d'=1，无值变换）。MuFuse通过灵活的维度选择和非线性投影提供更强表达能力。

4. 为何时间编码用加法？

实验表明时间编码用加法优于乘法（AUPRC: 0.6717 vs 0.6495）：

加法：保留正弦编码的AC信号幅度和频谱模式，特征嵌入仅作为DC偏移
乘法：改变AC幅度和频谱组成，破坏有序位置编码的规律性表示

实验设置

数据集

数据集	类型	样本数	正类率	缺失率	观测窗口	数值特征	分类特征
P12	ICU死亡率	11,988	14.2%	73.77%	48小时/2小时窗	40	2
MI3	ICU死亡率	52,871	14.0%	88.14%	48小时/2小时窗	128	4
HCC	肝癌发病	34,296	4.6%	74.64%	1年/90天窗	30	8

预处理协议：

ICU任务：48小时观测窗口，2小时汇总（24个时间戳）
HCC任务：1年观测窗口，90天汇总（4个时间戳）
数值变量取中位数，分类变量取众数
无插补，仅观测值生成token

评价指标

主要指标：AUPRC（精确率-召回率曲线下面积）- 更适合类别不平衡
辅助指标：AUROC、准确率（ICU）/ c-index（HCC）
统计显著性：95%置信区间，通过1000次bootstrap估计

对比方法

传统集成：Random Forest, XGBoost
通用序列模型：Transformer编码器, TCN
临床时间序列专用：
- SAnD：掩码自注意力
- mTAN：连续时间注意力
- STraTS：自监督三元组学习
- SUMMIT（SCANE）：当前SOTA，数值缩放机制

实现细节

优化器：Adam
学习率：3e-5（MedFuse），5e-4（多数基线）
超参数调优：Optuna（验证集）
早停：30-380轮（数据集依赖）
模型维度：d=144, d'变化（消融研究）
Transformer层数：32层（MedFuse）

实验结果

主要结果

表1：性能比较（最佳加粗，次佳下划线）

方法	MI3 AUPRC	P12 AUPRC	HCC AUPRC
Random Forest	0.4367±0.0517	0.4805±0.0533	0.3934±0.0583
XGBoost	0.4553±0.0527	0.4980±0.0544	0.3887±0.0592
Transformer	0.5074±0.0510	0.5435±0.0560	0.4139±0.0571
SAnD	0.5463±0.0462	0.4615±0.0598	0.3769±0.0337
mTAN	0.5536±0.0359	0.4991±0.0521	0.4545±0.0264
STraTS	0.5886±0.0546	0.5206±0.0534	0.4270±0.0186
SUMMIT	0.6328±0.0277	0.5504±0.0563	0.4553±0.0577
MedFuse	0.6574±0.0270	0.5612±0.0558	0.4595±0.0556

关键发现：

MedFuse在所有三个数据集上的主要指标AUPRC均达到最佳
相比SUMMIT提升：MI3 +3.9%, P12 +2.0%, HCC +0.9%
AUROC和准确率在MI3上也达到最佳（0.9078和0.9153）

消融实验

表2：特征-值融合策略消融（P12）

方法	AUPRC	AUROC	准确率
MuFuse（乘法）	0.5612±0.0558	0.8686±0.0190	0.8837±0.0558
加法	0.5317±0.0546	0.8549±0.0205	0.8754±0.0131
拼接	0.5291±0.0564	0.8518±0.0204	0.8779±0.0129

结论：乘法融合相比加法在AUPRC上提升5.5%，证实值条件乘法调制的有效性

维度分割因子k的影响

实验设置：固定d=144，变化k（即d'=d/k）

P12结果：

k=1时（d'=144）：AUPRC 0.539
k=9时（d'=16）：AUPRC 0.561（最优）
k=144时（d'=1，等价SCANE）：AUPRC 0.548

洞察：

中等维度分割提供最佳平衡
过粗（k小）：值效应参数化不足
过细（k大）：特征-值交互过拟合
验证了广播Hadamard积的灵活对齐设计

跨数据集迁移学习

实验协议：

源数据集预训练
仅迁移重叠特征（F∩）的特征身份嵌入
P12与MI3重叠25个特征（P12占59.5%，MI3占18.9%）

表3：跨数据集迁移结果

迁移方向	AUPRC	提升
MI3→P12（大→小）	0.5454	+1.7%
P12随机训练	0.5361	baseline
MI3子样本→P12	0.5276	-1.6%
P12→MI3（小→大）	0.6422	-3.3%
MI3随机训练	0.6639	baseline