Clinical time series derived from electronic health records (EHRs) are inherently irregular, with asynchronous sampling, missing values, and heterogeneous feature dynamics. While numerical laboratory measurements are highly informative, existing embedding strategies usually combine feature identity and value embeddings through additive operations, which constrains their ability to capture value-dependent feature interactions. We propose MedFuse, a framework for irregular clinical time series centered on the MuFuse (Multiplicative Embedding Fusion) module. MuFuse fuses value and feature embeddings through multiplicative modulation, preserving feature-specific information while modeling higher-order dependencies across features. Experiments on three real-world datasets covering both intensive and chronic care show that MedFuse consistently outperforms state-of-the-art baselines on key predictive tasks. Analysis of the learned representations further demonstrates that multiplicative fusion enhances expressiveness and supports cross-dataset pretraining. These results establish MedFuse as a generalizable approach for modeling irregular clinical time series.
论文ID : 2511.09247标题 : MedFuse: Multiplicative Embedding Fusion For Irregular Clinical Time Series作者 : Yi-Hsien Hsieh, Ta-Jung Chien, Chun-Kai Huang, Shao-Hua Sun, Che Lin (National Taiwan University)分类 : cs.AI发表时间 : 2025年11月12日 (arXiv提交)论文状态 : Under paper submission论文链接 : https://arxiv.org/abs/2511.09247 电子健康记录(EHR)中的临床时间序列具有固有的不规则性,包括异步采样、缺失值和异质性特征动态。现有的嵌入策略通常通过加法操作组合特征身份和数值嵌入,这限制了捕获值依赖特征交互的能力。本文提出MedFuse框架,核心是MuFuse(乘法嵌入融合)模块。MuFuse通过乘法调制融合数值和特征嵌入,在保留特征特定信息的同时建模高阶依赖关系。在三个真实世界数据集上的实验表明,MedFuse在关键预测任务上持续优于最先进基线。学习表示的分析进一步证明乘法融合增强了表达能力并支持跨数据集预训练。
临床时间序列建模面临三大挑战:
不规则采样 :生命体征可能频繁监测,而实验室检查仅在临床需要时进行,患者可能错过预定访问高缺失率 :数据集平均缺失率达到73.77%-88.14%数值表示困难 :实验室数值在连续范围内编码复杂信息,原则上需要无限多的表示临床时间序列是医疗预测和监控任务的核心 有效建模对于ICU死亡率预测、慢性病风险评估等关键医疗任务至关重要 不规则性和缺失值使得传统方法难以直接应用 现有的EVAT(Each Value As Token)方法主要采用加法融合 :
将数值嵌入作为特征嵌入的加法偏移 限制表达能力 :难以捕获值依赖的非线性交互临床语义丢失 :无法区分实验室检测的小偏差与大偏差的质性差异(如肌酐的轻微升高vs急剧上升)乘法融合在其他领域已被证明比加法或拼接提供更强的语义整合 临床数据的特殊性质(如医学等终性:不同异常偏差可对应相同临床风险)需要更灵活的融合机制 需要一个无需插补、能直接处理不规则观测的通用框架 乘法值-特征融合 :提出MuFuse模块,通过值条件乘法融合执行非线性、特征特定的调制,无需扩展嵌入词汇表通用无插补框架 :基于MuFuse构建MedFuse,采用(特征、数值、时间戳)三元组标记化方案直接建模不规则测量全面验证与可迁移性 :在ICU和慢性病数据集上持续优于强基线 消融研究证实乘法优于加法融合 迁移实验显示学习的特征嵌入可跨数据集重用 理论洞察 :证明最近的SOTA方法SCANE实际上是MuFuse的特例(d'=1),建立了更通用的融合机制给定观测集合 O = {(f, v, t)}:
输入 :f ∈ {1,...,F} 特征身份(如实验室检测类型),v ∈ ℝ 记录值,t ∈ ℝ⁺ 时间戳输出 :预测任务标签(如ICU死亡率、HCC发病风险)约束 :仅处理实际观测的记录(Mf,t = 1),无需插补缺失值观测三元组 (f,v,t)
↓
MuFuse嵌入模块
├─ 特征身份嵌入: ef ∈ ℝᵈ
├─ 数值嵌入: ev ∈ ℝᵈ'
└─ 乘法融合: ef,v = ef ⊙ ev
↓
时间编码加法: ef,v,t = ef,v + pt
↓
Transformer编码器(N层)
↓
线性分类头 + Softmax
1. 特征身份嵌入
2. 数值嵌入
zv = φ(v) ∈ ℝᵈ' # 共享非线性投影器
ev|f = γf ⊙ zv + βf # 特征特定仿射变换
其中γf, βf ∈ ℝᵈ' 是可学习的特征特定参数
3. 乘法融合
当 d' = d 时:
MuFuse(ef, ev) = ef ⊙ ev = ef,v
当 d ≠ d' 时(假设 d = d' × k):
将ef分割为k个连续块:ef = e⁽¹⁾f; e⁽²⁾f; ...; e⁽ᵏ⁾f 每个ev的条目通过sigmoid作为门控:g(vj) = σ(vj) ∈ (0,1) 标量门控应用到对应块:e⁽ⁱ⁾f,v = g(vj) · e⁽ⁱ⁾f 4. 分类特征处理
ef,c = Wcat · Concat(ef, ec) ∈ ℝᵈ
5. 时间嵌入(正弦位置编码)
pt[2i] = sin(t/ωi)
pt[2i+1] = cos(t/ωi)
ef,v,t = ef,v + pt
数学表达 :
MuFuse: ef,v = ef ⊙ ev = ef ⊙ (1 + e'v) = ef + ef ⊙ e'v
加法融合: ef,v = ef + ev
MuFuse引入交互项 ef ⊙ e'v,使数值调制依赖于特征身份 加法融合中ev作为独立项,不受ef影响 临床场景:低钠血症和高钠血症都可能导致癫痫发作
加法融合 :需要为不同值范围分配相同嵌入,失去灵活性MuFuse :通过元素级乘法,即使ev不同,也可通过ef作为掩码将不同嵌入折叠为相同表示SCANE直接将观测值标量乘以特征嵌入,实际是MuFuse的特例(d'=1,无值变换)。MuFuse通过灵活的维度选择和非线性投影提供更强表达能力。
实验表明时间编码用加法优于乘法(AUPRC: 0.6717 vs 0.6495):
加法 :保留正弦编码的AC信号幅度和频谱模式,特征嵌入仅作为DC偏移乘法 :改变AC幅度和频谱组成,破坏有序位置编码的规律性表示数据集 类型 样本数 正类率 缺失率 观测窗口 数值特征 分类特征 P12 ICU死亡率 11,988 14.2% 73.77% 48小时/2小时窗 40 2 MI3 ICU死亡率 52,871 14.0% 88.14% 48小时/2小时窗 128 4 HCC 肝癌发病 34,296 4.6% 74.64% 1年/90天窗 30 8
预处理协议 :
ICU任务:48小时观测窗口,2小时汇总(24个时间戳) HCC任务:1年观测窗口,90天汇总(4个时间戳) 数值变量取中位数,分类变量取众数 无插补,仅观测值生成token 主要指标 :AUPRC(精确率-召回率曲线下面积)- 更适合类别不平衡辅助指标 :AUROC、准确率(ICU)/ c-index(HCC)统计显著性 :95%置信区间,通过1000次bootstrap估计传统集成 :Random Forest, XGBoost通用序列模型 :Transformer编码器, TCN临床时间序列专用 :
SAnD:掩码自注意力 mTAN:连续时间注意力 STraTS:自监督三元组学习 SUMMIT(SCANE):当前SOTA,数值缩放机制 优化器 :Adam学习率 :3e-5(MedFuse),5e-4(多数基线)超参数调优 :Optuna(验证集)早停 :30-380轮(数据集依赖)模型维度 :d=144, d'变化(消融研究)Transformer层数 :32层(MedFuse)表1:性能比较(最佳加粗,次佳下划线)
方法 MI3 AUPRC P12 AUPRC HCC AUPRC Random Forest 0.4367±0.0517 0.4805±0.0533 0.3934±0.0583 XGBoost 0.4553±0.0527 0.4980±0.0544 0.3887±0.0592 Transformer 0.5074±0.0510 0.5435±0.0560 0.4139±0.0571 SAnD 0.5463±0.0462 0.4615±0.0598 0.3769±0.0337 mTAN 0.5536±0.0359 0.4991±0.0521 0.4545±0.0264 STraTS 0.5886±0.0546 0.5206±0.0534 0.4270±0.0186 SUMMIT 0.6328±0.0277 0.5504±0.0563 0.4553±0.0577 MedFuse 0.6574±0.0270 0.5612±0.0558 0.4595±0.0556
关键发现 :
MedFuse在所有三个数据集上的主要指标AUPRC均达到最佳 相比SUMMIT提升:MI3 +3.9%, P12 +2.0%, HCC +0.9% AUROC和准确率在MI3上也达到最佳(0.9078和0.9153) 表2:特征-值融合策略消融(P12)
方法 AUPRC AUROC 准确率 MuFuse(乘法) 0.5612±0.0558 0.8686±0.0190 0.8837±0.0558 加法 0.5317±0.0546 0.8549±0.0205 0.8754±0.0131 拼接 0.5291±0.0564 0.8518±0.0204 0.8779±0.0129
结论 :乘法融合相比加法在AUPRC上提升5.5% ,证实值条件乘法调制的有效性
实验设置 :固定d=144,变化k(即d'=d/k)
P12结果 :
k=1时(d'=144):AUPRC 0.539 k=9时(d'=16):AUPRC 0.561(最优) k=144时(d'=1,等价SCANE):AUPRC 0.548 洞察 :
中等维度分割提供最佳平衡 过粗(k小):值效应参数化不足 过细(k大):特征-值交互过拟合 验证了广播Hadamard积的灵活对齐设计 实验协议 :
源数据集预训练 仅迁移重叠特征(F∩)的特征身份嵌入 P12与MI3重叠25个特征(P12占59.5%,MI3占18.9%) 表3:跨数据集迁移结果
迁移方向 AUPRC 提升 MI3→P12(大→小) 0.5454 +1.7% P12随机训练 0.5361 baseline MI3子样本→P12 0.5276 -1.6% P12→MI3(小→大) 0.6422 -3.3% MI3随机训练 0.6639 baseline
关键发现 :
源数据集规模是关键 :大数据集→小数据集有正迁移数据集身份非主因:MI3子样本→P12仍负迁移 特征嵌入捕获可重用的、队列无关的语义 t-SNE可视化(HCC数据集) :
融合前 :同特征类型的token聚类清晰Transformer第一层后 :聚类特性保持,证明MedFuse的鲁棒性经典RNN :LSTM, GRU - 建立基线Transformer :捕获长程依赖高效变体 :Informer(稀疏自注意力)插补方法 :BRITS(联合学习插补与预测)网格重采样 :SAnD(掩码自注意力,需规则网格)连续时间注意力 :mTAN(直接处理不规则观测)STraTS :自监督三元组学习SCANE/SUMMIT :数值缩放机制(SOTA)本文贡献 :证明SCANE是MuFuse特例,提供更通用框架Chrysos et al. (2025):Hadamard积在深度学习中的优势 本文:首次系统应用乘法融合到临床EHR数值建模 乘法融合优于加法 :MuFuse通过值条件调制实现特征特定的非线性交互通用无插补框架 :MedFuse在ICU和慢性病场景均有效可迁移性 :学习的特征嵌入支持跨数据集适应(需足够源数据规模)理论统一 :MuFuse泛化了SCANE,提供更清晰的设计原理计算成本 :32层Transformer可能限制实时应用迁移条件 :跨数据集迁移需要大规模源数据集特征重叠 :迁移依赖足够的特征重叠(本实验18.9%-59.5%)可解释性 :乘法交互的临床语义仍需进一步探索多模态扩展 :当前仅处理数值和分类特征,未涵盖文本、图像大规模多模态预训练 :扩展到文本笔记、医学影像因果推理 :整合反事实分析增强可解释性可信临床决策支持 :部署到真实临床环境高效架构 :探索轻量级变体用于资源受限场景时间编码改进 :研究更适合不规则采样的位置编码核心创新扎实 :乘法融合有清晰的理论动机(医学等终性、交互项)泛化SOTA :优雅地证明SCANE是特例(d'=1),提供统一框架设计灵活 :广播Hadamard积支持任意维度比例多样化数据集 :覆盖ICU(急性)和HCC(慢性)场景全面消融 :融合策略、维度因子、迁移学习三个维度统计严谨 :Bootstrap置信区间,多指标评估可视化分析 :t-SNE验证嵌入质量结构清晰,动机阐述充分 数学表达精确(公式4-11) 附录详尽(超参数、数据集统计、额外实验) 轻微不足:某些临床术语可能需要更多解释 无需插补,减少预处理复杂度 代码未公开(under submission),但方法描述详细 计算成本较高(32层Transformer) 时间编码矛盾 :承认乘法融合不适合时间编码,但缺乏深入理论解释维度选择 :k的最优值依赖数据集,缺乏自动选择机制分类特征处理 :简单拼接+线性变换,未充分探索乘法融合的潜力迁移实验有限 :仅在两个ICU数据集间测试,HCC未参与特征重叠低 :MI3侧仅18.9%特征重叠,限制迁移潜力评估缺少计算成本分析 :未报告训练时间、内存占用超参数敏感性 :不同数据集需要大幅调整层数(1-32层)特征交互可视化 :缺少具体临床特征的交互分析失败案例分析 :未讨论模型预测错误的情况与SCANE对比不足 :虽证明是特例,但未直接对比不同d'设置下的性能代码未公开 :影响结果验证私有数据集 :HCC数据集无法公开访问随机种子 :未明确说明是否固定理论贡献 :建立乘法融合在EHR建模的理论基础方法贡献 :提供通用框架,可扩展到其他不规则时间序列实证贡献 :在标准基准上建立新SOTA优势 :无需插补,直接处理不规则数据限制 :计算成本高,需要大规模源数据集支持迁移适用场景 :适合有足够计算资源的研究机构和大型医疗中心方法描述详细 :公式和架构清晰缺少代码 :降低可复现性数据部分可用 :P12和MI3公开,HCC私有高缺失率场景 (>70%):无需插补的优势明显不规则采样 :ICU监测、门诊随访等异步数据数值特征主导 :实验室检测、生命体征等连续测量有预训练需求 :可利用大规模源数据集实时预测 :32层Transformer推理延迟较高小样本场景 :迁移学习需要大规模源数据纯分类特征 :乘法融合优势不明显资源受限环境 :边缘设备、移动健康应用自适应维度选择 :开发自动确定k的方法(如神经架构搜索)轻量级变体 :探索知识蒸馏或剪枝减少计算成本多模态扩展 :整合临床笔记、影像数据可解释性增强 :提供特征交互的临床语义解释公开代码和模型 :促进社区验证和应用Huang et al. (2024) : SCANE/SUMMIT - 本文改进的SOTA基线Chrysos et al. (2025) : Hadamard积在深度学习中的综述Tipirneni & Reddy (2022) : STraTS - EVAT范式的代表工作Shukla & Marlin (2021) : mTAN - 连续时间注意力机制Vaswani et al. (2017) : Transformer - 本文backbone架构Johnson et al. (2016) : MIMIC-III数据库 - 关键评估数据集MedFuse是一篇在临床时间序列建模领域具有实质性贡献 的论文。其核心创新——乘法嵌入融合(MuFuse)——不仅在理论上优雅地泛化了现有SOTA方法,还在多个真实世界数据集上取得了一致的性能提升。论文的实验设计全面,从主要性能对比到消融研究、维度分析和迁移学习,系统地验证了方法的有效性。
特别值得称赞的是论文对医学等终性 (medical equifinality)的洞察——通过乘法融合的掩码效应自然建模不同异常偏差对应相同临床风险的现象,这展示了作者对临床领域的深刻理解。
然而,论文也存在一些不足:计算成本较高、迁移学习实验有限、缺少代码公开等。尽管如此,MedFuse为不规则临床时间序列建模提供了一个强大且通用的框架,对推动医疗AI领域的发展具有重要意义。期待看到后续工作在多模态扩展、可解释性和实际临床部署方面的进展。
推荐指数:8.5/10