Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
论文ID : 2510.13297标题 : Federated Conditional Conformal Prediction via Generative Models作者 : Rui Xu & Sihong Xie (香港科技大学广州校区)分类 : cs.LG (Machine Learning)发表时间 : 2025年10月15日 (arXiv预印本)论文链接 : https://arxiv.org/abs/2510.13297 保形预测(Conformal Prediction, CP)通过构建保证覆盖真实标签的预测集来提供无分布假设的不确定性量化。这种可靠性使CP在多中心医疗等高风险联邦学习场景中具有重要价值。然而,标准CP假设数据独立同分布(i.i.d.),这在客户端分布差异显著的联邦设置中被违反。现有的联邦CP方法通过在每个客户端维持边际覆盖来解决这个问题,但这种保证往往无法反映输入条件不确定性。本文提出基于生成模型的联邦条件保形预测(Fed-CCP),旨在实现适应局部数据异质性的条件覆盖。Fed-CCP利用标准化流或扩散模型等生成模型来近似条件数据分布,无需共享原始数据。这使得每个客户端能够局部校准反映其独特不确定性的保形分数,同时通过联邦聚合保持全局一致性。
核心问题 : 在联邦学习环境中,如何实现既保护隐私又能提供输入条件不确定性量化的保形预测?问题重要性 :在医疗、金融等高风险领域,需要可靠的不确定性量化 联邦学习场景下数据无法集中,存在显著的分布异质性 隐私保护要求限制了原始数据的共享 现有方法局限性 :标准CP假设i.i.d.数据,在联邦设置下失效 现有联邦CP方法(FCP, FedCP-QQ, DP-FedCP)仅关注边际覆盖 边际覆盖产生统一宽度的预测区间,无法反映实例特定的不确定性 缺乏在联邦设置下实现条件覆盖的有效方法 研究动机 :需要在保护隐私的前提下实现自适应的、实例特定的不确定性量化 利用生成模型的分布变换能力来统一异质的客户端分布 在参考分布空间进行条件覆盖,再变换回原始分布空间 提出Fed-CCP框架 : 首次在联邦学习中实现条件保形预测,通过生成模型构建可变换的预测集理论创新 : 利用双射变换保持条件覆盖保证,从参考高斯分布空间变换到客户端原始数据空间隐私保护设计 : 仅通过梯度交换训练生成模型,无需共享原始数据客户端自适应 : 引入客户端条件器η来建模跨客户端异质性实验验证 : 在医疗、保险、物联网、流行病学、交通预测等5个领域验证了方法的有效性给定K个客户端,每个客户端k的数据遵循分布Q X Y ( k ) Q^{(k)}_{XY} Q X Y ( k ) ,目标是构建预测集C T r a n s ( X n + 1 ) C_{Trans}(X_{n+1}) C T r an s ( X n + 1 ) ,使其满足条件覆盖保证:
Pr ( Y n + 1 ∈ C T r a n s ( X n + 1 ) ∣ X n + 1 = x ) ≥ 1 − α , ∀ x ∈ X \Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X} Pr ( Y n + 1 ∈ C T r an s ( X n + 1 ) ∣ X n + 1 = x ) ≥ 1 − α , ∀ x ∈ X
标准化流(Normalizing Flows) :
学习客户端分布Q X Y Q_{XY} Q X Y 到参考分布P X Y P_{XY} P X Y 的可逆变换f θ f_\theta f θ 利用变量替换公式优化KL散度:
min θ D K L ( f θ # q X Y ∥ p X Y ) = min θ − E ( x , y ) ∼ Q X Y [ log p X Y ( f θ ( x , y ) ) + log ∣ det ∂ f θ ( x , y ) ∂ ( x , y ) ∣ − 1 ] \min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}] min θ D K L ( f θ # q X Y ∥ p X Y ) = min θ − E ( x , y ) ∼ Q X Y [ log p X Y ( f θ ( x , y )) + log ∣ det ∂ ( x , y ) ∂ f θ ( x , y ) ∣ − 1 ] 扩散模型(Diffusion Models) :
通过随机微分方程实现前向扩散过程:
d ( X t , Y t ) = − 1 2 β t ( X t , Y t ) d t + β t d W t d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t d ( X t , Y t ) = − 2 1 β t ( X t , Y t ) d t + β t d W t 反向过程学习去噪,近似逆变换g ≈ f − 1 g \approx f^{-1} g ≈ f − 1 对于测试样本( X n + 1 , Y n + 1 ) ∼ Q X Y (X_{n+1}, Y_{n+1}) \sim Q_{XY} ( X n + 1 , Y n + 1 ) ∼ Q X Y :
通过f θ f_\theta f θ 变换到参考空间:f θ ( X n + 1 , Y n + 1 ) = ( X ~ n + 1 , Y ~ n + 1 ) ∼ P X Y f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY} f θ ( X n + 1 , Y n + 1 ) = ( X ~ n + 1 , Y ~ n + 1 ) ∼ P X Y 在参考空间构造条件预测集:C A ( X ~ n + 1 ) = { y ~ ∈ Y : s ( X ~ n + 1 , y ~ ) ≤ τ ( X ~ n + 1 ) } C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\} C A ( X ~ n + 1 ) = { y ~ ∈ Y : s ( X ~ n + 1 , y ~ ) ≤ τ ( X ~ n + 1 )} 通过逆变换g θ = f θ − 1 g_\theta = f_\theta^{-1} g θ = f θ − 1 映射回原始空间:
C T r a n s ( X n + 1 ) = { y ∈ Y : y ~ ∈ C A ( X ~ n + 1 ) , g θ ( X ~ n + 1 , y ~ ) = ( X n + 1 , y ) } C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\} C T r an s ( X n + 1 ) = { y ∈ Y : y ~ ∈ C A ( X ~ n + 1 ) , g θ ( X ~ n + 1 , y ~ ) = ( X n + 1 , y )} 引入客户端条件器η ( k ) ∼ N ( μ ( k ) , ( σ ( k ) ) 2 ) \eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2) η ( k ) ∼ N ( μ ( k ) , ( σ ( k ) ) 2 ) ,使条件生成模型f θ ( x , y ; η ) f_\theta(x,y;\eta) f θ ( x , y ; η ) 能够适应不同客户端的分布特性。
双射性保证 : 利用生成模型的可逆性确保条件覆盖保证在分布变换下保持不变条件器机制 : 通过客户端特定的高斯条件器建模跨客户端异质性隐私保护 : 基预测模型h仅在参考高斯分布上训练,生成模型训练仅交换梯度信息统一框架 : 将异质的客户端分布统一映射到同一参考分布空间进行条件覆盖医疗领域 : MIMIC-IV、eICU及两家合作医院数据,模拟多中心医疗场景物联网 : Intel Berkeley Research Lab传感器数据,模拟空间分布的传感器网络保险领域 : French Motor Claims数据集(677,991条记录),按地理区域划分客户端交通预测 : Seattle-Loop、PEMSD4、PEMSD8数据集,不同数据提供方作为客户端流行病学 : US-Regions、US-States、Japan-Prefectures数据,按行政区域划分边际覆盖率 : 作为条件覆盖的必要条件进行评估平均预测集大小 : 衡量方法的自适应性,更小的预测集表示更好的条件覆盖近似CQR : 不使用生成模型的保形分位数回归Fed-CCP (w/o conditioner) : 不使用客户端条件器的Fed-CCPFed-CCP : 完整的提出方法使用normflows库实现标准化流 参考分布设定为对角协方差的多元高斯分布 目标置信水平设为90% (α=0.1) 如图1所示,在所有5个领域的实验中:
边际覆盖性能 :Fed-CCP在所有任务上都达到接近目标90%的覆盖率 CQR在联邦设置下表现不稳定,经常出现覆盖不足 去除条件器的Fed-CCP覆盖率有所下降 预测集大小 :Fed-CCP在保持有效覆盖的同时实现了相对较小的预测集 CQR的预测集大小变异性较大 无条件器版本产生过大的预测集 生成模型的必要性 : CQR在分布偏移下失效,证明了生成模型对齐的重要性条件器的关键作用 : 客户端条件器η对于捕获跨客户端异质性至关重要自适应性 : Fed-CCP能够产生既有效又自适应的实例特定预测集跨域鲁棒性 : 方法在不同应用领域都表现出一致的有效性实验结果确认了Fed-CCP的两个核心假设:
双射生成对齐能够有效协调客户端分布 条件器机制成功建模了客户端特定特征 经典CP : Vovk等人的算法学习理论基础条件CP : 针对实例特定不确定性的自适应方法分位数回归CP : Romano等人的CQR方法FCP & FedCP-QQ : 针对混合分布的覆盖保证DP-FedCP : 处理标签偏移的差分隐私方法分布式CP : 基于图拓扑的邻居通信方法标准化流 : 可逆神经网络用于密度建模扩散模型 : 基于随机过程的生成建模Fed-CCP成功实现了联邦环境下的条件保形预测 生成模型提供了有效的分布对齐机制 客户端条件器是处理异质性的关键组件 方法在多个实际应用领域展现了鲁棒性 计算复杂性 : 生成模型训练增加了计算开销理论分析 : 缺乏有限样本下的理论保证超参数敏感性 : 客户端条件器参数的选择可能影响性能可扩展性 : 大规模客户端场景下的性能有待验证建立更严格的理论分析框架 探索更高效的生成模型架构 研究动态客户端场景下的自适应机制 扩展到分类等其他任务类型 创新性强 : 首次将生成模型引入联邦保形预测,实现条件覆盖理论基础扎实 : 基于双射变换的覆盖保证具有数学严谨性隐私保护 : 设计充分考虑了联邦学习的隐私要求实验全面 : 跨5个不同领域的验证增强了结果可信度实用价值 : 解决了实际应用中的重要问题理论分析不足 : 缺乏有限样本复杂度和收敛性分析计算开销 : 生成模型训练的计算成本可能限制实际应用参数敏感性 : 客户端条件器设计的理论指导不足对比实验 : 缺少与其他联邦CP方法的直接对比学术贡献 : 为联邦学习中的不确定性量化开辟了新方向实用价值 : 在医疗、金融等高风险领域有重要应用前景方法论价值 : 生成模型与保形预测的结合具有普遍意义多中心医疗 : 不同医院间的协作诊断和预测金融风控 : 跨机构的风险评估和不确定性量化物联网 : 分布式传感器网络的可靠预测智慧城市 : 跨区域的交通、环境等预测任务本文引用了保形预测、联邦学习、生成模型等领域的重要文献,包括:
Vovk等人的保形预测理论基础 Romano等人的CQR方法 Lu等人的联邦保形预测工作 标准化流和扩散模型的经典文献 总体评价 : 这是一篇高质量的机器学习论文,在联邦学习和不确定性量化的交叉领域做出了重要贡献。方法新颖,实验充分,具有重要的理论意义和实用价值。建议在理论分析和计算效率方面进一步完善。