2025-11-20T04:13:15.349826

Federated Conditional Conformal Prediction via Generative Models

Xu, Xie

Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.

academic

Federated Conditional Conformal Prediction via Generative Models

基本信息

论文ID: 2510.13297
标题: Federated Conditional Conformal Prediction via Generative Models
作者: Rui Xu & Sihong Xie (香港科技大学广州校区)
分类: cs.LG (Machine Learning)
发表时间: 2025年10月15日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.13297

摘要

保形预测(Conformal Prediction, CP)通过构建保证覆盖真实标签的预测集来提供无分布假设的不确定性量化。这种可靠性使CP在多中心医疗等高风险联邦学习场景中具有重要价值。然而，标准CP假设数据独立同分布(i.i.d.)，这在客户端分布差异显著的联邦设置中被违反。现有的联邦CP方法通过在每个客户端维持边际覆盖来解决这个问题，但这种保证往往无法反映输入条件不确定性。本文提出基于生成模型的联邦条件保形预测(Fed-CCP)，旨在实现适应局部数据异质性的条件覆盖。Fed-CCP利用标准化流或扩散模型等生成模型来近似条件数据分布，无需共享原始数据。这使得每个客户端能够局部校准反映其独特不确定性的保形分数，同时通过联邦聚合保持全局一致性。

研究背景与动机

问题定义

核心问题: 在联邦学习环境中，如何实现既保护隐私又能提供输入条件不确定性量化的保形预测？
问题重要性:
- 在医疗、金融等高风险领域，需要可靠的不确定性量化
- 联邦学习场景下数据无法集中，存在显著的分布异质性
- 隐私保护要求限制了原始数据的共享
现有方法局限性:
- 标准CP假设i.i.d.数据，在联邦设置下失效
- 现有联邦CP方法(FCP, FedCP-QQ, DP-FedCP)仅关注边际覆盖
- 边际覆盖产生统一宽度的预测区间，无法反映实例特定的不确定性
- 缺乏在联邦设置下实现条件覆盖的有效方法
研究动机:
- 需要在保护隐私的前提下实现自适应的、实例特定的不确定性量化
- 利用生成模型的分布变换能力来统一异质的客户端分布
- 在参考分布空间进行条件覆盖，再变换回原始分布空间

核心贡献

提出Fed-CCP框架: 首次在联邦学习中实现条件保形预测，通过生成模型构建可变换的预测集
理论创新: 利用双射变换保持条件覆盖保证，从参考高斯分布空间变换到客户端原始数据空间
隐私保护设计: 仅通过梯度交换训练生成模型，无需共享原始数据
客户端自适应: 引入客户端条件器η来建模跨客户端异质性
实验验证: 在医疗、保险、物联网、流行病学、交通预测等5个领域验证了方法的有效性

学习客户端分布 $Q_{XY}$ 到参考分布 $P_{XY}$ 的可逆变换 $f_\theta$
利用变量替换公式优化KL散度： $\min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}]$

扩散模型(Diffusion Models):

通过随机微分方程实现前向扩散过程： $d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t$
反向过程学习去噪，近似逆变换 $g \approx f^{-1}$

2. 可变换预测集构造

对于测试样本 $(X_{n+1}, Y_{n+1}) \sim Q_{XY}$ ：

通过 $f_\theta$ 变换到参考空间： $f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY}$
在参考空间构造条件预测集： $C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\}$
通过逆变换 $g_\theta = f_\theta^{-1}$ 映射回原始空间： $C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\}$

3. 多客户端联邦学习

引入客户端条件器 $\eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2)$ ，使条件生成模型 $f_\theta(x,y;\eta)$ 能够适应不同客户端的分布特性。

技术创新点

双射性保证: 利用生成模型的可逆性确保条件覆盖保证在分布变换下保持不变
条件器机制: 通过客户端特定的高斯条件器建模跨客户端异质性
隐私保护: 基预测模型h仅在参考高斯分布上训练，生成模型训练仅交换梯度信息
统一框架: 将异质的客户端分布统一映射到同一参考分布空间进行条件覆盖

实验设置

数据集

医疗领域: MIMIC-IV、eICU及两家合作医院数据，模拟多中心医疗场景
物联网: Intel Berkeley Research Lab传感器数据，模拟空间分布的传感器网络
保险领域: French Motor Claims数据集(677,991条记录)，按地理区域划分客户端
交通预测: Seattle-Loop、PEMSD4、PEMSD8数据集，不同数据提供方作为客户端
流行病学: US-Regions、US-States、Japan-Prefectures数据，按行政区域划分

评价指标

边际覆盖率: 作为条件覆盖的必要条件进行评估
平均预测集大小: 衡量方法的自适应性，更小的预测集表示更好的条件覆盖近似

对比方法

CQR: 不使用生成模型的保形分位数回归
Fed-CCP (w/o conditioner): 不使用客户端条件器的Fed-CCP
Fed-CCP: 完整的提出方法

实现细节

使用normflows库实现标准化流
参考分布设定为对角协方差的多元高斯分布
目标置信水平设为90% (α=0.1)

实验结果

主要结果

如图1所示，在所有5个领域的实验中：

边际覆盖性能:
- Fed-CCP在所有任务上都达到接近目标90%的覆盖率
- CQR在联邦设置下表现不稳定，经常出现覆盖不足
- 去除条件器的Fed-CCP覆盖率有所下降
预测集大小:
- Fed-CCP在保持有效覆盖的同时实现了相对较小的预测集
- CQR的预测集大小变异性较大
- 无条件器版本产生过大的预测集