2025-11-20T04:13:15.349826

Federated Conditional Conformal Prediction via Generative Models

Xu, Xie

Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.

academic

生成モデルを用いた連合条件適合予測

基本情報

論文ID: 2510.13297
タイトル: Federated Conditional Conformal Prediction via Generative Models
著者: Rui Xu & Sihong Xie（香港科技大学広州キャンパス）
分類: cs.LG（機械学習）
発表日: 2025年10月15日（arXiv プレプリント）
論文リンク: https://arxiv.org/abs/2510.13297

要約

適合予測（Conformal Prediction, CP）は、真のラベルをカバーすることが保証された予測集合を構築することにより、分布に依存しない不確実性定量化を提供する。この信頼性により、CPは多施設医療などの高リスク連合学習シナリオにおいて重要な価値を持つ。しかし、標準的なCPは独立同分布（i.i.d.）データを仮定しており、クライアント間の分布差異が顕著な連合設定ではこの仮定が違反される。既存の連合CP手法は各クライアントで周辺カバレッジを維持することでこの問題に対処しているが、この保証は入力条件付き不確実性を反映できないことが多い。本論文は、生成モデルに基づく連合条件適合予測（Fed-CCP）を提案し、局所データの異質性に適応する条件付きカバレッジの実現を目指している。Fed-CCPは正規化フローや拡散モデルなどの生成モデルを利用して条件付きデータ分布を近似し、生データの共有を必要としない。これにより、各クライアントは独自の不確実性を反映する適合スコアをローカルで校正でき、同時に連合集約を通じてグローバルな一貫性を保つことができる。

研究背景と動機

問題定義

中核的な問題: 連合学習環境において、プライバシーを保護しながら入力条件付き不確実性定量化を提供する適合予測をいかに実現するか？
問題の重要性:
- 医療、金融などの高リスク分野では信頼性の高い不確実性定量化が必要
- 連合学習シナリオではデータを集中管理できず、顕著な分布異質性が存在
- プライバシー保護要件により生データの共有が制限される
既存手法の限界:
- 標準的なCPはi.i.d.データを仮定しており、連合設定では機能しない
- 既存の連合CP手法（FCP、FedCP-QQ、DP-FedCP）は周辺カバレッジのみに焦点
- 周辺カバレッジは統一幅の予測区間を生成し、インスタンス固有の不確実性を反映できない
- 連合設定で条件付きカバレッジを実現する有効な手法が欠けている
研究の動機:
- プライバシー保護の前提下で適応的でインスタンス固有の不確実性定量化を実現する必要性
- 生成モデルの分布変換能力を利用して異質なクライアント分布を統一
- 参照分布空間で条件付きカバレッジを実施し、元の分布空間に変換し直す

核心的な貢献

Fed-CCPフレームワークの提案: 連合学習において条件付き適合予測を初めて実現し、生成モデルを通じて変換可能な予測集合を構築
理論的革新: 双射変換を利用して条件付きカバレッジ保証を保持し、参照ガウス分布空間からクライアント元のデータ空間への変換を実現
プライバシー保護設計: 生成モデルの訓練は勾配交換のみで行われ、生データの共有は不要
クライアント適応: クライアント間異質性をモデル化するためのクライアント条件器ηを導入
実験検証: 医療、保険、IoT、疫学、交通予測の5つの領域で方法の有効性を検証

方法の詳細

タスク定義

K個のクライアントが与えられ、各クライアントkのデータが分布 $Q^{(k)}_{XY}$ に従う場合、予測集合 $C_{Trans}(X_{n+1})$ を構築し、以下の条件付きカバレッジ保証を満たすことが目標である： $\Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X}$

モデルアーキテクチャ

1. 生成モデルの選択

正規化フロー（Normalizing Flows）:

クライアント分布 $Q_{XY}$ から参照分布 $P_{XY}$ への可逆変換 $f_\theta$ を学習
変数変換公式を利用してKL発散を最適化： $\min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}]$

拡散モデル（Diffusion Models）:

確率微分方程式を通じて前向き拡散過程を実現： $d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t$
逆過程でノイズ除去を学習し、逆変換 $g \approx f^{-1}$ を近似

2. 変換可能な予測集合の構築

テスト標本 $(X_{n+1}, Y_{n+1}) \sim Q_{XY}$ に対して：

$f_\theta$ を通じて参照空間に変換： $f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY}$
参照空間で条件付き予測集合を構築： $C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\}$
逆変換 $g_\theta = f_\theta^{-1}$ を通じて元の空間にマッピング： $C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\}$

3. マルチクライアント連合学習

クライアント条件器 $\eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2)$ を導入し、条件付き生成モデル $f_\theta(x,y;\eta)$ が異なるクライアントの分布特性に適応できるようにする。

技術的革新点

双射性の保証: 生成モデルの可逆性を利用して、分布変換下で条件付きカバレッジ保証が不変であることを確保
条件器メカニズム: クライアント固有のガウス条件器を通じてクライアント間異質性をモデル化
プライバシー保護: 基礎予測モデルhは参照ガウス分布上でのみ訓練され、生成モデル訓練は勾配情報交換のみ
統一フレームワーク: 異質なクライアント分布を同一参照分布空間にマッピングして条件付きカバレッジを実施

実験設定

データセット

医療領域: MIMIC-IV、eICUおよび2つの協力病院データ、多施設医療シナリオをシミュレート
IoT: Intel Berkeley Research Lab センサーデータ、空間分布センサーネットワークをシミュレート
保険領域: French Motor Claims データセット（677,991レコード）、地理的地域でクライアントを分割
交通予測: Seattle-Loop、PEMSD4、PEMSD8データセット、異なるデータプロバイダーをクライアントとして
疫学: US-Regions、US-States、Japan-Prefectures データ、行政区域でクライアントを分割

評価指標

周辺カバレッジ率: 条件付きカバレッジの必要条件として評価
平均予測集合サイズ: 手法の適応性を測定、より小さい予測集合はより良い条件付きカバレッジ近似を示す

比較手法

CQR: 生成モデルを使用しない適合分位数回帰
Fed-CCP (条件器なし): クライアント条件器を使用しないFed-CCP
Fed-CCP: 提案された完全な手法

実装の詳細

normFlowsライブラリを使用して正規化フローを実装
参照分布を対角共分散を持つ多変量ガウス分布に設定
目標信頼水準を90%（α=0.1）に設定

実験結果

主要な結果

図1に示すように、5つの領域すべての実験において：

周辺カバレッジ性能:
- Fed-CCPはすべてのタスクで目標90%に近いカバレッジ率を達成
- CQRは連合設定で不安定な性能を示し、カバレッジ不足が頻繁に発生
- 条件器なしのFed-CCPはカバレッジ率が低下
予測集合サイズ:
- Fed-CCPは有効なカバレッジを維持しながら相対的に小さい予測集合を実現
- CQRの予測集合サイズの変動性が大きい
- 条件器なしバージョンは過度に大きい予測集合を生成