Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
論文ID : 2510.13297タイトル : Federated Conditional Conformal Prediction via Generative Models著者 : Rui Xu & Sihong Xie(香港科技大学広州キャンパス)分類 : cs.LG(機械学習)発表日 : 2025年10月15日(arXiv プレプリント)論文リンク : https://arxiv.org/abs/2510.13297 適合予測(Conformal Prediction, CP)は、真のラベルをカバーすることが保証された予測集合を構築することにより、分布に依存しない不確実性定量化を提供する。この信頼性により、CPは多施設医療などの高リスク連合学習シナリオにおいて重要な価値を持つ。しかし、標準的なCPは独立同分布(i.i.d.)データを仮定しており、クライアント間の分布差異が顕著な連合設定ではこの仮定が違反される。既存の連合CP手法は各クライアントで周辺カバレッジを維持することでこの問題に対処しているが、この保証は入力条件付き不確実性を反映できないことが多い。本論文は、生成モデルに基づく連合条件適合予測(Fed-CCP)を提案し、局所データの異質性に適応する条件付きカバレッジの実現を目指している。Fed-CCPは正規化フローや拡散モデルなどの生成モデルを利用して条件付きデータ分布を近似し、生データの共有を必要としない。これにより、各クライアントは独自の不確実性を反映する適合スコアをローカルで校正でき、同時に連合集約を通じてグローバルな一貫性を保つことができる。
中核的な問題 : 連合学習環境において、プライバシーを保護しながら入力条件付き不確実性定量化を提供する適合予測をいかに実現するか?問題の重要性 :医療、金融などの高リスク分野では信頼性の高い不確実性定量化が必要 連合学習シナリオではデータを集中管理できず、顕著な分布異質性が存在 プライバシー保護要件により生データの共有が制限される 既存手法の限界 :標準的なCPはi.i.d.データを仮定しており、連合設定では機能しない 既存の連合CP手法(FCP、FedCP-QQ、DP-FedCP)は周辺カバレッジのみに焦点 周辺カバレッジは統一幅の予測区間を生成し、インスタンス固有の不確実性を反映できない 連合設定で条件付きカバレッジを実現する有効な手法が欠けている 研究の動機 :プライバシー保護の前提下で適応的でインスタンス固有の不確実性定量化を実現する必要性 生成モデルの分布変換能力を利用して異質なクライアント分布を統一 参照分布空間で条件付きカバレッジを実施し、元の分布空間に変換し直す Fed-CCPフレームワークの提案 : 連合学習において条件付き適合予測を初めて実現し、生成モデルを通じて変換可能な予測集合を構築理論的革新 : 双射変換を利用して条件付きカバレッジ保証を保持し、参照ガウス分布空間からクライアント元のデータ空間への変換を実現プライバシー保護設計 : 生成モデルの訓練は勾配交換のみで行われ、生データの共有は不要クライアント適応 : クライアント間異質性をモデル化するためのクライアント条件器ηを導入実験検証 : 医療、保険、IoT、疫学、交通予測の5つの領域で方法の有効性を検証K個のクライアントが与えられ、各クライアントkのデータが分布Q X Y ( k ) Q^{(k)}_{XY} Q X Y ( k ) に従う場合、予測集合C T r a n s ( X n + 1 ) C_{Trans}(X_{n+1}) C T r an s ( X n + 1 ) を構築し、以下の条件付きカバレッジ保証を満たすことが目標である:
Pr ( Y n + 1 ∈ C T r a n s ( X n + 1 ) ∣ X n + 1 = x ) ≥ 1 − α , ∀ x ∈ X \Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X} Pr ( Y n + 1 ∈ C T r an s ( X n + 1 ) ∣ X n + 1 = x ) ≥ 1 − α , ∀ x ∈ X
正規化フロー(Normalizing Flows) :
クライアント分布Q X Y Q_{XY} Q X Y から参照分布P X Y P_{XY} P X Y への可逆変換f θ f_\theta f θ を学習 変数変換公式を利用してKL発散を最適化:
min θ D K L ( f θ # q X Y ∥ p X Y ) = min θ − E ( x , y ) ∼ Q X Y [ log p X Y ( f θ ( x , y ) ) + log ∣ det ∂ f θ ( x , y ) ∂ ( x , y ) ∣ − 1 ] \min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}] min θ D K L ( f θ # q X Y ∥ p X Y ) = min θ − E ( x , y ) ∼ Q X Y [ log p X Y ( f θ ( x , y )) + log ∣ det ∂ ( x , y ) ∂ f θ ( x , y ) ∣ − 1 ] 拡散モデル(Diffusion Models) :
確率微分方程式を通じて前向き拡散過程を実現:
d ( X t , Y t ) = − 1 2 β t ( X t , Y t ) d t + β t d W t d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t d ( X t , Y t ) = − 2 1 β t ( X t , Y t ) d t + β t d W t 逆過程でノイズ除去を学習し、逆変換g ≈ f − 1 g \approx f^{-1} g ≈ f − 1 を近似 テスト標本( X n + 1 , Y n + 1 ) ∼ Q X Y (X_{n+1}, Y_{n+1}) \sim Q_{XY} ( X n + 1 , Y n + 1 ) ∼ Q X Y に対して:
f θ f_\theta f θ を通じて参照空間に変換:f θ ( X n + 1 , Y n + 1 ) = ( X ~ n + 1 , Y ~ n + 1 ) ∼ P X Y f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY} f θ ( X n + 1 , Y n + 1 ) = ( X ~ n + 1 , Y ~ n + 1 ) ∼ P X Y 参照空間で条件付き予測集合を構築:C A ( X ~ n + 1 ) = { y ~ ∈ Y : s ( X ~ n + 1 , y ~ ) ≤ τ ( X ~ n + 1 ) } C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\} C A ( X ~ n + 1 ) = { y ~ ∈ Y : s ( X ~ n + 1 , y ~ ) ≤ τ ( X ~ n + 1 )} 逆変換g θ = f θ − 1 g_\theta = f_\theta^{-1} g θ = f θ − 1 を通じて元の空間にマッピング:
C T r a n s ( X n + 1 ) = { y ∈ Y : y ~ ∈ C A ( X ~ n + 1 ) , g θ ( X ~ n + 1 , y ~ ) = ( X n + 1 , y ) } C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\} C T r an s ( X n + 1 ) = { y ∈ Y : y ~ ∈ C A ( X ~ n + 1 ) , g θ ( X ~ n + 1 , y ~ ) = ( X n + 1 , y )} クライアント条件器η ( k ) ∼ N ( μ ( k ) , ( σ ( k ) ) 2 ) \eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2) η ( k ) ∼ N ( μ ( k ) , ( σ ( k ) ) 2 ) を導入し、条件付き生成モデルf θ ( x , y ; η ) f_\theta(x,y;\eta) f θ ( x , y ; η ) が異なるクライアントの分布特性に適応できるようにする。
双射性の保証 : 生成モデルの可逆性を利用して、分布変換下で条件付きカバレッジ保証が不変であることを確保条件器メカニズム : クライアント固有のガウス条件器を通じてクライアント間異質性をモデル化プライバシー保護 : 基礎予測モデルhは参照ガウス分布上でのみ訓練され、生成モデル訓練は勾配情報交換のみ統一フレームワーク : 異質なクライアント分布を同一参照分布空間にマッピングして条件付きカバレッジを実施医療領域 : MIMIC-IV、eICUおよび2つの協力病院データ、多施設医療シナリオをシミュレートIoT : Intel Berkeley Research Lab センサーデータ、空間分布センサーネットワークをシミュレート保険領域 : French Motor Claims データセット(677,991レコード)、地理的地域でクライアントを分割交通予測 : Seattle-Loop、PEMSD4、PEMSD8データセット、異なるデータプロバイダーをクライアントとして疫学 : US-Regions、US-States、Japan-Prefectures データ、行政区域でクライアントを分割周辺カバレッジ率 : 条件付きカバレッジの必要条件として評価平均予測集合サイズ : 手法の適応性を測定、より小さい予測集合はより良い条件付きカバレッジ近似を示すCQR : 生成モデルを使用しない適合分位数回帰Fed-CCP (条件器なし) : クライアント条件器を使用しないFed-CCPFed-CCP : 提案された完全な手法normFlowsライブラリを使用して正規化フローを実装 参照分布を対角共分散を持つ多変量ガウス分布に設定 目標信頼水準を90%(α=0.1)に設定 図1に示すように、5つの領域すべての実験において:
周辺カバレッジ性能 :Fed-CCPはすべてのタスクで目標90%に近いカバレッジ率を達成 CQRは連合設定で不安定な性能を示し、カバレッジ不足が頻繁に発生 条件器なしのFed-CCPはカバレッジ率が低下 予測集合サイズ :Fed-CCPは有効なカバレッジを維持しながら相対的に小さい予測集合を実現 CQRの予測集合サイズの変動性が大きい 条件器なしバージョンは過度に大きい予測集合を生成 生成モデルの必要性 : CQRが分布シフト下で失効し、生成モデル対齢の重要性を証明条件器の重要な役割 : クライアント条件器ηはクライアント間異質性の捕捉に不可欠適応性 : Fed-CCPは有効でインスタンス固有の適応的な予測集合を生成可能クロスドメイン堅牢性 : 異なるアプリケーション領域で一貫した有効性を示す実験結果はFed-CCPの2つの核心的仮説を確認:
双射生成対齢はクライアント分布の効果的な調整を実現 条件器メカニズムはクライアント固有特性の成功的なモデル化を実現 古典的CP : Vovkらのアルゴリズム学習理論基礎条件付きCP : インスタンス固有不確実性の適応的手法分位数回帰CP : Romanoらのcqr手法FCP & FedCP-QQ : 混合分布のカバレッジ保証DP-FedCP : ラベルシフト処理の差分プライバシー手法分散CP : グラフトポロジーに基づく隣接通信手法正規化フロー : 密度モデリング用の可逆ニューラルネットワーク拡散モデル : 確率過程に基づく生成モデリングFed-CCPは連合環境での条件付き適合予測を成功裏に実現 生成モデルは有効な分布対齢メカニズムを提供 クライアント条件器は異質性処理の重要な構成要素 手法は複数の実際のアプリケーション領域で堅牢性を示す 計算複雑性 : 生成モデル訓練は計算オーバーヘッドを増加理論分析 : 有限標本下での理論保証が欠けているハイパーパラメータ感度 : クライアント条件器パラメータの選択が性能に影響する可能性スケーラビリティ : 大規模クライアントシナリオでの性能は検証待ちより厳密な理論分析フレームワークの構築 より効率的な生成モデルアーキテクチャの探索 動的クライアントシナリオでの適応メカニズムの研究 分類などの他のタスクタイプへの拡張 革新性が強い : 生成モデルを連合適合予測に初めて導入し、条件付きカバレッジを実現理論基礎が堅実 : 双射変換に基づくカバレッジ保証は数学的に厳密プライバシー保護 : 連合学習のプライバシー要件を十分に考慮した設計実験が包括的 : 5つの異なる領域での検証により結果の信頼性を強化実用的価値 : 実際のアプリケーションにおける重要な問題を解決理論分析が不十分 : 有限標本複雑性と収束性分析が欠けている計算オーバーヘッド : 生成モデル訓練の計算コストが実際のアプリケーションを制限する可能性パラメータ感度 : クライアント条件器設計の理論的指導が不足比較実験 : 他の連合CP手法との直接比較が欠けている学術的貢献 : 連合学習における不確実性定量化の新しい方向を開拓実用的価値 : 医療、金融などの高リスク領域での重要な応用前景方法論的価値 : 生成モデルと適合予測の結合は普遍的意義を持つ多施設医療 : 異なる病院間の協力診断と予測金融リスク管理 : 機関間のリスク評価と不確実性定量化IoT : 分散センサーネットワークの信頼性予測スマートシティ : 地域間の交通、環境などの予測タスク本論文は適合予測、連合学習、生成モデルなどの領域の重要な文献を引用しており、以下を含む:
Vovkらの適合予測理論基礎 Romanoらのcqr手法 Luらの連合適合予測研究 正規化フローと拡散モデルの古典文献 総合評価 : これは機械学習の高品質論文であり、連合学習と不確実性定量化の交差領域で重要な貢献を行っている。手法は革新的で、実験は包括的であり、理論的意義と実用的価値を持つ。理論分析と計算効率の面でのさらなる改善を推奨する。