Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
논문 ID : 2510.13297제목 : Federated Conditional Conformal Prediction via Generative Models저자 : Rui Xu & Sihong Xie (홍콩과학기술대학교 광저우 캠퍼스)분류 : cs.LG (기계학습)발표 시간 : 2025년 10월 15일 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2510.13297 적합 예측(Conformal Prediction, CP)은 실제 레이블을 포함하는 예측 집합을 구성하여 분포 무관 불확실성 정량화를 제공합니다. 이러한 신뢰성은 다기관 의료 등 고위험 연합학습 시나리오에서 CP의 중요한 가치를 만듭니다. 그러나 표준 CP는 데이터가 독립동일분포(i.i.d.)라고 가정하는데, 이는 클라이언트 분포 차이가 큰 연합 설정에서 위반됩니다. 기존 연합 CP 방법은 각 클라이언트에서 주변 적용률을 유지하여 이 문제를 해결하지만, 이러한 보장은 입력 조건부 불확실성을 반영하지 못합니다. 본 논문은 생성 모델 기반 연합 조건부 적합 예측(Fed-CCP)을 제안하여 지역 데이터 이질성에 적응하는 조건부 적용률을 달성합니다. Fed-CCP는 정규화 흐름 또는 확산 모델과 같은 생성 모델을 활용하여 조건부 데이터 분포를 근사하며, 원본 데이터 공유가 필요하지 않습니다. 이를 통해 각 클라이언트는 고유한 불확실성을 반영하는 적합 점수를 지역적으로 보정할 수 있으면서 연합 집계를 통해 전역 일관성을 유지합니다.
핵심 문제 : 연합학습 환경에서 개인정보 보호와 입력 조건부 불확실성 정량화를 모두 제공하는 적합 예측을 어떻게 구현할 것인가?문제의 중요성 :의료, 금융 등 고위험 분야에서 신뢰할 수 있는 불확실성 정량화가 필요함 연합학습 시나리오에서 데이터를 중앙화할 수 없으며, 현저한 분포 이질성이 존재함 개인정보 보호 요구사항이 원본 데이터 공유를 제한함 기존 방법의 한계 :표준 CP는 i.i.d. 데이터를 가정하며, 연합 설정에서 실패함 기존 연합 CP 방법(FCP, FedCP-QQ, DP-FedCP)은 주변 적용률만 고려함 주변 적용률은 균일한 너비의 예측 구간을 생성하며, 인스턴스별 불확실성을 반영하지 못함 연합 설정에서 조건부 적용률을 구현하는 효과적인 방법이 부족함 연구 동기 :개인정보 보호 전제 하에서 적응형, 인스턴스별 불확실성 정량화 필요 생성 모델의 분포 변환 능력을 활용하여 이질적인 클라이언트 분포 통합 참조 분포 공간에서 조건부 적용률을 수행한 후 원본 분포 공간으로 변환 Fed-CCP 프레임워크 제안 : 연합학습에서 조건부 적합 예측을 처음으로 구현하며, 생성 모델을 통해 변환 가능한 예측 집합 구성이론적 혁신 : 전단사 변환을 활용하여 참조 가우스 분포 공간에서 클라이언트 원본 데이터 공간으로의 조건부 적용률 보장 유지개인정보 보호 설계 : 생성 모델 훈련 시 그래디언트 교환만으로 원본 데이터 공유 불필요클라이언트 자적응 : 클라이언트 조건기 η를 도입하여 클라이언트 간 이질성 모델링실험 검증 : 의료, 보험, IoT, 역학, 교통 예측 등 5개 분야에서 방법의 유효성 검증K개의 클라이언트가 주어지고, 각 클라이언트 k의 데이터가 분포 Q X Y ( k ) Q^{(k)}_{XY} Q X Y ( k ) 를 따를 때, 다음의 조건부 적용률 보장을 만족하는 예측 집합 C T r a n s ( X n + 1 ) C_{Trans}(X_{n+1}) C T r an s ( X n + 1 ) 을 구성하는 것이 목표입니다:
Pr ( Y n + 1 ∈ C T r a n s ( X n + 1 ) ∣ X n + 1 = x ) ≥ 1 − α , ∀ x ∈ X \Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X} Pr ( Y n + 1 ∈ C T r an s ( X n + 1 ) ∣ X n + 1 = x ) ≥ 1 − α , ∀ x ∈ X
정규화 흐름(Normalizing Flows) :
클라이언트 분포 Q X Y Q_{XY} Q X Y 에서 참조 분포 P X Y P_{XY} P X Y 로의 가역 변환 f θ f_\theta f θ 학습 변수 치환 공식을 활용하여 KL 발산 최적화:
min θ D K L ( f θ # q X Y ∥ p X Y ) = min θ − E ( x , y ) ∼ Q X Y [ log p X Y ( f θ ( x , y ) ) + log ∣ det ∂ f θ ( x , y ) ∂ ( x , y ) ∣ − 1 ] \min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}] min θ D K L ( f θ # q X Y ∥ p X Y ) = min θ − E ( x , y ) ∼ Q X Y [ log p X Y ( f θ ( x , y )) + log ∣ det ∂ ( x , y ) ∂ f θ ( x , y ) ∣ − 1 ] 확산 모델(Diffusion Models) :
확률 미분 방정식을 통해 전진 확산 과정 구현:
d ( X t , Y t ) = − 1 2 β t ( X t , Y t ) d t + β t d W t d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t d ( X t , Y t ) = − 2 1 β t ( X t , Y t ) d t + β t d W t 역과정에서 노이즈 제거를 학습하여 역변환 g ≈ f − 1 g \approx f^{-1} g ≈ f − 1 근사 테스트 샘플 ( X n + 1 , Y n + 1 ) ∼ Q X Y (X_{n+1}, Y_{n+1}) \sim Q_{XY} ( X n + 1 , Y n + 1 ) ∼ Q X Y 에 대해:
f θ f_\theta f θ 를 통해 참조 공간으로 변환: f θ ( X n + 1 , Y n + 1 ) = ( X ~ n + 1 , Y ~ n + 1 ) ∼ P X Y f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY} f θ ( X n + 1 , Y n + 1 ) = ( X ~ n + 1 , Y ~ n + 1 ) ∼ P X Y 참조 공간에서 조건부 예측 집합 구성: C A ( X ~ n + 1 ) = { y ~ ∈ Y : s ( X ~ n + 1 , y ~ ) ≤ τ ( X ~ n + 1 ) } C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\} C A ( X ~ n + 1 ) = { y ~ ∈ Y : s ( X ~ n + 1 , y ~ ) ≤ τ ( X ~ n + 1 )} 역변환 g θ = f θ − 1 g_\theta = f_\theta^{-1} g θ = f θ − 1 을 통해 원본 공간으로 매핑:
C T r a n s ( X n + 1 ) = { y ∈ Y : y ~ ∈ C A ( X ~ n + 1 ) , g θ ( X ~ n + 1 , y ~ ) = ( X n + 1 , y ) } C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\} C T r an s ( X n + 1 ) = { y ∈ Y : y ~ ∈ C A ( X ~ n + 1 ) , g θ ( X ~ n + 1 , y ~ ) = ( X n + 1 , y )} 클라이언트 조건기 η ( k ) ∼ N ( μ ( k ) , ( σ ( k ) ) 2 ) \eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2) η ( k ) ∼ N ( μ ( k ) , ( σ ( k ) ) 2 ) 를 도입하여 조건부 생성 모델 f θ ( x , y ; η ) f_\theta(x,y;\eta) f θ ( x , y ; η ) 이 서로 다른 클라이언트의 분포 특성에 적응할 수 있도록 함.
전단사성 보장 : 생성 모델의 가역성을 활용하여 분포 변환 하에서 조건부 적용률 보장이 불변임을 보장조건기 메커니즘 : 클라이언트별 가우스 조건기를 통해 클라이언트 간 이질성 모델링개인정보 보호 : 기본 예측 모델 h는 참조 가우스 분포에서만 훈련되며, 생성 모델 훈련은 그래디언트 정보만 교환통합 프레임워크 : 이질적인 클라이언트 분포를 동일한 참조 분포 공간으로 통합 매핑하여 조건부 적용률 수행의료 분야 : MIMIC-IV, eICU 및 두 협력 병원 데이터로 다기관 의료 시나리오 모의IoT : Intel Berkeley Research Lab 센서 데이터로 공간 분포 센서 네트워크 모의보험 분야 : French Motor Claims 데이터셋(677,991개 레코드)을 지리적 지역별로 클라이언트 분할교통 예측 : Seattle-Loop, PEMSD4, PEMSD8 데이터셋으로 서로 다른 데이터 제공자를 클라이언트로 설정역학 : US-Regions, US-States, Japan-Prefectures 데이터를 행정 구역별로 분할주변 적용률 : 조건부 적용률의 필요조건으로 평가평균 예측 집합 크기 : 방법의 자적응성 측정, 더 작은 예측 집합은 더 나은 조건부 적용률 근사를 의미CQR : 생성 모델을 사용하지 않는 적합 분위수 회귀Fed-CCP (조건기 없음) : 클라이언트 조건기를 사용하지 않는 Fed-CCPFed-CCP : 완전한 제안 방법normflows 라이브러리를 사용하여 정규화 흐름 구현 참조 분포를 대각 공분산을 가진 다변량 가우스 분포로 설정 목표 신뢰 수준을 90% (α=0.1)로 설정 그림 1에서 보이듯이 모든 5개 분야의 실험에서:
주변 적용률 성능 :Fed-CCP는 모든 작업에서 목표 90% 근처의 적용률 달성 CQR은 연합 설정에서 불안정한 성능을 보이며 자주 적용률 부족 발생 조건기를 제거한 Fed-CCP의 적용률이 감소함 예측 집합 크기 :Fed-CCP는 유효한 적용률을 유지하면서 상대적으로 작은 예측 집합 달성 CQR의 예측 집합 크기 변동성이 큼 조건기 없는 버전은 과도하게 큰 예측 집합 생성 생성 모델의 필요성 : CQR이 분포 이동 하에서 실패하여 생성 모델 정렬의 중요성 증명조건기의 핵심 역할 : 클라이언트 조건기 η는 클라이언트 간 이질성 포착에 필수적자적응성 : Fed-CCP는 효과적이면서도 자적응형 인스턴스별 예측 집합 생성 가능도메인 간 견고성 : 방법은 서로 다른 응용 분야에서 일관된 유효성 표현실험 결과는 Fed-CCP의 두 가지 핵심 가정을 확인합니다:
전단사 생성 정렬이 클라이언트 분포를 효과적으로 조정 조건기 메커니즘이 클라이언트별 특성을 성공적으로 모델링 고전 CP : Vovk 등의 알고리즘 학습 이론 기초조건부 CP : 인스턴스별 불확실성을 위한 자적응 방법분위수 회귀 CP : Romano 등의 CQR 방법FCP & FedCP-QQ : 혼합 분포에 대한 적용률 보장DP-FedCP : 레이블 이동을 처리하는 차등 개인정보 보호 방법분산 CP : 그래프 위상 기반 이웃 통신 방법정규화 흐름 : 밀도 모델링을 위한 가역 신경망확산 모델 : 확률 과정 기반 생성 모델링Fed-CCP는 연합 환경에서 조건부 적합 예측을 성공적으로 구현 생성 모델은 효과적인 분포 정렬 메커니즘 제공 클라이언트 조건기는 이질성 처리의 핵심 구성 요소 방법은 여러 실제 응용 분야에서 견고성 입증 계산 복잡성 : 생성 모델 훈련이 계산 오버헤드 증가이론적 분석 : 유한 샘플 하에서의 이론적 보장 부족하이퍼파라미터 민감성 : 클라이언트 조건기 파라미터 선택이 성능에 영향 가능확장성 : 대규모 클라이언트 시나리오에서의 성능 검증 필요더 엄격한 이론적 분석 프레임워크 구축 더 효율적인 생성 모델 아키텍처 탐색 동적 클라이언트 시나리오에서의 자적응 메커니즘 연구 분류 등 다른 작업 유형으로 확장 높은 혁신성 : 생성 모델을 연합 적합 예측에 처음 도입하여 조건부 적용률 달성견고한 이론적 기초 : 전단사 변환 기반 적용률 보장이 수학적으로 엄밀함개인정보 보호 : 설계가 연합학습의 개인정보 보호 요구사항을 충분히 고려포괄적 실험 : 5개 분야에 걸친 검증으로 결과 신뢰도 향상실용적 가치 : 실제 응용에서의 중요한 문제 해결이론적 분석 부족 : 유한 샘플 복잡도 및 수렴성 분석 부재계산 오버헤드 : 생성 모델 훈련의 계산 비용이 실제 응용을 제한할 수 있음파라미터 민감성 : 클라이언트 조건기 설계의 이론적 지도 부족비교 실험 : 다른 연합 CP 방법과의 직접 비교 부족학술적 기여 : 연합학습에서 불확실성 정량화의 새로운 방향 개척실용적 가치 : 의료, 금융 등 고위험 분야에서 중요한 응용 전망방법론적 가치 : 생성 모델과 적합 예측의 결합이 일반적 의미를 가짐다기관 의료 : 서로 다른 병원 간의 협력 진단 및 예측금융 위험 관리 : 기관 간 위험 평가 및 불확실성 정량화IoT : 분산 센서 네트워크의 신뢰할 수 있는 예측스마트 시티 : 지역 간 교통, 환경 등 예측 작업본 논문은 적합 예측, 연합학습, 생성 모델 등 분야의 중요 문헌을 인용하고 있으며, 다음을 포함합니다:
Vovk 등의 적합 예측 이론적 기초 Romano 등의 CQR 방법 Lu 등의 연합 적합 예측 연구 정규화 흐름 및 확산 모델의 고전 문헌 종합 평가 : 이는 연합학습과 불확실성 정량화의 교차 분야에서 중요한 기여를 한 고품질 기계학습 논문입니다. 방법이 참신하고 실험이 충분하며 중요한 이론적 의미와 실용적 가치를 가집니다. 이론적 분석과 계산 효율성 측면에서 추가 개선을 권장합니다.