Federated Conditional Conformal Prediction via Generative Models
Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
academic
Predicción Conforme Condicional Federada mediante Modelos Generativos
La predicción conforme (Conformal Prediction, CP) proporciona cuantificación de incertidumbre sin supuestos de distribución mediante la construcción de conjuntos de predicción que garantizan la cobertura de etiquetas verdaderas. Esta confiabilidad hace que CP sea de gran valor en escenarios de aprendizaje federado de alto riesgo, como la medicina multicéntrica. Sin embargo, CP estándar asume que los datos son independientes e idénticamente distribuidos (i.i.d.), supuesto que se viola en configuraciones federadas con variaciones significativas de distribución entre clientes. Los métodos existentes de CP federado abordan este problema manteniendo cobertura marginal en cada cliente, pero estas garantías a menudo no reflejan la incertidumbre condicional de entrada. Este artículo propone predicción conforme condicional federada basada en modelos generativos (Fed-CCP), con el objetivo de lograr cobertura condicional adaptada a la heterogeneidad de datos locales. Fed-CCP utiliza modelos generativos como flujos normalizadores o modelos de difusión para aproximar distribuciones de datos condicionales sin compartir datos sin procesar. Esto permite que cada cliente calibre localmente puntuaciones conformes que reflejen su incertidumbre única, mientras mantiene consistencia global mediante agregación federada.
Problema Central: ¿Cómo lograr predicción conforme que proteja la privacidad y proporcione cuantificación de incertidumbre condicional de entrada en un entorno de aprendizaje federado?
Importancia del Problema:
En dominios de alto riesgo como medicina y finanzas, se requiere cuantificación confiable de incertidumbre
En escenarios de aprendizaje federado, los datos no pueden centralizarse, existiendo heterogeneidad significativa de distribución
Los requisitos de protección de privacidad limitan el intercambio de datos sin procesar
Limitaciones de Métodos Existentes:
CP estándar asume datos i.i.d., fallando en configuraciones federadas
Los métodos existentes de CP federado (FCP, FedCP-QQ, DP-FedCP) solo se enfocan en cobertura marginal
La cobertura marginal produce intervalos de predicción de ancho uniforme, incapaz de reflejar incertidumbre específica de instancia
Falta de métodos efectivos para lograr cobertura condicional en configuraciones federadas
Motivación de la Investigación:
Necesidad de lograr cuantificación de incertidumbre adaptativa y específica de instancia protegiendo la privacidad
Aprovechar la capacidad de transformación de distribución de modelos generativos para unificar distribuciones heterogéneas de clientes
Realizar cobertura condicional en espacio de distribución de referencia, luego transformar de vuelta al espacio de distribución original
Marco Fed-CCP Propuesto: Primera implementación de predicción conforme condicional en aprendizaje federado, construyendo conjuntos de predicción transformables mediante modelos generativos
Innovación Teórica: Utilización de transformaciones biyectivas para mantener garantías de cobertura condicional, transformando desde espacio de distribución gaussiana de referencia al espacio de datos original del cliente
Diseño de Protección de Privacidad: Entrenamiento de modelos generativos solo mediante intercambio de gradientes, sin necesidad de compartir datos sin procesar
Adaptación del Cliente: Introducción de acondicionador de cliente η para modelar heterogeneidad entre clientes
Verificación Experimental: Validación del método en 5 dominios incluyendo medicina, seguros, IoT, epidemiología y predicción de tráfico
Dado K clientes, donde los datos de cada cliente k siguen distribución QXY(k), el objetivo es construir conjunto de predicción CTrans(Xn+1) que satisfaga garantía de cobertura condicional:
Pr(Yn+1∈CTrans(Xn+1)∣Xn+1=x)≥1−α,∀x∈X
Aprendizaje de transformación invertible fθ desde distribución de cliente QXY a distribución de referencia PXY
Optimización de divergencia KL utilizando fórmula de cambio de variables:
minθDKL(fθ#qXY∥pXY)=minθ−E(x,y)∼QXY[logpXY(fθ(x,y))+log∣det∂(x,y)∂fθ(x,y)∣−1]
Modelos de Difusión (Diffusion Models):
Implementación de proceso de difusión hacia adelante mediante ecuación diferencial estocástica:
d(Xt,Yt)=−21βt(Xt,Yt)dt+βtdWt
Proceso inverso que aprende desruido, aproximando transformación inversa g≈f−1
Introducción de acondicionador de cliente η(k)∼N(μ(k),(σ(k))2), permitiendo que modelo generativo condicional fθ(x,y;η) se adapte a características de distribución de diferentes clientes.
Garantía de Biyectividad: Utilización de invertibilidad de modelos generativos para garantizar que garantías de cobertura condicional se mantienen bajo transformación de distribución
Mecanismo de Acondicionador: Modelado de heterogeneidad entre clientes mediante acondicionador gaussiano específico del cliente
Protección de Privacidad: Modelo de predicción base h entrenado solo en distribución gaussiana de referencia, entrenamiento de modelo generativo intercambiando solo información de gradientes
Marco Unificado: Mapeo de distribuciones heterogéneas de clientes a espacio de distribución de referencia común para cobertura condicional
Tasa de Cobertura Marginal: Evaluada como condición necesaria para cobertura condicional
Tamaño Promedio de Conjunto de Predicción: Medida de adaptabilidad del método, conjuntos de predicción más pequeños indican mejor aproximación de cobertura condicional
Este artículo cita literatura importante en campos de predicción conforme, aprendizaje federado y modelos generativos, incluyendo:
Fundamentos teóricos de predicción conforme de Vovk et al.
Método CQR de Romano et al.
Trabajo de predicción conforme federada de Lu et al.
Literatura clásica de flujos normalizadores y modelos de difusión
Evaluación General: Este es un artículo de aprendizaje automático de alta calidad que realiza contribuciones importantes en el campo interdisciplinario de aprendizaje federado y cuantificación de incertidumbre. El método es novedoso, los experimentos son exhaustivos, y posee significado teórico e importancia práctica considerable. Se recomienda perfeccionar análisis teórico y eficiencia computacional.