2025-11-20T04:13:15.349826

Federated Conditional Conformal Prediction via Generative Models

Xu, Xie

Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.

academic

Predicción Conforme Condicional Federada mediante Modelos Generativos

Información Básica

ID del Artículo: 2510.13297
Título: Federated Conditional Conformal Prediction via Generative Models
Autores: Rui Xu & Sihong Xie (Universidad de Ciencia y Tecnología de Hong Kong, Campus de Guangzhou)
Clasificación: cs.LG (Aprendizaje Automático)
Fecha de Publicación: 15 de octubre de 2025 (preimpresión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.13297

Resumen

La predicción conforme (Conformal Prediction, CP) proporciona cuantificación de incertidumbre sin supuestos de distribución mediante la construcción de conjuntos de predicción que garantizan la cobertura de etiquetas verdaderas. Esta confiabilidad hace que CP sea de gran valor en escenarios de aprendizaje federado de alto riesgo, como la medicina multicéntrica. Sin embargo, CP estándar asume que los datos son independientes e idénticamente distribuidos (i.i.d.), supuesto que se viola en configuraciones federadas con variaciones significativas de distribución entre clientes. Los métodos existentes de CP federado abordan este problema manteniendo cobertura marginal en cada cliente, pero estas garantías a menudo no reflejan la incertidumbre condicional de entrada. Este artículo propone predicción conforme condicional federada basada en modelos generativos (Fed-CCP), con el objetivo de lograr cobertura condicional adaptada a la heterogeneidad de datos locales. Fed-CCP utiliza modelos generativos como flujos normalizadores o modelos de difusión para aproximar distribuciones de datos condicionales sin compartir datos sin procesar. Esto permite que cada cliente calibre localmente puntuaciones conformes que reflejen su incertidumbre única, mientras mantiene consistencia global mediante agregación federada.

Antecedentes y Motivación de la Investigación

Definición del Problema

Problema Central: ¿Cómo lograr predicción conforme que proteja la privacidad y proporcione cuantificación de incertidumbre condicional de entrada en un entorno de aprendizaje federado?
Importancia del Problema:
- En dominios de alto riesgo como medicina y finanzas, se requiere cuantificación confiable de incertidumbre
- En escenarios de aprendizaje federado, los datos no pueden centralizarse, existiendo heterogeneidad significativa de distribución
- Los requisitos de protección de privacidad limitan el intercambio de datos sin procesar
Limitaciones de Métodos Existentes:
- CP estándar asume datos i.i.d., fallando en configuraciones federadas
- Los métodos existentes de CP federado (FCP, FedCP-QQ, DP-FedCP) solo se enfocan en cobertura marginal
- La cobertura marginal produce intervalos de predicción de ancho uniforme, incapaz de reflejar incertidumbre específica de instancia
- Falta de métodos efectivos para lograr cobertura condicional en configuraciones federadas
Motivación de la Investigación:
- Necesidad de lograr cuantificación de incertidumbre adaptativa y específica de instancia protegiendo la privacidad
- Aprovechar la capacidad de transformación de distribución de modelos generativos para unificar distribuciones heterogéneas de clientes
- Realizar cobertura condicional en espacio de distribución de referencia, luego transformar de vuelta al espacio de distribución original

Contribuciones Principales

Marco Fed-CCP Propuesto: Primera implementación de predicción conforme condicional en aprendizaje federado, construyendo conjuntos de predicción transformables mediante modelos generativos
Innovación Teórica: Utilización de transformaciones biyectivas para mantener garantías de cobertura condicional, transformando desde espacio de distribución gaussiana de referencia al espacio de datos original del cliente
Diseño de Protección de Privacidad: Entrenamiento de modelos generativos solo mediante intercambio de gradientes, sin necesidad de compartir datos sin procesar
Adaptación del Cliente: Introducción de acondicionador de cliente η para modelar heterogeneidad entre clientes
Verificación Experimental: Validación del método en 5 dominios incluyendo medicina, seguros, IoT, epidemiología y predicción de tráfico

Explicación Detallada del Método

Definición de la Tarea

Dado K clientes, donde los datos de cada cliente k siguen distribución $Q^{(k)}_{XY}$ , el objetivo es construir conjunto de predicción $C_{Trans}(X_{n+1})$ que satisfaga garantía de cobertura condicional: $\Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X}$

Arquitectura del Modelo

1. Selección de Modelo Generativo

Flujos Normalizadores (Normalizing Flows):

Aprendizaje de transformación invertible $f_\theta$ desde distribución de cliente $Q_{XY}$ a distribución de referencia $P_{XY}$
Optimización de divergencia KL utilizando fórmula de cambio de variables: $\min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}]$

Modelos de Difusión (Diffusion Models):

Implementación de proceso de difusión hacia adelante mediante ecuación diferencial estocástica: $d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t$
Proceso inverso que aprende desruido, aproximando transformación inversa $g \approx f^{-1}$

2. Construcción de Conjunto de Predicción Transformable

Para muestra de prueba $(X_{n+1}, Y_{n+1}) \sim Q_{XY}$ :

Transformación mediante $f_\theta$ a espacio de referencia: $f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY}$
Construcción de conjunto de predicción condicional en espacio de referencia: $C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\}$
Mapeo mediante transformación inversa $g_\theta = f_\theta^{-1}$ de vuelta al espacio original: $C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\}$

3. Aprendizaje Federado Multicliente

Introducción de acondicionador de cliente $\eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2)$ , permitiendo que modelo generativo condicional $f_\theta(x,y;\eta)$ se adapte a características de distribución de diferentes clientes.

Puntos de Innovación Técnica

Garantía de Biyectividad: Utilización de invertibilidad de modelos generativos para garantizar que garantías de cobertura condicional se mantienen bajo transformación de distribución
Mecanismo de Acondicionador: Modelado de heterogeneidad entre clientes mediante acondicionador gaussiano específico del cliente
Protección de Privacidad: Modelo de predicción base h entrenado solo en distribución gaussiana de referencia, entrenamiento de modelo generativo intercambiando solo información de gradientes
Marco Unificado: Mapeo de distribuciones heterogéneas de clientes a espacio de distribución de referencia común para cobertura condicional

Configuración Experimental

Conjuntos de Datos

Dominio Médico: Datos MIMIC-IV, eICU y de dos hospitales colaboradores, simulando escenarios médicos multicéntricos
Internet de las Cosas: Datos de sensores del Laboratorio de Investigación Intel Berkeley, simulando red de sensores con distribución espacial
Dominio de Seguros: Conjunto de datos French Motor Claims (677,991 registros), dividido por región geográfica en clientes
Predicción de Tráfico: Conjuntos de datos Seattle-Loop, PEMSD4, PEMSD8, con diferentes proveedores de datos como clientes
Epidemiología: Datos US-Regions, US-States, Japan-Prefectures, divididos por región administrativa

Métricas de Evaluación

Tasa de Cobertura Marginal: Evaluada como condición necesaria para cobertura condicional
Tamaño Promedio de Conjunto de Predicción: Medida de adaptabilidad del método, conjuntos de predicción más pequeños indican mejor aproximación de cobertura condicional

Métodos de Comparación

CQR: Regresión de cuantiles conforme sin uso de modelos generativos
Fed-CCP (sin acondicionador): Fed-CCP sin acondicionador de cliente
Fed-CCP: Método completo propuesto

Detalles de Implementación

Uso de biblioteca normflows para implementación de flujos normalizadores
Distribución de referencia establecida como distribución gaussiana multivariada con covarianza diagonal
Nivel de confianza objetivo establecido en 90% (α=0.1)

Resultados Experimentales

Resultados Principales

Como se muestra en la Figura 1, en experimentos en los 5 dominios:

Desempeño de Cobertura Marginal:
- Fed-CCP logra tasa de cobertura cercana al objetivo del 90% en todas las tareas
- CQR muestra desempeño inestable en configuración federada, frecuentemente con cobertura insuficiente
- Fed-CCP sin acondicionador muestra reducción en tasa de cobertura
Tamaño de Conjunto de Predicción:
- Fed-CCP logra conjuntos de predicción relativamente pequeños manteniendo cobertura efectiva
- CQR muestra mayor variabilidad en tamaño de conjunto de predicción
- Versión sin acondicionador produce conjuntos de predicción excesivamente grandes

Hallazgos Clave

Necesidad de Modelos Generativos: Fallo de CQR bajo cambio de distribución, demostrando importancia de alineación mediante modelos generativos
Rol Crítico del Acondicionador: Acondicionador de cliente η es crucial para capturar heterogeneidad entre clientes
Adaptabilidad: Fed-CCP produce conjuntos de predicción específicos de instancia tanto efectivos como adaptativos
Robustez Transdominio: Método muestra efectividad consistente en diferentes dominios de aplicación

Verificación Experimental

Los resultados experimentales confirman dos supuestos centrales de Fed-CCP:

La alineación generativa biyectiva coordina efectivamente distribuciones de clientes
El mecanismo de acondicionador modela exitosamente características específicas del cliente

Trabajo Relacionado

Campo de Predicción Conforme

CP Clásica: Fundamentos teóricos de aprendizaje algorítmico de Vovk et al.
CP Condicional: Métodos adaptativos para incertidumbre específica de instancia
CP de Regresión de Cuantiles: Método CQR de Romano et al.

Predicción Conforme Federada

FCP & FedCP-QQ: Garantías de cobertura para distribuciones mixtas
DP-FedCP: Método de privacidad diferencial para manejo de cambio de etiqueta
CP Distribuida: Métodos basados en topología de gráficos con comunicación de vecinos

Modelos Generativos

Flujos Normalizadores: Redes neuronales invertibles para modelado de densidad
Modelos de Difusión: Modelado generativo basado en procesos estocásticos

Conclusiones y Discusión

Conclusiones Principales

Fed-CCP logra exitosamente predicción conforme condicional en entorno federado
Los modelos generativos proporcionan mecanismo efectivo de alineación de distribución
El acondicionador de cliente es componente clave para manejo de heterogeneidad
El método demuestra robustez en múltiples dominios de aplicación práctica

Limitaciones

Complejidad Computacional: Entrenamiento de modelos generativos aumenta carga computacional
Análisis Teórico: Falta de garantías teóricas con muestras finitas
Sensibilidad de Hiperparámetros: Selección de parámetros de acondicionador de cliente puede afectar desempeño
Escalabilidad: Desempeño en escenarios con gran número de clientes requiere verificación

Direcciones Futuras

Establecimiento de marco de análisis teórico más riguroso
Exploración de arquitecturas de modelos generativos más eficientes
Investigación de mecanismos adaptativos en escenarios de clientes dinámicos
Extensión a otros tipos de tareas como clasificación

Evaluación Profunda

Fortalezas

Innovación Fuerte: Primera introducción de modelos generativos en predicción conforme federada, logrando cobertura condicional
Fundamentos Teóricos Sólidos: Garantías de cobertura basadas en transformaciones biyectivas con rigor matemático
Protección de Privacidad: Diseño que considera plenamente requisitos de privacidad del aprendizaje federado
Experimentos Exhaustivos: Verificación en 5 dominios diferentes aumenta credibilidad de resultados
Valor Práctico: Soluciona problemas importantes en aplicaciones reales

Deficiencias

Análisis Teórico Insuficiente: Falta de análisis de complejidad con muestras finitas y convergencia
Costo Computacional: Costo computacional del entrenamiento de modelos generativos puede limitar aplicación práctica
Sensibilidad de Parámetros: Orientación teórica insuficiente para diseño de acondicionador de cliente
Experimentos de Comparación: Falta de comparación directa con otros métodos de CP federado

Impacto

Contribución Académica: Abre nueva dirección para cuantificación de incertidumbre en aprendizaje federado
Valor Práctico: Perspectivas importantes de aplicación en dominios de alto riesgo como medicina y finanzas
Valor Metodológico: Combinación de modelos generativos y predicción conforme tiene significado universal

Escenarios Aplicables

Medicina Multicéntrica: Colaboración entre diferentes hospitales para diagnóstico y predicción
Control de Riesgo Financiero: Evaluación de riesgo y cuantificación de incertidumbre entre instituciones
Internet de las Cosas: Predicción confiable en redes de sensores distribuidos
Ciudades Inteligentes: Tareas de predicción transregional de tráfico, ambiente, etc.

Referencias Bibliográficas

Este artículo cita literatura importante en campos de predicción conforme, aprendizaje federado y modelos generativos, incluyendo:

Fundamentos teóricos de predicción conforme de Vovk et al.
Método CQR de Romano et al.
Trabajo de predicción conforme federada de Lu et al.
Literatura clásica de flujos normalizadores y modelos de difusión

Evaluación General: Este es un artículo de aprendizaje automático de alta calidad que realiza contribuciones importantes en el campo interdisciplinario de aprendizaje federado y cuantificación de incertidumbre. El método es novedoso, los experimentos son exhaustivos, y posee significado teórico e importancia práctica considerable. Se recomienda perfeccionar análisis teórico y eficiencia computacional.