2025-11-20T04:13:15.349826

Federated Conditional Conformal Prediction via Generative Models

Xu, Xie

Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.

academic

Predizione Conforme Condizionale Federata tramite Modelli Generativi

Informazioni Fondamentali

ID Articolo: 2510.13297
Titolo: Federated Conditional Conformal Prediction via Generative Models
Autori: Rui Xu & Sihong Xie (Hong Kong University of Science and Technology, Guangzhou)
Classificazione: cs.LG (Machine Learning)
Data di Pubblicazione: 15 ottobre 2025 (preprint arXiv)
Link Articolo: https://arxiv.org/abs/2510.13297

Riassunto

La predizione conforme (Conformal Prediction, CP) fornisce quantificazione dell'incertezza senza ipotesi distributive costruendo insiemi di predizione che garantiscono la copertura dell'etichetta vera. Questa affidabilità rende la CP di grande valore in scenari di apprendimento federato ad alto rischio come la medicina multicenter. Tuttavia, la CP standard assume dati indipendenti e identicamente distribuiti (i.i.d.), ipotesi violata in impostazioni federate con significativa eterogeneità tra client. I metodi CP federati esistenti affrontano questo problema mantenendo la copertura marginale su ogni client, ma questa garanzia spesso non riflette l'incertezza condizionata all'input. Questo articolo propone la predizione conforme condizionale federata basata su modelli generativi (Fed-CCP), mirata a realizzare copertura condizionata adattata all'eterogeneità dei dati locali. Fed-CCP sfrutta modelli generativi come flussi normalizzati o modelli di diffusione per approssimare distribuzioni di dati condizionati senza condividere dati grezzi. Ciò consente a ogni client di calibrare localmente punteggi conformi che riflettono la sua incertezza unica, mantenendo al contempo coerenza globale attraverso aggregazione federata.

Contesto di Ricerca e Motivazione

Definizione del Problema

Problema Centrale: Come realizzare predizione conforme che protegga la privacy e fornisca quantificazione dell'incertezza condizionata all'input in ambienti di apprendimento federato?
Importanza del Problema:
- In settori ad alto rischio come medicina e finanza, è necessaria quantificazione affidabile dell'incertezza
- In scenari di apprendimento federato, i dati non possono essere centralizzati, con significativa eterogeneità distributiva
- I requisiti di protezione della privacy limitano la condivisione di dati grezzi
Limitazioni dei Metodi Esistenti:
- La CP standard assume dati i.i.d., fallisce in impostazioni federate
- I metodi CP federati esistenti (FCP, FedCP-QQ, DP-FedCP) si concentrano solo sulla copertura marginale
- La copertura marginale produce intervalli di predizione di larghezza uniforme, incapace di riflettere incertezza specifica dell'istanza
- Mancanza di metodi efficaci per realizzare copertura condizionata in impostazioni federate
Motivazione della Ricerca:
- Necessità di realizzare quantificazione dell'incertezza adattiva e specifica dell'istanza proteggendo la privacy
- Sfruttare la capacità di trasformazione distributiva dei modelli generativi per unificare distribuzioni client eterogenee
- Realizzare copertura condizionata nello spazio di distribuzione di riferimento, quindi trasformare nello spazio distributivo originale

Contributi Principali

Propone il Framework Fed-CCP: Realizza per la prima volta predizione conforme condizionata nell'apprendimento federato attraverso modelli generativi costruendo insiemi di predizione trasformabili
Innovazione Teorica: Sfrutta trasformazioni biiettive per preservare garanzie di copertura condizionata, trasformando dallo spazio di distribuzione gaussiana di riferimento allo spazio dati originale del client
Design di Protezione della Privacy: Addestra modelli generativi solo attraverso scambio di gradienti, senza condivisione di dati grezzi
Adattamento del Client: Introduce condizionatori client η per modellare eterogeneità tra client
Verifica Sperimentale: Valida l'efficacia del metodo in 5 domini: medicina, assicurazioni, IoT, epidemiologia e previsione del traffico

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato K client, dove i dati di ogni client k seguono la distribuzione $Q^{(k)}_{XY}$ , l'obiettivo è costruire un insieme di predizione $C_{Trans}(X_{n+1})$ che soddisfi la garanzia di copertura condizionata: $\Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X}$

Architettura del Modello

1. Scelta del Modello Generativo

Flussi Normalizzati (Normalizing Flows):

Apprendono la trasformazione invertibile $f_\theta$ dalla distribuzione client $Q_{XY}$ alla distribuzione di riferimento $P_{XY}$
Sfruttano la formula di cambio di variabili per ottimizzare la divergenza KL: $\min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}]$

Modelli di Diffusione (Diffusion Models):

Realizzano il processo di diffusione in avanti attraverso equazioni differenziali stocastiche: $d(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t$
Il processo inverso apprende la denoising, approssimando la trasformazione inversa $g \approx f^{-1}$

2. Costruzione di Insiemi di Predizione Trasformabili

Per il campione di test $(X_{n+1}, Y_{n+1}) \sim Q_{XY}$ :

Trasformare nello spazio di riferimento tramite $f_\theta$ : $f_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY}$
Costruire l'insieme di predizione condizionato nello spazio di riferimento: $C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\}$
Mappare nello spazio originale tramite trasformazione inversa $g_\theta = f_\theta^{-1}$ : $C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\}$

3. Apprendimento Federato Multi-Client

Introdurre condizionatori client $\eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2)$ , consentendo al modello generativo condizionato $f_\theta(x,y;\eta)$ di adattarsi alle caratteristiche distributive di diversi client.

Punti di Innovazione Tecnica

Garanzia di Biiettività: Sfrutta l'invertibilità dei modelli generativi per garantire che le garanzie di copertura condizionata rimangono invarianti sotto trasformazione distributiva
Meccanismo di Condizionamento: Modella eterogeneità tra client attraverso condizionatori gaussiani specifici del client
Protezione della Privacy: Il modello di predizione base h viene addestrato solo sulla distribuzione gaussiana di riferimento, l'addestramento del modello generativo scambia solo informazioni di gradiente
Framework Unificato: Mappa distribuzioni client eterogenee a uno spazio di distribuzione di riferimento comune per copertura condizionata

Impostazione Sperimentale

Dataset

Settore Medico: MIMIC-IV, eICU e dati di due ospedali partner, simulando scenari di medicina multicenter
Internet delle Cose: Dati di sensori del Laboratorio di Ricerca Intel Berkeley, simulando reti di sensori distribuite spazialmente
Settore Assicurativo: Dataset French Motor Claims (677.991 record), client divisi per regione geografica
Previsione del Traffico: Dataset Seattle-Loop, PEMSD4, PEMSD8, diversi fornitori di dati come client
Epidemiologia: Dati US-Regions, US-States, Japan-Prefectures, client divisi per regione amministrativa

Metriche di Valutazione

Tasso di Copertura Marginale: Valutato come condizione necessaria per copertura condizionata
Dimensione Media dell'Insieme di Predizione: Misura l'adattabilità del metodo, insiemi di predizione più piccoli indicano migliore approssimazione della copertura condizionata

Metodi di Confronto

CQR: Regressione quantile conforme senza modelli generativi
Fed-CCP (senza condizionatore): Fed-CCP senza condizionatori client
Fed-CCP: Metodo completo proposto

Dettagli di Implementazione

Utilizzo della libreria normflows per implementare flussi normalizzati
Distribuzione di riferimento impostata come distribuzione gaussiana multivariata con covarianza diagonale
Livello di confidenza target impostato al 90% (α=0.1)

Risultati Sperimentali

Risultati Principali

Come mostrato nella Figura 1, negli esperimenti su tutti e 5 i domini:

Prestazioni di Copertura Marginale:
- Fed-CCP raggiunge tassi di copertura prossimi al target del 90% su tutti i compiti
- CQR mostra prestazioni instabili in impostazioni federate, spesso con copertura insufficiente
- Fed-CCP senza condizionatore mostra riduzione del tasso di copertura
Dimensione dell'Insieme di Predizione:
- Fed-CCP realizza insiemi di predizione relativamente piccoli mantenendo copertura efficace
- La variabilità della dimensione dell'insieme di CQR è maggiore
- La versione senza condizionatore produce insiemi di predizione eccessivamente grandi

Scoperte Chiave

Necessità dei Modelli Generativi: CQR fallisce sotto shift distributivo, provando l'importanza dell'allineamento tramite modelli generativi
Ruolo Critico del Condizionatore: Il condizionatore client η è cruciale per catturare eterogeneità tra client
Adattabilità: Fed-CCP produce insiemi di predizione sia efficaci che adattivi specifici dell'istanza
Robustezza Cross-Domain: Il metodo mostra efficacia coerente su diversi domini applicativi

Verifica Sperimentale

I risultati sperimentali confermano le due ipotesi fondamentali di Fed-CCP:

L'allineamento generativo biiettivo coordina efficacemente distribuzioni client
Il meccanismo di condizionamento modella con successo caratteristiche specifiche del client

Lavori Correlati

Campo della Predizione Conforme

CP Classica: Fondamenti teorici dell'apprendimento algoritmo di Vovk e altri
CP Condizionata: Metodi adattivi per incertezza specifica dell'istanza
CP con Regressione Quantile: Metodo CQR di Romano e altri

Predizione Conforme Federata

FCP & FedCP-QQ: Garanzie di copertura per distribuzioni miste
DP-FedCP: Metodo con privacy differenziale per gestire shift di etichette
CP Distribuita: Metodi basati su comunicazione tra vicini con topologia grafica

Modelli Generativi

Flussi Normalizzati: Reti neurali invertibili per modellazione di densità
Modelli di Diffusione: Modellazione generativa basata su processi stocastici

Conclusioni e Discussione

Conclusioni Principali

Fed-CCP realizza con successo predizione conforme condizionata in ambienti federati
I modelli generativi forniscono un meccanismo efficace di allineamento distributivo
Il condizionatore client è componente chiave per gestire eterogeneità
Il metodo dimostra robustezza in molteplici domini applicativi reali

Limitazioni

Complessità Computazionale: L'addestramento di modelli generativi aumenta il carico computazionale
Analisi Teorica: Mancanza di garanzie teoriche con campioni finiti
Sensibilità ai Iperparametri: La scelta dei parametri del condizionatore client può influenzare le prestazioni
Scalabilità: Le prestazioni in scenari con numerosi client rimangono da verificare

Direzioni Future

Stabilire framework di analisi teorica più rigorosi
Esplorare architetture di modelli generativi più efficienti
Investigare meccanismi adattivi in scenari con client dinamici
Estendere ad altri tipi di compiti come classificazione

Valutazione Approfondita

Punti di Forza

Forte Innovazione: Primo a introdurre modelli generativi nella predizione conforme federata, realizzando copertura condizionata
Fondamenti Teorici Solidi: Le garanzie di copertura basate su trasformazioni biiettive hanno rigor matematico
Protezione della Privacy: Il design considera adeguatamente i requisiti di privacy dell'apprendimento federato
Esperimenti Completi: Verifica su 5 diversi domini aumenta l'affidabilità dei risultati
Valore Pratico: Risolve problemi importanti nelle applicazioni reali

Insufficienze

Analisi Teorica Incompleta: Mancanza di analisi di complessità con campioni finiti e convergenza
Costo Computazionale: Il costo computazionale dell'addestramento di modelli generativi può limitare applicazioni pratiche
Sensibilità ai Parametri: Mancanza di guida teorica nel design del condizionatore client
Esperimenti di Confronto: Mancanza di confronto diretto con altri metodi CP federati

Impatto

Contributo Accademico: Apre nuove direzioni per quantificazione dell'incertezza nell'apprendimento federato
Valore Pratico: Ha importanti prospettive di applicazione in settori ad alto rischio come medicina e finanza
Valore Metodologico: La combinazione di modelli generativi e predizione conforme ha significato universale

Scenari Applicabili

Medicina Multicenter: Collaborazione diagnostica e predittiva tra diversi ospedali
Risk Management Finanziario: Valutazione del rischio e quantificazione dell'incertezza tra istituzioni
Internet delle Cose: Predizioni affidabili in reti di sensori distribuiti
Smart City: Compiti di previsione cross-regionale per traffico, ambiente e altri aspetti

Riferimenti Bibliografici

L'articolo cita importanti letteratura nei campi della predizione conforme, apprendimento federato e modelli generativi, inclusi:

Fondamenti teorici della predizione conforme di Vovk e altri
Metodo CQR di Romano e altri
Lavori sulla predizione conforme federata di Lu e altri
Letteratura classica su flussi normalizzati e modelli di diffusione

Valutazione Complessiva: Questo è un articolo di alta qualità nel machine learning che fornisce contributi importanti nell'intersezione tra apprendimento federato e quantificazione dell'incertezza. Il metodo è innovativo, gli esperimenti sono completi, con significativo valore teorico e pratico. Si raccomanda di perfezionare ulteriormente l'analisi teorica e l'efficienza computazionale.