2025-11-20T04:13:15.349826

Federated Conditional Conformal Prediction via Generative Models

Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
academic

Predizione Conforme Condizionale Federata tramite Modelli Generativi

Informazioni Fondamentali

  • ID Articolo: 2510.13297
  • Titolo: Federated Conditional Conformal Prediction via Generative Models
  • Autori: Rui Xu & Sihong Xie (Hong Kong University of Science and Technology, Guangzhou)
  • Classificazione: cs.LG (Machine Learning)
  • Data di Pubblicazione: 15 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.13297

Riassunto

La predizione conforme (Conformal Prediction, CP) fornisce quantificazione dell'incertezza senza ipotesi distributive costruendo insiemi di predizione che garantiscono la copertura dell'etichetta vera. Questa affidabilità rende la CP di grande valore in scenari di apprendimento federato ad alto rischio come la medicina multicenter. Tuttavia, la CP standard assume dati indipendenti e identicamente distribuiti (i.i.d.), ipotesi violata in impostazioni federate con significativa eterogeneità tra client. I metodi CP federati esistenti affrontano questo problema mantenendo la copertura marginale su ogni client, ma questa garanzia spesso non riflette l'incertezza condizionata all'input. Questo articolo propone la predizione conforme condizionale federata basata su modelli generativi (Fed-CCP), mirata a realizzare copertura condizionata adattata all'eterogeneità dei dati locali. Fed-CCP sfrutta modelli generativi come flussi normalizzati o modelli di diffusione per approssimare distribuzioni di dati condizionati senza condividere dati grezzi. Ciò consente a ogni client di calibrare localmente punteggi conformi che riflettono la sua incertezza unica, mantenendo al contempo coerenza globale attraverso aggregazione federata.

Contesto di Ricerca e Motivazione

Definizione del Problema

  1. Problema Centrale: Come realizzare predizione conforme che protegga la privacy e fornisca quantificazione dell'incertezza condizionata all'input in ambienti di apprendimento federato?
  2. Importanza del Problema:
    • In settori ad alto rischio come medicina e finanza, è necessaria quantificazione affidabile dell'incertezza
    • In scenari di apprendimento federato, i dati non possono essere centralizzati, con significativa eterogeneità distributiva
    • I requisiti di protezione della privacy limitano la condivisione di dati grezzi
  3. Limitazioni dei Metodi Esistenti:
    • La CP standard assume dati i.i.d., fallisce in impostazioni federate
    • I metodi CP federati esistenti (FCP, FedCP-QQ, DP-FedCP) si concentrano solo sulla copertura marginale
    • La copertura marginale produce intervalli di predizione di larghezza uniforme, incapace di riflettere incertezza specifica dell'istanza
    • Mancanza di metodi efficaci per realizzare copertura condizionata in impostazioni federate
  4. Motivazione della Ricerca:
    • Necessità di realizzare quantificazione dell'incertezza adattiva e specifica dell'istanza proteggendo la privacy
    • Sfruttare la capacità di trasformazione distributiva dei modelli generativi per unificare distribuzioni client eterogenee
    • Realizzare copertura condizionata nello spazio di distribuzione di riferimento, quindi trasformare nello spazio distributivo originale

Contributi Principali

  1. Propone il Framework Fed-CCP: Realizza per la prima volta predizione conforme condizionata nell'apprendimento federato attraverso modelli generativi costruendo insiemi di predizione trasformabili
  2. Innovazione Teorica: Sfrutta trasformazioni biiettive per preservare garanzie di copertura condizionata, trasformando dallo spazio di distribuzione gaussiana di riferimento allo spazio dati originale del client
  3. Design di Protezione della Privacy: Addestra modelli generativi solo attraverso scambio di gradienti, senza condivisione di dati grezzi
  4. Adattamento del Client: Introduce condizionatori client η per modellare eterogeneità tra client
  5. Verifica Sperimentale: Valida l'efficacia del metodo in 5 domini: medicina, assicurazioni, IoT, epidemiologia e previsione del traffico

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato K client, dove i dati di ogni client k seguono la distribuzione QXY(k)Q^{(k)}_{XY}, l'obiettivo è costruire un insieme di predizione CTrans(Xn+1)C_{Trans}(X_{n+1}) che soddisfi la garanzia di copertura condizionata: Pr(Yn+1CTrans(Xn+1)Xn+1=x)1α,xX\Pr(Y_{n+1} \in C_{Trans}(X_{n+1}) | X_{n+1} = x) \geq 1-\alpha, \forall x \in \mathcal{X}

Architettura del Modello

1. Scelta del Modello Generativo

Flussi Normalizzati (Normalizing Flows):

  • Apprendono la trasformazione invertibile fθf_\theta dalla distribuzione client QXYQ_{XY} alla distribuzione di riferimento PXYP_{XY}
  • Sfruttano la formula di cambio di variabili per ottimizzare la divergenza KL: minθDKL(fθ#qXYpXY)=minθE(x,y)QXY[logpXY(fθ(x,y))+logdetfθ(x,y)(x,y)1]\min_\theta D_{KL}(f_\theta\#q_{XY} \| p_{XY}) = \min_\theta -\mathbb{E}_{(x,y)\sim Q_{XY}}[\log p_{XY}(f_\theta(x,y)) + \log|\det \frac{\partial f_\theta(x,y)}{\partial(x,y)}|^{-1}]

Modelli di Diffusione (Diffusion Models):

  • Realizzano il processo di diffusione in avanti attraverso equazioni differenziali stocastiche: d(Xt,Yt)=12βt(Xt,Yt)dt+βtdWtd(X_t, Y_t) = -\frac{1}{2}\beta_t(X_t, Y_t)dt + \sqrt{\beta_t}dW_t
  • Il processo inverso apprende la denoising, approssimando la trasformazione inversa gf1g \approx f^{-1}

2. Costruzione di Insiemi di Predizione Trasformabili

Per il campione di test (Xn+1,Yn+1)QXY(X_{n+1}, Y_{n+1}) \sim Q_{XY}:

  1. Trasformare nello spazio di riferimento tramite fθf_\theta: fθ(Xn+1,Yn+1)=(X~n+1,Y~n+1)PXYf_\theta(X_{n+1}, Y_{n+1}) = (\tilde{X}_{n+1}, \tilde{Y}_{n+1}) \sim P_{XY}
  2. Costruire l'insieme di predizione condizionato nello spazio di riferimento: CA(X~n+1)={y~Y:s(X~n+1,y~)τ(X~n+1)}C_A(\tilde{X}_{n+1}) = \{\tilde{y} \in \mathcal{Y} : s(\tilde{X}_{n+1}, \tilde{y}) \leq \tau(\tilde{X}_{n+1})\}
  3. Mappare nello spazio originale tramite trasformazione inversa gθ=fθ1g_\theta = f_\theta^{-1}: CTrans(Xn+1)={yY:y~CA(X~n+1),gθ(X~n+1,y~)=(Xn+1,y)}C_{Trans}(X_{n+1}) = \{y \in \mathcal{Y} : \tilde{y} \in C_A(\tilde{X}_{n+1}), g_\theta(\tilde{X}_{n+1}, \tilde{y}) = (X_{n+1}, y)\}

3. Apprendimento Federato Multi-Client

Introdurre condizionatori client η(k)N(μ(k),(σ(k))2)\eta^{(k)} \sim \mathcal{N}(\mu^{(k)}, (\sigma^{(k)})^2), consentendo al modello generativo condizionato fθ(x,y;η)f_\theta(x,y;\eta) di adattarsi alle caratteristiche distributive di diversi client.

Punti di Innovazione Tecnica

  1. Garanzia di Biiettività: Sfrutta l'invertibilità dei modelli generativi per garantire che le garanzie di copertura condizionata rimangono invarianti sotto trasformazione distributiva
  2. Meccanismo di Condizionamento: Modella eterogeneità tra client attraverso condizionatori gaussiani specifici del client
  3. Protezione della Privacy: Il modello di predizione base h viene addestrato solo sulla distribuzione gaussiana di riferimento, l'addestramento del modello generativo scambia solo informazioni di gradiente
  4. Framework Unificato: Mappa distribuzioni client eterogenee a uno spazio di distribuzione di riferimento comune per copertura condizionata

Impostazione Sperimentale

Dataset

  1. Settore Medico: MIMIC-IV, eICU e dati di due ospedali partner, simulando scenari di medicina multicenter
  2. Internet delle Cose: Dati di sensori del Laboratorio di Ricerca Intel Berkeley, simulando reti di sensori distribuite spazialmente
  3. Settore Assicurativo: Dataset French Motor Claims (677.991 record), client divisi per regione geografica
  4. Previsione del Traffico: Dataset Seattle-Loop, PEMSD4, PEMSD8, diversi fornitori di dati come client
  5. Epidemiologia: Dati US-Regions, US-States, Japan-Prefectures, client divisi per regione amministrativa

Metriche di Valutazione

  1. Tasso di Copertura Marginale: Valutato come condizione necessaria per copertura condizionata
  2. Dimensione Media dell'Insieme di Predizione: Misura l'adattabilità del metodo, insiemi di predizione più piccoli indicano migliore approssimazione della copertura condizionata

Metodi di Confronto

  1. CQR: Regressione quantile conforme senza modelli generativi
  2. Fed-CCP (senza condizionatore): Fed-CCP senza condizionatori client
  3. Fed-CCP: Metodo completo proposto

Dettagli di Implementazione

  • Utilizzo della libreria normflows per implementare flussi normalizzati
  • Distribuzione di riferimento impostata come distribuzione gaussiana multivariata con covarianza diagonale
  • Livello di confidenza target impostato al 90% (α=0.1)

Risultati Sperimentali

Risultati Principali

Come mostrato nella Figura 1, negli esperimenti su tutti e 5 i domini:

  1. Prestazioni di Copertura Marginale:
    • Fed-CCP raggiunge tassi di copertura prossimi al target del 90% su tutti i compiti
    • CQR mostra prestazioni instabili in impostazioni federate, spesso con copertura insufficiente
    • Fed-CCP senza condizionatore mostra riduzione del tasso di copertura
  2. Dimensione dell'Insieme di Predizione:
    • Fed-CCP realizza insiemi di predizione relativamente piccoli mantenendo copertura efficace
    • La variabilità della dimensione dell'insieme di CQR è maggiore
    • La versione senza condizionatore produce insiemi di predizione eccessivamente grandi

Scoperte Chiave

  1. Necessità dei Modelli Generativi: CQR fallisce sotto shift distributivo, provando l'importanza dell'allineamento tramite modelli generativi
  2. Ruolo Critico del Condizionatore: Il condizionatore client η è cruciale per catturare eterogeneità tra client
  3. Adattabilità: Fed-CCP produce insiemi di predizione sia efficaci che adattivi specifici dell'istanza
  4. Robustezza Cross-Domain: Il metodo mostra efficacia coerente su diversi domini applicativi

Verifica Sperimentale

I risultati sperimentali confermano le due ipotesi fondamentali di Fed-CCP:

  1. L'allineamento generativo biiettivo coordina efficacemente distribuzioni client
  2. Il meccanismo di condizionamento modella con successo caratteristiche specifiche del client

Lavori Correlati

Campo della Predizione Conforme

  1. CP Classica: Fondamenti teorici dell'apprendimento algoritmo di Vovk e altri
  2. CP Condizionata: Metodi adattivi per incertezza specifica dell'istanza
  3. CP con Regressione Quantile: Metodo CQR di Romano e altri

Predizione Conforme Federata

  1. FCP & FedCP-QQ: Garanzie di copertura per distribuzioni miste
  2. DP-FedCP: Metodo con privacy differenziale per gestire shift di etichette
  3. CP Distribuita: Metodi basati su comunicazione tra vicini con topologia grafica

Modelli Generativi

  1. Flussi Normalizzati: Reti neurali invertibili per modellazione di densità
  2. Modelli di Diffusione: Modellazione generativa basata su processi stocastici

Conclusioni e Discussione

Conclusioni Principali

  1. Fed-CCP realizza con successo predizione conforme condizionata in ambienti federati
  2. I modelli generativi forniscono un meccanismo efficace di allineamento distributivo
  3. Il condizionatore client è componente chiave per gestire eterogeneità
  4. Il metodo dimostra robustezza in molteplici domini applicativi reali

Limitazioni

  1. Complessità Computazionale: L'addestramento di modelli generativi aumenta il carico computazionale
  2. Analisi Teorica: Mancanza di garanzie teoriche con campioni finiti
  3. Sensibilità ai Iperparametri: La scelta dei parametri del condizionatore client può influenzare le prestazioni
  4. Scalabilità: Le prestazioni in scenari con numerosi client rimangono da verificare

Direzioni Future

  1. Stabilire framework di analisi teorica più rigorosi
  2. Esplorare architetture di modelli generativi più efficienti
  3. Investigare meccanismi adattivi in scenari con client dinamici
  4. Estendere ad altri tipi di compiti come classificazione

Valutazione Approfondita

Punti di Forza

  1. Forte Innovazione: Primo a introdurre modelli generativi nella predizione conforme federata, realizzando copertura condizionata
  2. Fondamenti Teorici Solidi: Le garanzie di copertura basate su trasformazioni biiettive hanno rigor matematico
  3. Protezione della Privacy: Il design considera adeguatamente i requisiti di privacy dell'apprendimento federato
  4. Esperimenti Completi: Verifica su 5 diversi domini aumenta l'affidabilità dei risultati
  5. Valore Pratico: Risolve problemi importanti nelle applicazioni reali

Insufficienze

  1. Analisi Teorica Incompleta: Mancanza di analisi di complessità con campioni finiti e convergenza
  2. Costo Computazionale: Il costo computazionale dell'addestramento di modelli generativi può limitare applicazioni pratiche
  3. Sensibilità ai Parametri: Mancanza di guida teorica nel design del condizionatore client
  4. Esperimenti di Confronto: Mancanza di confronto diretto con altri metodi CP federati

Impatto

  1. Contributo Accademico: Apre nuove direzioni per quantificazione dell'incertezza nell'apprendimento federato
  2. Valore Pratico: Ha importanti prospettive di applicazione in settori ad alto rischio come medicina e finanza
  3. Valore Metodologico: La combinazione di modelli generativi e predizione conforme ha significato universale

Scenari Applicabili

  1. Medicina Multicenter: Collaborazione diagnostica e predittiva tra diversi ospedali
  2. Risk Management Finanziario: Valutazione del rischio e quantificazione dell'incertezza tra istituzioni
  3. Internet delle Cose: Predizioni affidabili in reti di sensori distribuiti
  4. Smart City: Compiti di previsione cross-regionale per traffico, ambiente e altri aspetti

Riferimenti Bibliografici

L'articolo cita importanti letteratura nei campi della predizione conforme, apprendimento federato e modelli generativi, inclusi:

  • Fondamenti teorici della predizione conforme di Vovk e altri
  • Metodo CQR di Romano e altri
  • Lavori sulla predizione conforme federata di Lu e altri
  • Letteratura classica su flussi normalizzati e modelli di diffusione

Valutazione Complessiva: Questo è un articolo di alta qualità nel machine learning che fornisce contributi importanti nell'intersezione tra apprendimento federato e quantificazione dell'incertezza. Il metodo è innovativo, gli esperimenti sono completi, con significativo valore teorico e pratico. Si raccomanda di perfezionare ulteriormente l'analisi teorica e l'efficienza computazionale.