Federated Conditional Conformal Prediction via Generative Models
Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
academic
Predizione Conforme Condizionale Federata tramite Modelli Generativi
La predizione conforme (Conformal Prediction, CP) fornisce quantificazione dell'incertezza senza ipotesi distributive costruendo insiemi di predizione che garantiscono la copertura dell'etichetta vera. Questa affidabilità rende la CP di grande valore in scenari di apprendimento federato ad alto rischio come la medicina multicenter. Tuttavia, la CP standard assume dati indipendenti e identicamente distribuiti (i.i.d.), ipotesi violata in impostazioni federate con significativa eterogeneità tra client. I metodi CP federati esistenti affrontano questo problema mantenendo la copertura marginale su ogni client, ma questa garanzia spesso non riflette l'incertezza condizionata all'input. Questo articolo propone la predizione conforme condizionale federata basata su modelli generativi (Fed-CCP), mirata a realizzare copertura condizionata adattata all'eterogeneità dei dati locali. Fed-CCP sfrutta modelli generativi come flussi normalizzati o modelli di diffusione per approssimare distribuzioni di dati condizionati senza condividere dati grezzi. Ciò consente a ogni client di calibrare localmente punteggi conformi che riflettono la sua incertezza unica, mantenendo al contempo coerenza globale attraverso aggregazione federata.
Problema Centrale: Come realizzare predizione conforme che protegga la privacy e fornisca quantificazione dell'incertezza condizionata all'input in ambienti di apprendimento federato?
Importanza del Problema:
In settori ad alto rischio come medicina e finanza, è necessaria quantificazione affidabile dell'incertezza
In scenari di apprendimento federato, i dati non possono essere centralizzati, con significativa eterogeneità distributiva
I requisiti di protezione della privacy limitano la condivisione di dati grezzi
Limitazioni dei Metodi Esistenti:
La CP standard assume dati i.i.d., fallisce in impostazioni federate
I metodi CP federati esistenti (FCP, FedCP-QQ, DP-FedCP) si concentrano solo sulla copertura marginale
La copertura marginale produce intervalli di predizione di larghezza uniforme, incapace di riflettere incertezza specifica dell'istanza
Mancanza di metodi efficaci per realizzare copertura condizionata in impostazioni federate
Motivazione della Ricerca:
Necessità di realizzare quantificazione dell'incertezza adattiva e specifica dell'istanza proteggendo la privacy
Sfruttare la capacità di trasformazione distributiva dei modelli generativi per unificare distribuzioni client eterogenee
Realizzare copertura condizionata nello spazio di distribuzione di riferimento, quindi trasformare nello spazio distributivo originale
Propone il Framework Fed-CCP: Realizza per la prima volta predizione conforme condizionata nell'apprendimento federato attraverso modelli generativi costruendo insiemi di predizione trasformabili
Innovazione Teorica: Sfrutta trasformazioni biiettive per preservare garanzie di copertura condizionata, trasformando dallo spazio di distribuzione gaussiana di riferimento allo spazio dati originale del client
Design di Protezione della Privacy: Addestra modelli generativi solo attraverso scambio di gradienti, senza condivisione di dati grezzi
Adattamento del Client: Introduce condizionatori client η per modellare eterogeneità tra client
Verifica Sperimentale: Valida l'efficacia del metodo in 5 domini: medicina, assicurazioni, IoT, epidemiologia e previsione del traffico
Dato K client, dove i dati di ogni client k seguono la distribuzione QXY(k), l'obiettivo è costruire un insieme di predizione CTrans(Xn+1) che soddisfi la garanzia di copertura condizionata:
Pr(Yn+1∈CTrans(Xn+1)∣Xn+1=x)≥1−α,∀x∈X
Apprendono la trasformazione invertibile fθ dalla distribuzione client QXY alla distribuzione di riferimento PXY
Sfruttano la formula di cambio di variabili per ottimizzare la divergenza KL:
minθDKL(fθ#qXY∥pXY)=minθ−E(x,y)∼QXY[logpXY(fθ(x,y))+log∣det∂(x,y)∂fθ(x,y)∣−1]
Modelli di Diffusione (Diffusion Models):
Realizzano il processo di diffusione in avanti attraverso equazioni differenziali stocastiche:
d(Xt,Yt)=−21βt(Xt,Yt)dt+βtdWt
Il processo inverso apprende la denoising, approssimando la trasformazione inversa g≈f−1
Introdurre condizionatori client η(k)∼N(μ(k),(σ(k))2), consentendo al modello generativo condizionato fθ(x,y;η) di adattarsi alle caratteristiche distributive di diversi client.
Garanzia di Biiettività: Sfrutta l'invertibilità dei modelli generativi per garantire che le garanzie di copertura condizionata rimangono invarianti sotto trasformazione distributiva
Meccanismo di Condizionamento: Modella eterogeneità tra client attraverso condizionatori gaussiani specifici del client
Protezione della Privacy: Il modello di predizione base h viene addestrato solo sulla distribuzione gaussiana di riferimento, l'addestramento del modello generativo scambia solo informazioni di gradiente
Framework Unificato: Mappa distribuzioni client eterogenee a uno spazio di distribuzione di riferimento comune per copertura condizionata
Tasso di Copertura Marginale: Valutato come condizione necessaria per copertura condizionata
Dimensione Media dell'Insieme di Predizione: Misura l'adattabilità del metodo, insiemi di predizione più piccoli indicano migliore approssimazione della copertura condizionata
L'articolo cita importanti letteratura nei campi della predizione conforme, apprendimento federato e modelli generativi, inclusi:
Fondamenti teorici della predizione conforme di Vovk e altri
Metodo CQR di Romano e altri
Lavori sulla predizione conforme federata di Lu e altri
Letteratura classica su flussi normalizzati e modelli di diffusione
Valutazione Complessiva: Questo è un articolo di alta qualità nel machine learning che fornisce contributi importanti nell'intersezione tra apprendimento federato e quantificazione dell'incertezza. Il metodo è innovativo, gli esperimenti sono completi, con significativo valore teorico e pratico. Si raccomanda di perfezionare ulteriormente l'analisi teorica e l'efficienza computazionale.