Federated Conditional Conformal Prediction via Generative Models
Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
academic
Prédiction Conforme Conditionnelle Fédérée via Modèles Génératifs
La prédiction conforme (Conformal Prediction, CP) fournit une quantification de l'incertitude sans hypothèse de distribution en construisant des ensembles de prédiction garantissant de couvrir les véritables étiquettes. Cette fiabilité confère à la CP une importance cruciale dans les scénarios d'apprentissage fédéré à haut risque, tels que la médecine multi-centralisée. Cependant, la CP standard suppose que les données sont indépendantes et identiquement distribuées (i.i.d.), hypothèse violée dans les paramètres fédérés où la distribution des clients varie considérablement. Les méthodes existantes de CP fédérée résolvent ce problème en maintenant une couverture marginale sur chaque client, mais cette garantie ne reflète souvent pas l'incertitude conditionnelle à l'entrée. Cet article propose la prédiction conforme conditionnelle fédérée basée sur des modèles génératifs (Fed-CCP), visant à réaliser une couverture conditionnelle adaptée à l'hétérogénéité des données locales. Fed-CCP exploite des modèles génératifs tels que les flots normalisants ou les modèles de diffusion pour approximer les distributions de données conditionnelles, sans nécessiter le partage de données brutes. Cela permet à chaque client de calibrer localement les scores conformes reflétant son incertitude unique, tout en maintenant la cohérence mondiale par agrégation fédérée.
Problème central: Comment réaliser une prédiction conforme qui protège la vie privée tout en fournissant une quantification de l'incertitude conditionnelle à l'entrée dans un environnement d'apprentissage fédéré?
Importance du problème:
Dans les domaines à haut risque tels que la médecine et la finance, une quantification fiable de l'incertitude est nécessaire
Dans les scénarios d'apprentissage fédéré, les données ne peuvent pas être centralisées, créant une hétérogénéité de distribution significative
Les exigences de protection de la vie privée limitent le partage de données brutes
Limitations des méthodes existantes:
La CP standard suppose des données i.i.d., ce qui échoue dans les paramètres fédérés
Les méthodes existantes de CP fédérée (FCP, FedCP-QQ, DP-FedCP) se concentrent uniquement sur la couverture marginale
La couverture marginale produit des intervalles de prédiction de largeur uniforme, incapable de refléter l'incertitude spécifique à l'instance
Absence de méthode efficace pour réaliser une couverture conditionnelle dans les paramètres fédérés
Motivation de la recherche:
Nécessité de réaliser une quantification d'incertitude adaptative et spécifique à l'instance tout en protégeant la vie privée
Exploitation de la capacité de transformation de distribution des modèles génératifs pour unifier les distributions hétérogènes des clients
Réalisation de la couverture conditionnelle dans l'espace de distribution de référence, puis transformation vers l'espace de distribution original
Proposition du cadre Fed-CCP: Première réalisation de la prédiction conforme conditionnelle en apprentissage fédéré, construisant des ensembles de prédiction transformables via des modèles génératifs
Innovation théorique: Utilisation de transformations bijectives pour préserver les garanties de couverture conditionnelle, transformant de l'espace de distribution gaussienne de référence vers l'espace de données original du client
Conception de protection de la vie privée: Entraînement des modèles génératifs uniquement par échange de gradients, sans partage de données brutes
Adaptation au client: Introduction d'un conditionneur de client η pour modéliser l'hétérogénéité entre clients
Validation expérimentale: Vérification de l'efficacité de la méthode dans 5 domaines: médecine, assurance, Internet des objets, épidémiologie et prédiction du trafic
Étant donné K clients, où chaque client k possède des données suivant la distribution QXY(k), l'objectif est de construire un ensemble de prédiction CTrans(Xn+1) satisfaisant la garantie de couverture conditionnelle:
Pr(Yn+1∈CTrans(Xn+1)∣Xn+1=x)≥1−α,∀x∈X
Apprentissage de la transformation inversible fθ de la distribution du client QXY vers la distribution de référence PXY
Optimisation de la divergence KL utilisant la formule de changement de variables:
minθDKL(fθ#qXY∥pXY)=minθ−E(x,y)∼QXY[logpXY(fθ(x,y))+log∣det∂(x,y)∂fθ(x,y)∣−1]
Modèles de Diffusion (Diffusion Models):
Réalisation du processus de diffusion avant par équation différentielle stochastique:
d(Xt,Yt)=−21βt(Xt,Yt)dt+βtdWt
Apprentissage du processus inverse par débruitage, approximant la transformation inverse g≈f−1
Introduction d'un conditionneur de client η(k)∼N(μ(k),(σ(k))2), permettant au modèle génératif conditionnel fθ(x,y;η) de s'adapter aux caractéristiques de distribution de différents clients.
Garantie de Bijectivité: Utilisation de l'inversibilité des modèles génératifs pour assurer que les garanties de couverture conditionnelle restent invariantes sous transformation de distribution
Mécanisme de Conditionneur: Modélisation de l'hétérogénéité entre clients via un conditionneur gaussien spécifique au client
Protection de la Vie Privée: Le modèle de prédiction de base h est entraîné uniquement sur la distribution gaussienne de référence; l'entraînement du modèle génératif n'échange que les informations de gradient
Cadre Unifié: Mappage unifié des distributions hétérogènes des clients vers un même espace de distribution de référence pour la couverture conditionnelle
Taux de Couverture Marginale: Évalué comme condition nécessaire de la couverture conditionnelle
Taille Moyenne de l'Ensemble de Prédiction: Mesure l'adaptabilité de la méthode; les ensembles de prédiction plus petits indiquent une meilleure approximation de la couverture conditionnelle
Cet article cite des travaux importants dans les domaines de la prédiction conforme, de l'apprentissage fédéré et des modèles génératifs, notamment:
Fondations théoriques de la prédiction conforme de Vovk et al.
Méthode CQR de Romano et al.
Travaux de prédiction conforme fédérée de Lu et al.
Littérature classique sur les flots normalisants et les modèles de diffusion
Évaluation Globale: Cet article représente un travail de haute qualité en apprentissage automatique, apportant des contributions importantes au domaine interdisciplinaire de l'apprentissage fédéré et de la quantification de l'incertitude. La méthode est novatrice, les expériences sont complètes, et le travail possède une importance théorique et une valeur pratique significatives. Il est recommandé d'approfondir l'analyse théorique et l'efficacité computationnelle.