Federated Conditional Conformal Prediction via Generative Models
Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
Konforme Vorhersagen (Conformal Prediction, CP) bieten verteilungsfreie Unsicherheitsquantifizierung durch die Konstruktion von Vorhersagemengen, die die wahren Etiketten mit garantierter Überdeckung enthalten. Diese Zuverlässigkeit macht CP in hochriskanten föderalen Lernszenarien wie Multi-Center-Medizin wertvoll. Standardmäßig setzt CP jedoch unabhängig und identisch verteilte (i.i.d.) Daten voraus, was in föderalen Einstellungen mit erheblichen Verteilungsunterschieden zwischen Clients verletzt wird. Bestehende föderale CP-Methoden adressieren dieses Problem durch die Aufrechterhaltung marginaler Überdeckung auf jedem Client, aber diese Garantien spiegeln oft nicht die bedingte Unsicherheit bei Eingaben wider. Dieses Paper schlägt föderiertes bedingtes konformes Vorhersagen basierend auf generativen Modellen (Fed-CCP) vor, um bedingte Überdeckung zu erreichen, die sich an lokale Datenheterogenität anpasst. Fed-CCP nutzt generative Modelle wie normalisierte Flüsse oder Diffusionsmodelle, um bedingte Datenverteilungen zu approximieren, ohne Rohdaten zu teilen. Dies ermöglicht es jedem Client, lokal konforme Scores zu kalibrieren, die seine einzigartige Unsicherheit widerspiegeln, während gleichzeitig durch föderale Aggregation globale Konsistenz gewahrt bleibt.
Kernproblem: Wie lässt sich in föderalen Lernumgebungen sowohl Datenschutz als auch bedingte Unsicherheitsquantifizierung durch konforme Vorhersagen erreichen?
Problemrelevanz:
In hochriskanten Bereichen wie Medizin und Finanzen ist zuverlässige Unsicherheitsquantifizierung erforderlich
In föderalen Lernszenarien können Daten nicht zentralisiert werden und weisen erhebliche Verteilungsheterogenität auf
Datenschutzanforderungen beschränken die Weitergabe von Rohdaten
Einschränkungen bestehender Methoden:
Standard-CP setzt i.i.d.-Daten voraus und versagt in föderalen Einstellungen
Bestehende föderale CP-Methoden (FCP, FedCP-QQ, DP-FedCP) konzentrieren sich nur auf marginale Überdeckung
Marginale Überdeckung erzeugt einheitlich breite Vorhersageintervalle und kann instanzspezifische Unsicherheit nicht widerspiegeln
Es fehlt eine effektive Methode zur Erreichung bedingter Überdeckung in föderalen Einstellungen
Forschungsmotivation:
Notwendigkeit adaptiver, instanzspezifischer Unsicherheitsquantifizierung unter Datenschutz
Nutzung der Verteilungstransformationsfähigkeiten generativer Modelle zur Vereinheitlichung heterogener Client-Verteilungen
Bedingte Überdeckung im Referenzverteilungsraum durchführen und dann in den ursprünglichen Verteilungsraum transformieren
Vorschlag des Fed-CCP-Rahmens: Erstmalige Realisierung bedingter konformer Vorhersagen im föderalen Lernen durch generative Modelle zur Konstruktion transformierbarer Vorhersagemengen
Theoretische Innovation: Nutzung bijektiver Transformationen zur Beibehaltung bedingter Überdeckungsgarantien, Transformation vom Referenz-Gaußraum in den ursprünglichen Client-Datenraum
Datenschutzdesign: Training generativer Modelle nur durch Gradientenaustausch ohne Rohdatenaustausch
Client-Anpassung: Einführung eines Client-Konditionierers η zur Modellierung von Client-übergreifender Heterogenität
Experimentelle Validierung: Validierung der Methode in 5 Domänen: Medizin, Versicherung, IoT, Epidemiologie und Verkehrsprognose
Gegeben K Clients, wobei jeder Client k Daten gemäß Verteilung QXY(k) folgt, besteht das Ziel darin, eine Vorhersagemenge CTrans(Xn+1) zu konstruieren, die die bedingte Überdeckungsgarantie erfüllt:
Pr(Yn+1∈CTrans(Xn+1)∣Xn+1=x)≥1−α,∀x∈X
Einführung eines Client-Konditionierers η(k)∼N(μ(k),(σ(k))2), damit das bedingte generative Modell fθ(x,y;η) sich an die Verteilungseigenschaften verschiedener Clients anpassen kann.
Bijektivitätsgarantie: Nutzung der Umkehrbarkeit generativer Modelle zur Sicherung, dass bedingte Überdeckungsgarantien unter Verteilungstransformation erhalten bleiben
Konditionierungsmechanismus: Modellierung von Client-übergreifender Heterogenität durch Client-spezifische Gauß-Konditionierer
Datenschutz: Basis-Vorhersagemodell h wird nur auf Referenz-Gaußverteilung trainiert; Generatives Modelltraining tauscht nur Gradientinformationen aus
Einheitlicher Rahmen: Vereinheitlichung heterogener Client-Verteilungen in denselben Referenzverteilungsraum für bedingte Überdeckung
Das Paper zitiert wichtige Literatur aus Bereichen konformes Vorhersagen, föderales Lernen und generative Modelle, einschließlich:
Theoretische Grundlagen konformen Vorhersagens von Vovk et al.
CQR-Methode von Romano et al.
Föderale Vorhersagarbeiten von Lu et al.
Klassische Literatur zu normalisierten Flüssen und Diffusionsmodellen
Gesamtbewertung: Dies ist ein hochqualitatives Machine-Learning-Paper mit wichtigen Beiträgen im Schnittstellenbereich föderales Lernen und Unsicherheitsquantifizierung. Die Methode ist innovativ, die Experimente umfassend und das Papier hat bedeutende theoretische und praktische Werte. Weitere Verbesserungen in theoretischer Analyse und Recheneffizienz werden empfohlen.