Federated Conditional Conformal Prediction via Generative Models
Xu, Xie
Conformal Prediction (CP) provides distribution-free uncertainty quantification by constructing prediction sets that guarantee coverage of the true labels. This reliability makes CP valuable for high-stakes federated learning scenarios such as multi-center healthcare. However, standard CP assumes i.i.d. data, which is violated in federated settings where client distributions differ substantially. Existing federated CP methods address this by maintaining marginal coverage on each client, but such guarantees often fail to reflect input-conditional uncertainty. In this work, we propose Federated Conditional Conformal Prediction (Fed-CCP) via generative models, which aims for conditional coverage that adapts to local data heterogeneity. Fed-CCP leverages generative models, such as normalizing flows or diffusion models, to approximate conditional data distributions without requiring the sharing of raw data. This enables each client to locally calibrate conformal scores that reflect its unique uncertainty, while preserving global consistency through federated aggregation. Experiments on real datasets demonstrate that Fed-CCP achieves more adaptive prediction sets.
academic
संघीय सशर्त अनुरूप भविष्यवाणी जनरेटिव मॉडल के माध्यम से
अनुरूप भविष्यवाणी (Conformal Prediction, CP) वास्तविक लेबल को कवर करने की गारंटी देने वाले भविष्यवाणी सेट बनाकर वितरण-मुक्त अनिश्चितता परिमाणीकरण प्रदान करती है। यह विश्वसनीयता CP को बहु-केंद्रीय चिकित्सा जैसे उच्च-जोखिम वाले संघीय शिक्षण परिदृश्यों में महत्वपूर्ण बनाती है। हालांकि, मानक CP डेटा स्वतंत्र और समान रूप से वितरित (i.i.d.) होने की मान्यता रखता है, जो क्लाइंट वितरण विविधता वाली संघीय सेटिंग्स में उल्लंघन होता है। मौजूदा संघीय CP विधियां प्रत्येक क्लाइंट पर सीमांत कवरेज बनाए रखकर इस समस्या को हल करती हैं, लेकिन यह गारंटी अक्सर इनपुट सशर्त अनिश्चितता को प्रतिबिंबित नहीं करती। यह पेपर जनरेटिव मॉडल-आधारित संघीय सशर्त अनुरूप भविष्यवाणी (Fed-CCP) प्रस्तावित करता है, जिसका उद्देश्य स्थानीय डेटा विषमता के अनुकूल सशर्त कवरेज प्राप्त करना है। Fed-CCP सामान्यीकृत प्रवाह या विसरण मॉडल जैसे जनरेटिव मॉडल का उपयोग करके सशर्त डेटा वितरण का अनुमान लगाता है, बिना कच्चे डेटा साझा किए। यह प्रत्येक क्लाइंट को अपनी अद्वितीय अनिश्चितता को प्रतिबिंबित करने वाले अनुरूप स्कोर को स्थानीय रूप से कैलिब्रेट करने में सक्षम बनाता है, जबकि संघीय एकत्रीकरण के माध्यम से वैश्विक सामंजस्य बनाए रखता है।
मूल समस्या: संघीय शिक्षण वातावरण में, गोपनीयता की सुरक्षा करते हुए इनपुट सशर्त अनिश्चितता परिमाणीकरण प्रदान करने वाली अनुरूप भविष्यवाणी कैसे प्राप्त करें?
समस्या की महत्ता:
चिकित्सा, वित्त आदि उच्च-जोखिम वाले क्षेत्रों में विश्वसनीय अनिश्चितता परिमाणीकरण की आवश्यकता है
संघीय शिक्षण परिदृश्य में डेटा केंद्रीकृत नहीं हो सकता, महत्वपूर्ण वितरण विषमता मौजूद है
गोपनीयता सुरक्षा आवश्यकताएं कच्चे डेटा साझाकरण को सीमित करती हैं
मौजूदा विधियों की सीमाएं:
मानक CP i.i.d. डेटा मानता है, संघीय सेटिंग में विफल होता है
मौजूदा संघीय CP विधियां (FCP, FedCP-QQ, DP-FedCP) केवल सीमांत कवरेज पर ध्यान केंद्रित करती हैं
सीमांत कवरेज समान चौड़ाई के भविष्यवाणी अंतराल उत्पन्न करता है, उदाहरण-विशिष्ट अनिश्चितता को प्रतिबिंबित नहीं कर सकता
संघीय सेटिंग में सशर्त कवरेज प्राप्त करने की प्रभावी विधि की कमी
अनुसंधान प्रेरणा:
गोपनीयता सुरक्षा के तहत अनुकूल, उदाहरण-विशिष्ट अनिश्चितता परिमाणीकरण की आवश्यकता
जनरेटिव मॉडल की वितरण परिवर्तन क्षमता का उपयोग करके विषम क्लाइंट वितरण को एकीकृत करना
संदर्भ वितरण स्थान में सशर्त कवरेज, फिर मूल वितरण स्थान में परिवर्तन
Fed-CCP ढांचा प्रस्तावित करना: संघीय शिक्षण में पहली बार सशर्त अनुरूप भविष्यवाणी प्राप्त करना, जनरेटिव मॉडल के माध्यम से परिवर्तनशील भविष्यवाणी सेट बनाना
सैद्धांतिक नवाचार: द्विभाजी परिवर्तन का उपयोग करके सशर्त कवरेज गारंटी को संरक्षित करना, संदर्भ गाऊसी वितरण स्थान से क्लाइंट मूल डेटा स्थान में परिवर्तन
गोपनीयता सुरक्षा डिजाइन: जनरेटिव मॉडल प्रशिक्षण के लिए केवल ग्रेडिएंट विनिमय, कच्चे डेटा साझाकरण की आवश्यकता नहीं
क्लाइंट अनुकूलन: क्लाइंट कंडीशनर η का परिचय देकर क्रॉस-क्लाइंट विषमता को मॉडल करना
प्रायोगिक सत्यापन: चिकित्सा, बीमा, IoT, महामारी विज्ञान, यातायात पूर्वानुमान आदि 5 क्षेत्रों में विधि की प्रभावशीलता का सत्यापन
K क्लाइंट दिए गए हैं, जहां प्रत्येक क्लाइंट k का डेटा वितरण QXY(k) का पालन करता है, लक्ष्य भविष्यवाणी सेट CTrans(Xn+1) बनाना है, जो सशर्त कवरेज गारंटी को संतुष्ट करता है:
Pr(Yn+1∈CTrans(Xn+1)∣Xn+1=x)≥1−α,∀x∈X
क्लाइंट वितरण QXY से संदर्भ वितरण PXY में उलटा परिवर्तन fθ सीखना
चर प्रतिस्थापन सूत्र का उपयोग करके KL विचलन को अनुकूलित करना:
minθDKL(fθ#qXY∥pXY)=minθ−E(x,y)∼QXY[logpXY(fθ(x,y))+log∣det∂(x,y)∂fθ(x,y)∣−1]
विसरण मॉडल (Diffusion Models):
यादृच्छिक अवकल समीकरण के माध्यम से अग्रगामी विसरण प्रक्रिया को लागू करना:
d(Xt,Yt)=−21βt(Xt,Yt)dt+βtdWt
विपरीत प्रक्रिया को सीखना, विपरीत परिवर्तन g≈f−1 का अनुमान लगाना
द्विभाजी गारंटी: जनरेटिव मॉडल की उलटापन का उपयोग करके सशर्त कवरेज गारंटी को वितरण परिवर्तन के तहत अपरिवर्तित रखना
कंडीशनर तंत्र: क्लाइंट-विशिष्ट गाऊसी कंडीशनर के माध्यम से क्रॉस-क्लाइंट विषमता को मॉडल करना
गोपनीयता सुरक्षा: आधार भविष्यवाणी मॉडल h केवल संदर्भ गाऊसी वितरण पर प्रशिक्षित होता है, जनरेटिव मॉडल प्रशिक्षण केवल ग्रेडिएंट जानकारी का विनिमय करता है
एकीकृत ढांचा: विषम क्लाइंट वितरण को एक ही संदर्भ वितरण स्थान में मैप करना सशर्त कवरेज के लिए
यह पेपर अनुरूप भविष्यवाणी, संघीय शिक्षण, जनरेटिव मॉडल आदि क्षेत्रों के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:
Vovk आदि की अनुरूप भविष्यवाणी सिद्धांत आधार
Romano आदि की CQR विधि
Lu आदि का संघीय अनुरूप भविष्यवाणी कार्य
सामान्यीकृत प्रवाह और विसरण मॉडल का शास्त्रीय साहित्य
समग्र मूल्यांकन: यह संघीय शिक्षण और अनिश्चितता परिमाणीकरण के अंतरविषय क्षेत्र में महत्वपूर्ण योगदान देने वाला उच्च-गुणवत्ता वाला मशीन लर्निंग पेपर है। विधि नवीन है, प्रयोग व्यापक हैं, और इसका महत्वपूर्ण सैद्धांतिक अर्थ और व्यावहारिक मूल्य है। सैद्धांतिक विश्लेषण और कम्प्यूटेशनल दक्षता के पहलुओं में आगे सुधार की सिफारिश की जाती है।