FedGTEA: Federated Class-Incremental Learning with Gaussian Task Embedding and Alignment
Li, Bidkhori
We introduce a novel framework for Federated Class Incremental Learning, called Federated Gaussian Task Embedding and Alignment (FedGTEA). FedGTEA is designed to capture task-specific knowledge and model uncertainty in a scalable and communication-efficient manner. At the client side, the Cardinality-Agnostic Task Encoder (CATE) produces Gaussian-distributed task embeddings that encode task knowledge, address statistical heterogeneity, and quantify data uncertainty. Importantly, CATE maintains a fixed parameter size regardless of the number of tasks, which ensures scalability across long task sequences. On the server side, FedGTEA utilizes the 2-Wasserstein distance to measure inter-task gaps between Gaussian embeddings. We formulate the Wasserstein loss to enforce inter-task separation. This probabilistic formulation not only enhances representation learning but also preserves task-level privacy by avoiding the direct transmission of latent embeddings, aligning with the privacy constraints in federated learning. Extensive empirical evaluations on popular datasets demonstrate that FedGTEA achieves superior classification performance and significantly mitigates forgetting, consistently outperforming strong existing baselines.
academic
FedGTEA: गॉसियन टास्क एम्बेडिंग और संरेखण के साथ संघीय वर्ग-वर्धमान शिक्षा
यह पेपर एक नई संघीय वर्ग-वर्धमान शिक्षा ढांचा FedGTEA (संघीय गॉसियन टास्क एम्बेडिंग और संरेखण) प्रस्तावित करता है। यह ढांचा स्केलेबल और संचार-कुशल तरीके से कार्य-विशिष्ट ज्ञान और मॉडल अनिश्चितता को कैप्चर करता है। क्लाइंट पक्ष पर, कार्डिनैलिटी-अज्ञेय कार्य एनकोडर (CATE) गॉसियन वितरित कार्य एम्बेडिंग उत्पन्न करता है, जो कार्य ज्ञान को एनकोड करता है, सांख्यिकीय विषमता को हल करता है और डेटा अनिश्चितता को मापता है। CATE की मुख्य विशेषता यह है कि कार्यों की संख्या की परवाह किए बिना यह निश्चित पैरामीटर आकार बनाए रखता है, जो लंबे कार्य अनुक्रमों की स्केलेबिलिटी सुनिश्चित करता है। सर्वर पक्ष पर, FedGTEA गॉसियन एम्बेडिंग के बीच कार्य अंतराल को मापने के लिए 2-Wasserstein दूरी का उपयोग करता है, Wasserstein हानि के माध्यम से कार्य-अंतर पृथक्करण को लागू करता है। यह संभाव्य सूत्रीकरण न केवल प्रतिनिधित्व शिक्षा को बढ़ाता है, बल्कि सीधे अव्यक्त एम्बेडिंग के संचरण से बचकर कार्य-स्तरीय गोपनीयता की भी रक्षा करता है।
संघीय वर्ग-वर्धमान शिक्षा (FCIL) संघीय शिक्षा (FL) और वर्ग-वर्धमान शिक्षा (CIL) का एक संकर है, जिसे तीन मुख्य चुनौतियों को एक साथ संबोधित करने की आवश्यकता है:
विनाशकारी विस्मृति: क्लाइंट स्थानीय और वैश्विक एकत्रीकरण प्रक्रिया दोनों में होती है
सांख्यिकीय विषमता: क्लाइंट के बीच डेटा वितरण आमतौर पर स्वतंत्र और समान रूप से वितरित नहीं होता है
कार्य संदर्भ अस्पष्टता: परीक्षण समय पर कार्य पहचान की कमी से शब्दार्थ बहाव और प्रदर्शन में गिरावट होती है
मौजूदा FCIL विधियां मुख्य रूप से डेटा-स्तरीय विशेषताओं के उपयोग पर ध्यान केंद्रित करती हैं, जबकि कार्य-स्तरीय संदर्भ के महत्व को नजरअंदाज करती हैं। जैसा कि चित्र 1 में दिखाया गया है, एक ही इनपुट विभिन्न कार्यों के तहत विरोधाभासी उत्तर दे सकता है (उदाहरण के लिए "यह कौन सी वस्तु है?" बनाम "पृष्ठभूमि का रंग क्या है?"), जिसके लिए विभिन्न कार्य-स्तरीय संदर्भ जानकारी की आवश्यकता है। इसलिए, FCIL में कार्य संदर्भ को प्रभावी ढंग से कैसे उपयोग किया जाए, यह अभी भी एक अपेक्षाकृत अविकसित अनुसंधान क्षेत्र है।
FedGTEA एल्गोरिदम प्रस्तावित करना: FCIL में स्केलेबल और मजबूत तरीके से कार्य-स्तरीय ज्ञान को प्रभावी ढंग से कैप्चर करना, क्लाइंट पक्ष पर कार्डिनैलिटी-अज्ञेय कार्य एनकोडर (CATE) का परिचय देना जो कार्य एम्बेडिंग उत्पन्न करता है, इसे गॉसियन यादृच्छिक चर के रूप में मॉडल करना, और सर्वर पक्ष पर 2-Wasserstein दूरी का उपयोग करके कार्य-अंतर पृथक्करण को बढ़ावा देना।
CATE मॉड्यूल डिजाइन करना: किसी भी आकार के डेटा बैच से कार्य एम्बेडिंग का अनुमान लगाने में सक्षम, कार्डिनैलिटी-अज्ञेय विशेषता के साथ। एम्बेडिंग को गॉसियन यादृच्छिक चर के रूप में मॉडल करके, सर्वर को 2-Wasserstein मीट्रिक का उपयोग करके कार्य-अंतर दूरी को मापने में सक्षम बनाता है।
सर्वर-पक्ष अनुकूलन ढांचा: पहले FedAvg सिद्धांत का उपयोग करके प्रारंभिक मॉडल एकत्रीकरण, फिर तीन हानि घटकों वाली अनुकूलन समस्या तैयार करना: ज्ञान आसवन हानि, Wasserstein हानि और एंकर हानि।
प्रायोगिक सत्यापन: कई बेंचमार्क डेटासेट पर मजबूत बेसलाइन (AC-GAN + FedAvg/FedProx, GLFC, FedCIL, FLwF-2T) की तुलना में बेहतर सटीकता और विस्मृति प्रदर्शन प्राप्त करना।
FCIL प्रणाली में N क्लाइंट और एक केंद्रीय सर्वर होता है, जो वैश्विक कार्य अनुक्रम T = {T¹, T², ..., Tᵀ} को संभालता है। प्रत्येक क्लाइंट Cₖ कार्य Tᵗ पर स्थानीय डेटासेट Dᵗₖ ⊂ Tᵗ एकत्र करता है। लक्ष्य वैश्विक पैरामीटर θᵗₘ खोजना है, जो सभी देखे गए कार्यों और सभी क्लाइंट पर हानि को कम करता है।
पूरी तरह से जुड़े तंत्रिका नेटवर्क के रूप में डिज़ाइन किया गया है, किसी भी आकार के बैच B = (x₁, x₂, ..., xᵦ) को देखते हुए, d-आयामी कार्य एम्बेडिंग आउटपुट करता है:
Eᵦ = (1/b)∑ᵢ₌₁ᵇ CATE(xᵢ) ∈ ℝᵈ
पैरामीटर संख्या कार्यों की संख्या के साथ नहीं बढ़ती है, लंबे कार्य अनुक्रमों की स्केलेबिलिटी सुनिश्चित करती है
2. AC-GAN मॉड्यूल
विभेदक में Real/Fake हेड और वर्गीकरण हेड होते हैं
वर्गीकरण हेड डेटा विशेषताओं F और कार्य एम्बेडिंग E को भविष्यवाणी के लिए फ्यूज करता है
जनरेटर G पुनरावृत्ति के लिए छवियां संश्लेषित करता है
आसवन हानि: हटाने के बाद विस्मृति दर में उल्लेखनीय वृद्धि (CIFAR-100 सुपरक्लास पर 8.6 से 12.2 तक), पूर्व ज्ञान को बनाए रखने के लिए इसके महत्व को साबित करता है
एंकर हानि: हटाने के बाद सटीकता में भारी गिरावट (CIFAR-10 पर लगभग 7% की गिरावट), विभेदक विशेषता प्रतिनिधित्व को स्थिर करने के लिए इसकी आवश्यकता को दर्शाता है
CATE और Wasserstein हानि: हटाने के बाद प्रदर्शन में उल्लेखनीय गिरावट, कार्य एनकोडर और कार्य पृथक्करण तंत्र की प्रभावशीलता को सत्यापित करता है
FedGTEA कार्डिनैलिटी-अज्ञेय कार्य एनकोडर और Wasserstein दूरी नियमितकरण का परिचय देकर, FCIL में कार्य-स्तरीय ज्ञान के प्रभावी मॉडलिंग को प्राप्त करता है, सटीकता और विस्मृति प्रदर्शन दोनों में मौजूदा विधियों से बेहतर है।
यह कार्य FCIL क्षेत्र में कार्य-स्तरीय मॉडलिंग के नए विचार का परिचय देता है, जो अधिक कार्य संदर्भ पर ध्यान केंद्रित करने वाले अनुसंधान को प्रेरित कर सकता है। कार्डिनैलिटी-अज्ञेय डिजाइन और गोपनीयता संरक्षण विशेषताएं इसे व्यावहारिक अनुप्रयोगों में अच्छी संभावनाएं प्रदान करती हैं।
पेपर FCIL, CIL और FL क्षेत्र के महत्वपूर्ण कार्यों का हवाला देता है, जिसमें FedAvg, iCaRL, AC-GAN जैसी शास्त्रीय विधियां, साथ ही FedCIL, GLFC जैसे नवीनतम FCIL अनुसंधान शामिल हैं, जो इस अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।