FedGTEA: Federated Class-Incremental Learning with Gaussian Task Embedding and Alignment
Li, Bidkhori
We introduce a novel framework for Federated Class Incremental Learning, called Federated Gaussian Task Embedding and Alignment (FedGTEA). FedGTEA is designed to capture task-specific knowledge and model uncertainty in a scalable and communication-efficient manner. At the client side, the Cardinality-Agnostic Task Encoder (CATE) produces Gaussian-distributed task embeddings that encode task knowledge, address statistical heterogeneity, and quantify data uncertainty. Importantly, CATE maintains a fixed parameter size regardless of the number of tasks, which ensures scalability across long task sequences. On the server side, FedGTEA utilizes the 2-Wasserstein distance to measure inter-task gaps between Gaussian embeddings. We formulate the Wasserstein loss to enforce inter-task separation. This probabilistic formulation not only enhances representation learning but also preserves task-level privacy by avoiding the direct transmission of latent embeddings, aligning with the privacy constraints in federated learning. Extensive empirical evaluations on popular datasets demonstrate that FedGTEA achieves superior classification performance and significantly mitigates forgetting, consistently outperforming strong existing baselines.
academic
FedGTEA: التعلم الفيدرالي المتزايد للفئات مع تضمين مهام غاوسي والمحاذاة
تقدم هذه الورقة إطار عمل جديد للتعلم الفيدرالي المتزايد للفئات يُسمى FedGTEA (التعلم الفيدرالي مع تضمين مهام غاوسي والمحاذاة). يلتقط هذا الإطار المعرفة الخاصة بالمهام وعدم اليقين في النموذج بطريقة قابلة للتوسع وفعالة من حيث الاتصالات. على جانب العميل، يُنتج مُشفِّر المهام غير المرتبط بالعدد (CATE) تضمينات مهام موزعة بشكل غاوسي، مما يُشفِّر معرفة المهام ويحل عدم التجانس الإحصائي ويقيس عدم اليقين في البيانات. الخاصية الرئيسية لـ CATE هي الحفاظ على حجم معاملات ثابت بغض النظر عن عدد المهام، مما يضمن قابلية التوسع لسلاسل المهام الطويلة. على جانب الخادم، يستخدم FedGTEA مسافة 2-Wasserstein لقياس الفجوات بين المهام في التضمينات الغاوسية، مما يفرض فصل المهام من خلال خسارة Wasserstein. لا تعزز هذه الصيغة الاحتمالية تعلم التمثيل فحسب، بل تحمي أيضًا خصوصية مستوى المهام بتجنب نقل التضمينات الكامنة مباشرة.
التعلم الفيدرالي المتزايد للفئات (FCIL) هو مزيج من التعلم الفيدرالي (FL) والتعلم المتزايد للفئات (CIL)، ويتطلب معالجة ثلاثة تحديات أساسية في نفس الوقت:
النسيان الكارثي: يحدث على مستوى العميل المحلي وفي عملية التجميع العام
عدم التجانس الإحصائي: عادة ما تكون توزيعات البيانات بين العملاء غير مستقلة وموزعة بشكل متطابق
غموض السياق المرتبط بالمهام: غياب هوية المهام في وقت الاختبار يؤدي إلى انجراف دلالي وانخفاض الأداء
تركز معظم طرق FCIL الحالية على استخدام الميزات على مستوى البيانات، بينما تتجاهل أهمية السياق على مستوى المهام. كما هو موضح في الشكل 1، قد ينتج نفس الإدخال إجابات متناقضة في مهام مختلفة (على سبيل المثال، "ما هذا الكائن؟" مقابل "ما لون الخلفية؟")، وهذا يتطلب معلومات سياق مختلفة على مستوى المهام. لذلك، لا تزال كيفية الاستفادة الفعالة من السياق المرتبط بالمهام في FCIL مجالًا بحثيًا نسبيًا غير مستكشف.
اقتراح خوارزمية FedGTEA: التقاط المعرفة على مستوى المهام بطريقة قابلة للتوسع وقوية في FCIL، مع إدخال مُشفِّر مهام غير مرتبط بالعدد (CATE) على جانب العميل لإنتاج تضمينات المهام، وتصميمها كمتغيرات عشوائية غاوسية، والاستفادة من مسافة 2-Wasserstein على جانب الخادم لتعزيز فصل المهام.
تصميم وحدة CATE: قادرة على استنتاج تضمينات المهام من دفعات بيانات بأحجام عشوائية، مع خاصية عدم الارتباط بالعدد. من خلال تصميم التضمينات كمتغيرات عشوائية غاوسية، يمكن للخادم قياس المسافة بين المهام باستخدام مقياس 2-Wasserstein.
إطار عمل التحسين على جانب الخادم: يبدأ بالتجميع الأولي للنموذج باستخدام مبدأ FedAvg، ثم يصيغ مشكلة تحسين تتضمن ثلاثة مكونات خسارة: خسارة تقطير المعرفة، وخسارة Wasserstein، وخسارة الارتساء.
التحقق التجريبي: تحقيق دقة أفضل وأداء نسيان مقارنة بخطوط أساس قوية (AC-GAN + FedAvg/FedProx، GLFC، FedCIL، FLwF-2T) على عدة مجموعات بيانات معيارية.
يتضمن نظام FCIL N عميل وخادم مركزي واحد، ويعالج سلسلة مهام عام T = {T¹, T², ..., Tᵀ}. يجمع كل عميل Cₖ مجموعة بيانات محلية Dᵗₖ ⊂ Tᵗ في المهمة Tᵗ. الهدف هو إيجاد معاملات عام θᵗₘ تقلل الخسارة على جميع المهام المرئية وجميع العملاء.
يحقق FedGTEA نمذجة فعالة للمعرفة على مستوى المهام في FCIL من خلال إدخال مُشفِّر مهام غير مرتبط بالعدد وتنظيم مسافة Wasserstein، متفوقًا على الطرق الموجودة في كل من دقة الأداء والنسيان.
يقدم هذا العمل فكرة جديدة لنمذجة مستوى المهام في مجال FCIL، وقد يلهم المزيد من الأبحاث التي تركز على السياق المرتبط بالمهام. يجعل التصميم غير المرتبط بالعدد وخصائص حماية الخصوصية لديها إمكانات جيدة في التطبيقات العملية.
تستشهد الورقة بأعمال مهمة في مجالات FCIL و CIL و FL، بما في ذلك الطرق الكلاسيكية مثل FedAvg و iCaRL و AC-GAN، وكذلك أحدث أبحاث FCIL مثل FedCIL و GLFC، مما يوفر أساسًا نظريًا متينًا لهذا البحث.