Federated Structured Sparse PCA for Anomaly Detection in IoT Networks
Huang, Xiu
Although federated learning has gained prominence as a privacy-preserving framework tailored for distributed Internet of Things (IoT) environments, current federated principal component analysis (PCA) methods lack integration of sparsity, a critical feature for robust anomaly detection. To address this limitation, we propose a novel federated structured sparse PCA (FedSSP) approach for anomaly detection in IoT networks. The proposed model uniquely integrates double sparsity regularization: (1) row-wise sparsity governed by $\ell_{2,p}$-norm with $p\in [0,1)$ to eliminate redundant feature dimensions, and (2) element-wise sparsity via $\ell_{q}$-norm with $q\in [0,1)$ to suppress noise-sensitive components. To solve this nonconvex problem in a distributed setting, we devise an efficient optimization algorithm based on the proximal alternating minimization (PAM). Numerical experiments validate that incorporating structured sparsity enhances both model interpretability and detection accuracy. Our code is available at https://github.com/xianchaoxiu/FedSSP.
academic
تحليل الورقة البحثية: PCA متفرق منظم موحد للكشف عن الشذوذ في شبكات إنترنت الأشياء
يُستخدم التعلم الموحد كإطار عمل لحماية الخصوصية على نطاق واسع في بيئات إنترنت الأشياء الموزعة، إلا أن الطرق الموحدة الحالية لتحليل المكونات الرئيسية (PCA) تفتقر إلى التكامل المتفرق، وهو سمة حاسمة للكشف القوي عن الشذوذ. لمعالجة هذا القيد، تقترح هذه الورقة طريقة جديدة لـ PCA متفرق منظم موحد (FedSSP) للكشف عن الشذوذ في شبكات إنترنت الأشياء. يدمج النموذج بشكل فريد تنظيم متفرق مزدوج: (1) تحقيق التفرق على مستوى الصفوف من خلال معيار ℓ₂,p (p∈[0,1)) لحذف أبعاد الميزات الزائدة؛ (2) تحقيق التفرق على مستوى العناصر من خلال معيار ℓq (q∈[0,1)) لقمع المكونات الحساسة للضوضاء. لحل هذه المشكلة غير المحدبة في بيئة موزعة، تم تصميم خوارزمية تحسين فعالة بناءً على التقليل المتناوب القريب (PAM). تتحقق التجارب الرقمية من أن إدخال التفرق المنظم يعزز قابلية التفسير والدقة في الكشف.
يجلب التطور السريع لشبكات إنترنت الأشياء تحديات أمنية وخصوصية جديدة، مما يجعل الكشف عن الشذوذ تقنية حاسمة لضمان أمان شبكات إنترنت الأشياء. يُستخدم تحليل المكونات الرئيسية (PCA) على نطاق واسع للكشف عن الشذوذ بسبب طبيعته غير الموجهة وفعاليته، حيث تكون الفكرة الأساسية أن العينات الشاذة تختلف عن السلوك الطبيعي وعادة ما يكون لديها خطأ إعادة بناء أكبر.
في شبكات إنترنت الأشياء الموزعة، تتوزع البيانات على بوابات محلية متعددة، مما يجعل طرق PCA المركزية التقليدية غير عملية. في الوقت نفسه، تتميز بيانات إنترنت الأشياء بالخصائص التالية:
الزيادة في البيانات: وجود أبعاد ميزات زائدة كثيرة
الحساسية للضوضاء: تتأثر البيانات بشدة بالضوضاء
متطلبات حماية الخصوصية: لا يمكن تجميع البيانات مباشرة على خادم مركزي
بناءً على القيود المذكورة أعلاه، تطرح الورقة سؤالاً طبيعياً: هل يمكن دمج التفرق في إطار عمل PCA الموحد؟ هذا يدفع المؤلفين إلى تصميم نموذج FedSSP، من خلال تنظيم متفرق مزدوج يحقق اختيار الميزات وقمع الضوضاء في نفس الوقت.
اقتراح إطار عمل PCA متفرق منظم موحد: دمج التنظيم المتفرق المزدوج (التفرق على مستوى الصفوف والعناصر) في PCA الموحد للمرة الأولى، موجه خصيصاً للكشف عن الشذوذ في شبكات إنترنت الأشياء
تصميم خوارزمية تحسين فعالة: بناءً على التقليل المتناوب القريب (PAM) وطريقة التدرج المترافق على متعدد جراسمان، حل فعال للمشكلة غير المحدبة
توفير حلول مغلقة ومؤثرات قريبة: توفير حلول تحليلية نظرية لمشاكل فرعية معيار ℓq ومعيار ℓ₂,p
التحقق التجريبي: التحقق من فعالية الطريقة على مجموعة بيانات حقيقية للكشف عن الاختراق في إنترنت الأشياء (TON_IoT)، مع تحسن بنسبة 1.49% في الدقة و1.52% في الدقة و0.79% في درجة F1 مقارنة بـ FedPG
الإدخال: مصفوفات البيانات الموزعة على N بوابة محلية {X₁, X₂, ..., Xₙ}، حيث Xₜ ∈ ℝ^(d×n)
الإخراج: مصفوفة المكونات الرئيسية العامة W ∈ ℝ^(d×m) (أو Z)، تحقق القيد المتعامد W^⊤W = I
الهدف: تقليل خطأ إعادة البناء العام مع تحقيق التفرق المنظم، للاستخدام في الكشف عن الشذوذ
تقسيم البيانات: تقسيم مجموعة التدريب إلى 20 مجموعة فرعية غير متطابقة التوزيع بناءً على "dst bytes"، محاكاة حركة المرور غير المتجانسة للعملاء في شبكات إنترنت الأشياء الحقيقية