Federated Structured Sparse PCA for Anomaly Detection in IoT Networks
Huang, Xiu
Although federated learning has gained prominence as a privacy-preserving framework tailored for distributed Internet of Things (IoT) environments, current federated principal component analysis (PCA) methods lack integration of sparsity, a critical feature for robust anomaly detection. To address this limitation, we propose a novel federated structured sparse PCA (FedSSP) approach for anomaly detection in IoT networks. The proposed model uniquely integrates double sparsity regularization: (1) row-wise sparsity governed by $\ell_{2,p}$-norm with $p\in [0,1)$ to eliminate redundant feature dimensions, and (2) element-wise sparsity via $\ell_{q}$-norm with $q\in [0,1)$ to suppress noise-sensitive components. To solve this nonconvex problem in a distributed setting, we devise an efficient optimization algorithm based on the proximal alternating minimization (PAM). Numerical experiments validate that incorporating structured sparsity enhances both model interpretability and detection accuracy. Our code is available at https://github.com/xianchaoxiu/FedSSP.
academic
IoT नेटवर्क में विसंगति पहचान के लिए संघीय संरचित विरल PCA
संघीय शिक्षण एक गोपनीयता-संरक्षण ढांचे के रूप में वितरित IoT (इंटरनेट ऑफ थिंग्स) वातावरण में व्यापक रूप से लागू होता है, लेकिन मौजूदा संघीय प्रमुख घटक विश्लेषण (PCA) विधियों में विरलता एकीकरण की कमी है, जबकि विरलता मजबूत विसंगति पहचान के लिए एक महत्वपूर्ण विशेषता है। इस सीमा को संबोधित करने के लिए, यह पेपर IoT नेटवर्क विसंगति पहचान के लिए एक नई संघीय संरचित विरल PCA (FedSSP) विधि प्रस्तावित करता है। यह मॉडल अद्वितीय रूप से दोहरी विरलता नियमितकरण को एकीकृत करता है: (1) ℓ₂,p मानदंड (p∈[0,1)) के माध्यम से पंक्ति विरलता अनावश्यक विशेषता आयामों को समाप्त करने के लिए; (2) ℓq मानदंड (q∈[0,1)) के माध्यम से तत्व विरलता शोर-संवेदनशील घटकों को दबाने के लिए। वितरित वातावरण में इस गैर-उत्तल समस्या को हल करने के लिए, समीपस्थ वैकल्पिक न्यूनीकरण (PAM) पर आधारित एक कुशल अनुकूलन एल्गोरिदम डिज़ाइन किया गया है। संख्यात्मक प्रयोग सत्यापित करते हैं कि संरचित विरलता का परिचय मॉडल व्याख्यात्मकता और पहचान सटीकता को बढ़ाता है।
IoT नेटवर्क का तीव्र विकास नई सुरक्षा और गोपनीयता चुनौतियाँ लाता है, और विसंगति पहचान IoT नेटवर्क सुरक्षा सुनिश्चित करने के लिए एक महत्वपूर्ण तकनीक बन गई है। प्रमुख घटक विश्लेषण (PCA) अपनी अनुपर्यवेक्षित प्रकृति और प्रभावशीलता के कारण विसंगति पहचान में व्यापक रूप से लागू होता है, इसका मूल विचार यह है कि विसंगतिपूर्ण नमूने सामान्य व्यवहार से भिन्न होते हैं और आमतौर पर बड़ी पुनर्निर्माण त्रुटि होती है।
वितरित IoT नेटवर्क में, डेटा कई स्थानीय गेटवे में बिखरा हुआ है, और पारंपरिक केंद्रीकृत PCA विधि अव्यावहारिक है। साथ ही, IoT डेटा में निम्नलिखित विशेषताएँ हैं:
डेटा अनावश्यकता: बड़ी संख्या में अनावश्यक विशेषता आयाम मौजूद हैं
शोर संवेदनशीलता: डेटा गंभीर रूप से शोर से प्रभावित होता है
गोपनीयता संरक्षण आवश्यकता: डेटा को सीधे केंद्रीय सर्वर में एकत्रित नहीं किया जा सकता
उपरोक्त सीमाओं के आधार पर, यह पेपर एक स्वाभाविक प्रश्न उठाता है: क्या विरलता को संघीय PCA ढांचे में एकीकृत किया जा सकता है? यह लेखकों को FedSSP मॉडल डिज़ाइन करने के लिए प्रेरित करता है, दोहरी विरलता नियमितकरण के माध्यम से विशेषता चयन और शोर दमन को एक साथ प्राप्त करने के लिए।
संघीय संरचित विरल PCA ढांचा प्रस्तावित किया: पहली बार दोहरी विरलता नियमितकरण (पंक्ति विरलता और तत्व विरलता) को संघीय PCA में एकीकृत किया, विशेष रूप से IoT नेटवर्क विसंगति पहचान के लिए
कुशल अनुकूलन एल्गोरिदम डिज़ाइन किया: समीपस्थ वैकल्पिक न्यूनीकरण (PAM) और Grassmann मैनिफोल्ड पर संयुग्म ढाल विधि के आधार पर, गैर-उत्तल अनुकूलन समस्या को प्रभावी ढंग से हल करता है
बंद-रूप समाधान और समीपस्थ ऑपरेटर प्रदान किए: ℓq मानदंड और ℓ₂,p मानदंड उप-समस्याओं के लिए, सैद्धांतिक विश्लेषणात्मक समाधान दिए
प्रायोगिक सत्यापन: वास्तविक IoT घुसपैठ पहचान डेटासेट (TON_IoT) पर विधि की प्रभावशीलता सत्यापित की, FedPG की तुलना में सटीकता, सटीकता और F1 स्कोर में क्रमशः 1.49%, 1.52% और 0.79% की वृद्धि
इनपुट: N स्थानीय गेटवे में वितरित डेटा मैट्रिक्स {X₁, X₂, ..., Xₙ}, जहाँ Xₜ ∈ ℝ^(d×n)
आउटपुट: वैश्विक प्रमुख घटक मैट्रिक्स W ∈ ℝ^(d×m) (या Z), जो ऑर्थोगोनल बाधा W^⊤W = I को संतुष्ट करता है
उद्देश्य: वैश्विक पुनर्निर्माण त्रुटि को न्यूनतम करना और संरचित विरलता प्राप्त करना, विसंगति पहचान के लिए
पंक्ति विरलता (ℓ₂,p मानदंड): स्वचालित रूप से महत्वपूर्ण विशेषता आयामों का चयन करता है, अनावश्यक विशेषताओं को समाप्त करता है, मॉडल व्याख्यात्मकता में सुधार करता है
तत्व विरलता (ℓq मानदंड): शोर-संवेदनशील छोटे गुणांकों को दबाता है, मॉडल मजबूती बढ़ाता है
पूरकता: दोनों प्रकार की विरलता विभिन्न स्तरों पर सहक्रियात्मक रूप से काम करती है, एक संरचित विरल पैटर्न बनाती है
डेटा विभाजन: प्रशिक्षण सेट को "dst bytes" के अनुसार 20 गैर-i.i.d. उप-सेट में विभाजित किया, वास्तविक IoT नेटवर्क के विषम क्लाइंट ट्रैफिक को अनुकरण करता है