Federated Structured Sparse PCA for Anomaly Detection in IoT Networks
Huang, Xiu
Although federated learning has gained prominence as a privacy-preserving framework tailored for distributed Internet of Things (IoT) environments, current federated principal component analysis (PCA) methods lack integration of sparsity, a critical feature for robust anomaly detection. To address this limitation, we propose a novel federated structured sparse PCA (FedSSP) approach for anomaly detection in IoT networks. The proposed model uniquely integrates double sparsity regularization: (1) row-wise sparsity governed by $\ell_{2,p}$-norm with $p\in [0,1)$ to eliminate redundant feature dimensions, and (2) element-wise sparsity via $\ell_{q}$-norm with $q\in [0,1)$ to suppress noise-sensitive components. To solve this nonconvex problem in a distributed setting, we devise an efficient optimization algorithm based on the proximal alternating minimization (PAM). Numerical experiments validate that incorporating structured sparsity enhances both model interpretability and detection accuracy. Our code is available at https://github.com/xianchaoxiu/FedSSP.
academic
Föderiertes strukturiertes spärliches PCA zur Anomalieerkennung in IoT-Netzwerken
Föderiertes Lernen als datenschutzschützendes Framework findet in verteilten IoT-Umgebungen (Internet of Things) breite Anwendung. Allerdings mangelt es bestehenden Methoden des föderiertes Hauptkomponentenanalyse (PCA) an der Integration von Spärlichkeit, die ein Schlüsselmerkmal für robuste Anomalieerkennung darstellt. Um diese Einschränkung zu beheben, wird in diesem Artikel eine neuartige Methode des föderiertes strukturiertes spärliches PCA (FedSSP) zur Anomalieerkennung in IoT-Netzwerken vorgeschlagen. Das Modell integriert auf einzigartige Weise duale Spärlichkeitsregularisierung: (1) Zeilespärlichkeit durch die ℓ₂,p-Norm (p ∈ [0,1)) zur Beseitigung redundanter Merkmalsdimensionen; (2) Elementspärlichkeit durch die ℓq-Norm (q ∈ [0,1)) zur Unterdrückung rauschempfindlicher Komponenten. Um dieses nichtkonvexe Problem in einer verteilten Umgebung zu lösen, wird ein effizienter Optimierungsalgorithmus basierend auf proximaler alternierender Minimierung (PAM) entwickelt. Numerische Experimente bestätigen, dass die Einführung strukturierter Spärlichkeit die Modellinterpretierbarkeit und Erkennungsgenauigkeit verbessert.
Die schnelle Entwicklung von IoT-Netzwerken bringt neue Sicherheits- und Datenschutzherausforderungen mit sich, wobei Anomalieerkennung zu einer Schlüsseltechnologie zur Gewährleistung der IoT-Netzwerksicherheit wird. Die Hauptkomponentenanalyse (PCA) wird aufgrund ihrer unüberwachten Natur und Effektivität häufig zur Anomalieerkennung eingesetzt. Die Kernidee besteht darin, dass anomale Stichproben sich von normalem Verhalten unterscheiden und typischerweise größere Rekonstruktionsfehler aufweisen.
In verteilten IoT-Netzwerken sind Daten auf mehrere lokale Gateways verteilt, wodurch traditionelle zentralisierte PCA-Methoden unpraktisch werden. Gleichzeitig weisen IoT-Daten folgende Merkmale auf:
Traditionelles verteiltes PCA (Formel 1): Erfordert die Aggregation aller Daten auf einem zentralen Server, ungeeignet für datenschutzsensible Szenarien
FedPG-Methode (Formel 2): Implementiert zwar ein föderiertes Lernframework, berücksichtigt aber nicht die Dataspärlichkeit, die für die Anomalieerkennung entscheidend ist
Mangel an strukturierter Spärlichkeit: Bestehende Methoden erfassen nicht gleichzeitig Zeilen- und Elementebenen-Spärlichkeitsstrukturen
Basierend auf den obigen Einschränkungen stellt sich eine natürliche Frage: Kann Spärlichkeit in das föderierte PCA-Framework integriert werden? Dies veranlasst die Autoren, das FedSSP-Modell zu entwerfen, das durch duale Spärlichkeitsregularisierung gleichzeitig Merkmalsauswahl und Rauschunterdrückung erreicht.
Vorschlag eines föderiertes strukturiertes spärliches PCA-Frameworks: Erstmalige Integration dualer Spärlichkeitsregularisierung (Zeilen- und Elementspärlichkeit) in föderiertes PCA, speziell für IoT-Netzwerk-Anomalieerkennung
Entwicklung eines effizienten Optimierungsalgorithmus: Basierend auf proximaler alternierender Minimierung (PAM) und konjugiertem Gradientenverfahren auf Grassmann-Mannigfaltigkeiten zur effektiven Lösung nichtkonvexer Optimierungsprobleme
Bereitstellung geschlossener Lösungen und proximaler Operatoren: Für ℓq-Norm- und ℓ₂,p-Norm-Teilprobleme werden theoretische analytische Lösungen bereitgestellt
Experimentelle Validierung: Validierung der Methodeneffektivität auf echten IoT-Eindringerkennungsdatensätzen (TON_IoT) mit Verbesserungen gegenüber FedPG um 1,49% bei Genauigkeit, 1,52% bei Präzision und 0,79% bei F1-Score
Eingabe: Auf N lokalen Gateways verteilte Datenmatrizen {X₁, X₂, ..., Xₙ}, wobei Xₜ ∈ ℝ^(d×n)
Ausgabe: Globale Hauptkomponentenmatrix W ∈ ℝ^(d×m) (oder Z), erfüllend die Orthogonalitätsbeschränkung W^⊤W = I
Ziel: Minimierung des globalen Rekonstruktionsfehlers bei gleichzeitiger Erreichung strukturierter Spärlichkeit zur Anomalieerkennung