Federated Structured Sparse PCA for Anomaly Detection in IoT Networks
Huang, Xiu
Although federated learning has gained prominence as a privacy-preserving framework tailored for distributed Internet of Things (IoT) environments, current federated principal component analysis (PCA) methods lack integration of sparsity, a critical feature for robust anomaly detection. To address this limitation, we propose a novel federated structured sparse PCA (FedSSP) approach for anomaly detection in IoT networks. The proposed model uniquely integrates double sparsity regularization: (1) row-wise sparsity governed by $\ell_{2,p}$-norm with $p\in [0,1)$ to eliminate redundant feature dimensions, and (2) element-wise sparsity via $\ell_{q}$-norm with $q\in [0,1)$ to suppress noise-sensitive components. To solve this nonconvex problem in a distributed setting, we devise an efficient optimization algorithm based on the proximal alternating minimization (PAM). Numerical experiments validate that incorporating structured sparsity enhances both model interpretability and detection accuracy. Our code is available at https://github.com/xianchaoxiu/FedSSP.
academic
IoT নেটওয়ার্কে অসামান্যতা সনাক্তকরণের জন্য ফেডারেটেড স্ট্রাকচার্ড স্পার্স PCA
ফেডারেটেড লার্নিং বিতরণকৃত IoT (ইন্টারনেট অফ থিংস) পরিবেশে গোপনীয়তা সুরক্ষা কাঠামো হিসাবে ব্যাপকভাবে প্রয়োগ করা হয়, তবে বিদ্যমান ফেডারেটেড প্রধান উপাদান বিশ্লেষণ (PCA) পদ্ধতিতে স্পার্সিটি একীকরণের অভাব রয়েছে, যখন স্পার্সিটি শক্তিশালী অসামান্যতা সনাক্তকরণের জন্য একটি মূল বৈশিষ্ট্য। এই সীমাবদ্ধতা সমাধানের জন্য, এই পেপারটি IoT নেটওয়ার্ক অসামান্যতা সনাক্তকরণের জন্য একটি উপন্যাস ফেডারেটেড স্ট্রাকচার্ড স্পার্স PCA (FedSSP) পদ্ধতি প্রস্তাব করে। এই মডেলটি অনন্যভাবে দ্বৈত স্পার্সিটি নিয়মিতকরণ একীভূত করে: (1) ℓ₂,p নর্ম (p∈[0,1)) এর মাধ্যমে সারি স্পার্সিটি অপ্রয়োজনীয় বৈশিষ্ট্য মাত্রা দূর করতে; (2) ℓq নর্ম (q∈[0,1)) এর মাধ্যমে উপাদান স্পার্সিটি শব্দ-সংবেদনশীল উপাদান দমন করতে। বিতরণকৃত পরিবেশে এই অ-উত্তল সমস্যা সমাধানের জন্য, প্রক্সিমাল অল্টারনেটিং মিনিমাইজেশন (PAM) ভিত্তিক একটি দক্ষ অপ্টিমাইজেশন অ্যালগরিদম ডিজাইন করা হয়েছে। সংখ্যাসূচক পরীক্ষা-নিরীক্ষা যাচাই করে যে স্ট্রাকচার্ড স্পার্সিটির প্রবর্তন মডেল ব্যাখ্যাযোগ্যতা এবং সনাক্তকরণ নির্ভুলতা বৃদ্ধি করতে পারে।
IoT নেটওয়ার্কের দ্রুত উন্নয়ন নতুন নিরাপত্তা এবং গোপনীয়তা চ্যালেঞ্জ নিয়ে আসে, অসামান্যতা সনাক্তকরণ IoT নেটওয়ার্ক নিরাপত্তা নিশ্চিত করার জন্য একটি মূল প্রযুক্তি হয়ে ওঠে। প্রধান উপাদান বিশ্লেষণ (PCA) তার তত্ত্বাবধানহীন প্রকৃতি এবং কার্যকারিতার কারণে অসামান্যতা সনাক্তকরণে ব্যাপকভাবে প্রয়োগ করা হয়, এর মূল ধারণা হল অসামান্য নমুনাগুলি স্বাভাবিক আচরণ থেকে আলাদা, সাধারণত বৃহত্তর পুনর্নির্মাণ ত্রুটি রয়েছে।
বিতরণকৃত IoT নেটওয়ার্কে, ডেটা একাধিক স্থানীয় গেটওয়ে জুড়ে ছড়িয়ে থাকে, ঐতিহ্যবাহী কেন্দ্রীভূত PCA পদ্ধতি অব্যবহারিক। একই সাথে, IoT ডেটা নিম্নলিখিত বৈশিষ্ট্য প্রদর্শন করে:
ডেটা অপ্রয়োজনীয়তা: অসংখ্য অপ্রয়োজনীয় বৈশিষ্ট্য মাত্রা বিদ্যমান
শব্দ সংবেদনশীলতা: ডেটা গুরুতর শব্দ হস্তক্ষেপ দ্বারা প্রভাবিত
গোপনীয়তা সুরক্ষা প্রয়োজনীয়তা: ডেটা কেন্দ্রীয় সার্ভারে সরাসরি একত্রিত করা যায় না
ঐতিহ্যবাহী বিতরণকৃত PCA (সূত্র 1): সমস্ত ডেটা কেন্দ্রীয় সার্ভারে একত্রিত করার প্রয়োজন, গোপনীয়তা-সংবেদনশীল পরিস্থিতিতে প্রযোজ্য নয়
FedPG পদ্ধতি (সূত্র 2): যদিও ফেডারেটেড লার্নিং কাঠামো বাস্তবায়ন করে, তবে ডেটা স্পার্সিটি বিবেচনা করে না, যখন স্পার্সিটি অসামান্যতা সনাক্তকরণের জন্য গুরুত্বপূর্ণ
স্ট্রাকচার্ড স্পার্সিটির অভাব: বিদ্যমান পদ্ধতি সারি-স্তর এবং উপাদান-স্তরের স্পার্স কাঠামো একযোগে ক্যাপচার করতে ব্যর্থ
উপরোক্ত সীমাবদ্ধতার উপর ভিত্তি করে, এই পেপারটি একটি প্রাকৃতিক প্রশ্ন উত্থাপন করে: কি স্পার্সিটি ফেডারেটেড PCA কাঠামোতে একীভূত করা সম্ভব? এটি লেখকদের FedSSP মডেল ডিজাইন করতে প্রেরণা দেয়, দ্বৈত স্পার্সিটি নিয়মিতকরণের মাধ্যমে বৈশিষ্ট্য নির্বাচন এবং শব্দ দমন একযোগে অর্জন করে।
ফেডারেটেড স্ট্রাকচার্ড স্পার্স PCA কাঠামো প্রস্তাব: প্রথমবারের মতো দ্বৈত স্পার্সিটি নিয়মিতকরণ (সারি স্পার্সিটি এবং উপাদান স্পার্সিটি) ফেডারেটেড PCA-তে একীভূত করা, IoT নেটওয়ার্ক অসামান্যতা সনাক্তকরণের জন্য বিশেষভাবে ডিজাইন করা
দক্ষ অপ্টিমাইজেশন অ্যালগরিদম ডিজাইন: প্রক্সিমাল অল্টারনেটিং মিনিমাইজেশন (PAM) এবং Grassmann ম্যানিফোল্ডে সংযুক্ত গ্রেডিয়েন্ট পদ্ধতির উপর ভিত্তি করে, অ-উত্তল অপ্টিমাইজেশন সমস্যা কার্যকরভাবে সমাধান করে
বন্ধ-ফর্ম সমাধান এবং প্রক্সিমাল অপারেটর প্রদান: ℓq নর্ম এবং ℓ₂,p নর্ম উপ-সমস্যার জন্য, তাত্ত্বিক বিশ্লেষণাত্মক সমাধান প্রদান করা
পরীক্ষামূলক যাচাইকরণ: প্রকৃত IoT অনুপ্রবেশ সনাক্তকরণ ডেটাসেট (TON_IoT) এ পদ্ধতির কার্যকারিতা যাচাই করা, FedPG এর তুলনায় নির্ভুলতা, নির্ভুলতা এবং F1 স্কোরে যথাক্রমে 1.49%, 1.52% এবং 0.79% উন্নতি
ইনপুট: N টি স্থানীয় গেটওয়েতে বিতরণকৃত ডেটা ম্যাট্রিক্স {X₁, X₂, ..., Xₙ}, যেখানে Xₜ ∈ ℝ^(d×n)
আউটপুট: বৈশ্বিক প্রধান উপাদান ম্যাট্রিক্স W ∈ ℝ^(d×m) (বা Z), অর্থোগোনাল সীমাবদ্ধতা W^⊤W = I সন্তুষ্ট করে
উদ্দেশ্য: বৈশ্বিক পুনর্নির্মাণ ত্রুটি ন্যূনতম করা এবং একই সাথে স্ট্রাকচার্ড স্পার্সিটি অর্জন করা, অসামান্যতা সনাক্তকরণের জন্য
সারি স্পার্সিটি (ℓ₂,p নর্ম): স্বয়ংক্রিয়ভাবে গুরুত্বপূর্ণ বৈশিষ্ট্য মাত্রা নির্বাচন করে, অপ্রয়োজনীয় বৈশিষ্ট্য দূর করে, মডেল ব্যাখ্যাযোগ্যতা উন্নত করে
উপাদান স্পার্সিটি (ℓq নর্ম): শব্দ-সংবেদনশীল ছোট সহগ দমন করে, মডেল শক্তিশালীতা বৃদ্ধি করে
পরিপূরকতা: দুটি স্পার্সিটি বিভিন্ন স্তরে সহযোগিতামূলকভাবে কাজ করে, স্ট্রাকচার্ড স্পার্স প্যাটার্ন গঠন করে