Federated Structured Sparse PCA for Anomaly Detection in IoT Networks
Huang, Xiu
Although federated learning has gained prominence as a privacy-preserving framework tailored for distributed Internet of Things (IoT) environments, current federated principal component analysis (PCA) methods lack integration of sparsity, a critical feature for robust anomaly detection. To address this limitation, we propose a novel federated structured sparse PCA (FedSSP) approach for anomaly detection in IoT networks. The proposed model uniquely integrates double sparsity regularization: (1) row-wise sparsity governed by $\ell_{2,p}$-norm with $p\in [0,1)$ to eliminate redundant feature dimensions, and (2) element-wise sparsity via $\ell_{q}$-norm with $q\in [0,1)$ to suppress noise-sensitive components. To solve this nonconvex problem in a distributed setting, we devise an efficient optimization algorithm based on the proximal alternating minimization (PAM). Numerical experiments validate that incorporating structured sparsity enhances both model interpretability and detection accuracy. Our code is available at https://github.com/xianchaoxiu/FedSSP.
academic
Федеративный структурированный разреженный PCA для обнаружения аномалий в сетях IoT
Федеративное обучение широко применяется как структура защиты конфиденциальности в распределённых средах Интернета вещей (IoT), однако существующие методы федеративного анализа главных компонент (PCA) не включают разреженность, которая является ключевой характеристикой для надёжного обнаружения аномалий. Для решения этого ограничения в статье предлагается новый метод федеративного структурированного разреженного PCA (FedSSP) для обнаружения аномалий в сетях IoT. Модель уникально интегрирует двойную разреженную регуляризацию: (1) разреженность строк через норму ℓ₂,p (p∈[0,1)) для исключения избыточных измерений признаков; (2) разреженность элементов через норму ℓq (q∈[0,1)) для подавления компонент, чувствительных к шуму. Для решения этой невыпуклой задачи в распределённой среде разработан эффективный алгоритм оптимизации на основе проксимального чередующегося минимизирования (PAM). Численные эксперименты подтверждают, что введение структурированной разреженности повышает интерпретируемость модели и точность обнаружения.
Быстрое развитие сетей IoT создаёт новые вызовы безопасности и конфиденциальности, при этом обнаружение аномалий становится ключевой технологией для обеспечения безопасности сетей IoT. Анализ главных компонент (PCA) широко применяется для обнаружения аномалий благодаря своему неконтролируемому характеру и эффективности. Его основная идея заключается в том, что аномальные образцы отличаются от нормального поведения и обычно имеют большую ошибку реконструкции.
В распределённых сетях IoT данные рассредоточены по нескольким локальным шлюзам, что делает традиционные централизованные методы PCA непрактичными. Одновременно данные IoT имеют следующие характеристики:
Избыточность данных: наличие большого количества избыточных измерений признаков
Чувствительность к шуму: данные сильно подвержены воздействию шума
Требования защиты конфиденциальности: данные не могут быть напрямую агрегированы на центральный сервер
Традиционный распределённый PCA (формула 1): требует агрегирования всех данных на центральный сервер, неприменим в сценариях, чувствительных к конфиденциальности
Метод FedPG (формула 2): хотя реализует структуру федеративного обучения, не учитывает разреженность данных, которая критична для обнаружения аномалий
Отсутствие структурированной разреженности: существующие методы не могут одновременно захватить разреженные структуры на уровне строк и элементов
На основе вышеуказанных ограничений авторы ставят естественный вопрос: можно ли интегрировать разреженность в структуру федеративного PCA? Это побудило авторов разработать модель FedSSP, которая посредством двойной разреженной регуляризации одновременно реализует выбор признаков и подавление шума.
Предложена структура федеративного структурированного разреженного PCA: впервые интегрирована двойная разреженная регуляризация (разреженность строк и элементов) в федеративный PCA, специально разработанная для обнаружения аномалий в сетях IoT
Разработан эффективный алгоритм оптимизации: на основе проксимального чередующегося минимизирования (PAM) и метода сопряжённых градиентов на многообразии Грассмана эффективно решает невыпуклую задачу оптимизации
Предоставлены замкнутые решения и проксимальные операторы: для подзадач с нормой ℓq и нормой ℓ₂,p даны теоретические аналитические решения
Экспериментальная верификация: на реальном наборе данных обнаружения вторжений в IoT (TON_IoT) подтверждена эффективность метода, с улучшением точности, полноты и F1-оценки на 1,49%, 1,52% и 0,79% соответственно по сравнению с FedPG
Входные данные: матрицы данных {X₁, X₂, ..., Xₙ}, распределённые по N локальным шлюзам, где Xₜ ∈ ℝ^(d×n)
Выходные данные: глобальная матрица главных компонент W ∈ ℝ^(d×m) (или Z), удовлетворяющая ортогональному ограничению W^⊤W = I
Цель: минимизировать глобальную ошибку реконструкции при достижении структурированной разреженности для обнаружения аномалий
Первое применение двойной разреженной регуляризации в федеративном PCA
Техническая глубина
8/10
Строгие математические выводы, разумное проектирование алгоритма
Полнота экспериментов
6/10
Единственный набор данных, отсутствие крупномасштабной верификации
Практическая ценность
7/10
Применима к сценариям IoT, но есть вызовы развёртывания
Качество изложения
8/10
Чёткая структура, точное выражение
Итого
7,6/10
Отличная теоретическая работа, экспериментальная часть может быть усилена
Рекомендуемая аудитория: исследователи федеративного обучения, учёные в области разреженной оптимизации, специалисты по безопасности IoT, энтузиасты оптимизации на многообразиях