Although federated learning has gained prominence as a privacy-preserving framework tailored for distributed Internet of Things (IoT) environments, current federated principal component analysis (PCA) methods lack integration of sparsity, a critical feature for robust anomaly detection. To address this limitation, we propose a novel federated structured sparse PCA (FedSSP) approach for anomaly detection in IoT networks. The proposed model uniquely integrates double sparsity regularization: (1) row-wise sparsity governed by $\ell_{2,p}$-norm with $p\in [0,1)$ to eliminate redundant feature dimensions, and (2) element-wise sparsity via $\ell_{q}$-norm with $q\in [0,1)$ to suppress noise-sensitive components. To solve this nonconvex problem in a distributed setting, we devise an efficient optimization algorithm based on the proximal alternating minimization (PAM). Numerical experiments validate that incorporating structured sparsity enhances both model interpretability and detection accuracy. Our code is available at https://github.com/xianchaoxiu/FedSSP.
논문 ID : 2503.23981제목 : Federated Structured Sparse PCA for Anomaly Detection in IoT Networks저자 : Chenyi Huang, Xianchao Xiu (상하이대학교 기계전자공학 및 자동화학부)분류 : cs.LG (기계학습), math.OC (최적화 및 제어)발표 시간 : 2025년 10월 28일 (arXiv v3)논문 링크 : https://arxiv.org/abs/2503.23981 코드 링크 : https://github.com/xianchaoxiu/FedSSP 연합학습은 분산형 사물인터넷(IoT) 환경에서 개인정보 보호 프레임워크로 광범위하게 적용되고 있으나, 기존의 연합 주성분분석(PCA) 방법은 희소성 통합이 부족하며, 희소성은 견고한 이상 탐지의 핵심 특성이다. 이러한 한계를 해결하기 위해 본 논문은 IoT 네트워크 이상 탐지를 위한 새로운 연합 구조화 희소 PCA(FedSSP) 방법을 제안한다. 본 모델은 독특하게 이중 희소 정규화를 통합한다: (1) ℓ₂,p 범수(p∈[0,1))를 통한 행 희소성으로 중복 특성 차원 제거; (2) ℓq 범수(q∈[0,1))를 통한 요소 희소성으로 노이즈 민감 성분 억제. 분산 환경에서 이 비볼록 문제를 해결하기 위해 근접 교대 최소화(PAM) 기반의 효율적인 최적화 알고리즘을 설계했다. 수치 실험은 구조화 희소성의 도입이 모델 해석 가능성과 탐지 정확도를 향상시킬 수 있음을 검증한다.
사물인터넷(IoT) 네트워크의 급속한 발전은 새로운 보안 및 개인정보 보호 문제를 야기하며, 이상 탐지는 IoT 네트워크 보안을 보장하는 핵심 기술이 된다. 주성분분석(PCA)은 비지도 특성과 효과성으로 인해 이상 탐지에 광범위하게 적용되며, 그 핵심 개념은 이상 샘플이 정상 행동과 다르며 일반적으로 더 큰 재구성 오류를 가진다는 것이다.
분산형 IoT 네트워크에서 데이터는 여러 로컬 게이트웨이에 분산되어 있으며, 기존의 중앙집중식 PCA 방법은 비현실적이다. 동시에 IoT 데이터는 다음과 같은 특성을 가진다:
데이터 중복성 : 대량의 중복 특성 차원 존재노이즈 민감성 : 데이터가 노이즈 간섭을 심하게 받음개인정보 보호 요구 : 데이터를 중앙 서버에 직접 집계할 수 없음전통적 분산 PCA (공식 1): 모든 데이터를 중앙 서버에 집계해야 하며, 개인정보 보호 민감 시나리오에 부적합FedPG 방법 (공식 2): 연합학습 프레임워크를 구현했으나 데이터 희소성을 고려하지 않았으며, 희소성은 이상 탐지에 매우 중요구조화 희소성 부재 : 기존 방법은 행 수준과 요소 수준의 희소 구조를 동시에 포착하지 못함위의 한계를 바탕으로 본 논문은 자연스러운 질문을 제기한다: 희소성을 연합 PCA 프레임워크에 통합할 수 있는가? 이는 저자들이 이중 희소 정규화를 통해 특성 선택과 노이즈 억제를 동시에 달성하는 FedSSP 모델을 설계하도록 촉발했다.
연합 구조화 희소 PCA 프레임워크 제안 : 이중 희소 정규화(행 희소성 및 요소 희소성)를 연합 PCA에 처음으로 통합하여 IoT 네트워크 이상 탐지에 특화효율적인 최적화 알고리즘 설계 : 근접 교대 최소화(PAM) 및 Grassmann 다양체 상의 켤레 기울기법을 기반으로 비볼록 최적화 문제를 효과적으로 해결폐쇄형 해 및 근접 연산자 제공 : ℓq 범수 및 ℓ₂,p 범수 부분 문제에 대해 이론적 해석 해 제시실험 검증 : 실제 IoT 침입 탐지 데이터셋(TON_IoT)에서 방법의 유효성을 검증하며, FedPG 대비 정확도, 정밀도 및 F1 점수에서 각각 1.49%, 1.52%, 0.79% 향상입력 : N개의 로컬 게이트웨이에 분산된 데이터 행렬 {X₁, X₂, ..., Xₙ}, 여기서 Xₜ ∈ ℝ^(d×n)
출력 : 전역 주성분 행렬 W ∈ ℝ^(d×m) (또는 Z), 정규직교 제약 W^⊤W = I 만족
목표 : 구조화 희소성을 달성하면서 전역 재구성 오류 최소화, 이상 탐지에 사용
min_W Σₜ₌₁ᴺ ‖(I - WW^⊤)Xₜ‖²_F + λ₁‖W‖²,p^p + λ₂‖W‖q^q
s.t. W^⊤W = I
여기서:
첫 번째 항 : 전역 재구성 오류, 데이터 압축 품질 측정두 번째 항 : ℓ₂,p 범수 정규화, ‖W‖²,p^p = Σᵢ₌₁^d ‖wᵢ‖₂^p, 행 희소성 구현(특성 선택)세 번째 항 : ℓq 범수 정규화, ‖W‖q^q = Σᵢ₌₁^d Σⱼ₌₁^m |wᵢⱼ|^q, 요소 희소성 구현(노이즈 억제)제약 : Grassmann 다양체 제약, 주성분의 정규직교성 보장전역 변수 Z와 로컬 변수 Wₜ을 도입하여 합의 최적화 구현:
min_{Wₜ,Z} Σₜ₌₁ᴺ {‖(I - WₜW^⊤ₜ)Xₜ‖²_F + λ₁‖Wₜ‖²,p^p + λ₂‖Wₜ‖q^q}
s.t. W^⊤ₜWₜ = I, ∀t ∈ [N]
Wₜ = Z, ∀t ∈ [N]
보조 변수 Uₜ과 Vₜ을 도입하여 희소 정규화를 주 변수에서 분리:
min Σₜ₌₁ᴺ {‖(I - WₜW^⊤ₜ)Xₜ‖²_F + λ₁‖Vₜ‖²,p^p + λ₂‖Uₜ‖q^q
+ Φ(Wₜ) + (β₁/2)‖Wₜ - Uₜ‖²_F + (β₂/2)‖Wₜ - Vₜ‖²_F
+ (β₃/2)‖Wₜ - Z‖²_F}
여기서 Φ(Wₜ)는 지시 함수이고, β₁, β₂, β₃는 페널티 매개변수이다.
행 희소성(ℓ₂,p 범수) : 중요한 특성 차원을 자동으로 선택하고 중복 특성을 제거하여 모델 해석 가능성 향상요소 희소성(ℓq 범수) : 노이즈 민감한 작은 계수를 억제하여 모델 견고성 강화상호 보완성 : 두 가지 희소성이 서로 다른 수준에서 협력하여 구조화 희소 패턴 형성Wₜ 부분 문제(공식 8)에 대해 Grassmann 다양체 Gr(d,m) 상에서 최적화:
Riemannian 기울기 : 유클리드 기울기를 접선 공간에 투영
grad g(Wₜ) = ∇g(Wₜ) - Wₜ sym(W^⊤ₜ∇g(Wₜ))
켤레 기울기법 : 벡터 전송 및 역추적 선 탐색 사용축소 사상 : RWk(tkξk)를 통해 Wₜ 업데이트, 정규직교 제약 유지Uₜ 부분 문제(공식 13-15)에 대해 ℓq 범수의 근접 연산자 활용:
Prox(a, λ) = {
0, if |a| < κ(λ,q)
{0, sgn(a)c(λ,q)}, if |a| = κ(λ,q)
sgn(a)ϖq(|a|), if |a| > κ(λ,q)
}
여기서:
c(λ,q) = (2λ(1-q))^(1/(2-q)) κ(λ,q) = (2-q)λ^(1/(2-q))(2(1-q))^((q+1)/(q-2)) ϖq(a) ∈ {x | x - a + λq sgn(x)x^(q-1) = 0, x > 0} 이는 소프트 임계값 처리의 일반화된 형태를 제공하여 적응형 희소화를 구현한다.
Vₜ 부분 문제에 대해 행 수준 분해 채택:
(vᵢ)^(k+1)ₜ = Prox(‖(bᵢ)^(k+1)ₜ‖, ρ) · (bᵢ)^(k+1)ₜ / ‖(bᵢ)^(k+1)ₜ‖
이는 전체 행이 선택되거나 0으로 설정되도록 보장하여 특성 수준의 선택을 구현한다.
Z의 업데이트는 폐쇄형 해를 가진다:
Z = (Σₜ₌₁ᴺ β₃W^(k+1)ₜ + τ₄Z^k) / (Nβ₃ + τ₄)
이는 모든 로컬 변수의 가중 평균으로 연합 집계를 구현한다.
주 루프 : PAM 프레임워크
Wₜ 업데이트 : Grassmann 다양체 상의 켤레 기울기법(알고리즘 2)Uₜ 업데이트 : 요소 수준 근접 연산자(공식 19)Vₜ 업데이트 : 행 수준 근접 연산자(공식 23)Z 업데이트 : 폐쇄형 해 집계(공식 25)수렴성 : Kurdyka-Łojasiewicz 부등식을 기반으로 PAM 알고리즘은 비볼록 문제에 대한 이론적 수렴 보장을 가진다.
TON_IoT 데이터셋 :
출처 : 뉴사우스웨일즈 대학교에서 개발한 IoT 네트워크 침입 탐지 데이터셋규모 :
훈련 집합: 114,956개의 정상 샘플 테스트 집합: 10,000개의 정상 샘플 + 56,557개의 이상 샘플 특성 : 49개의 수치 특성(z-점수 표준화)공격 유형 : 9가지 이상 범주(Injection, Password, DDoS, Backdoor, Scanning, DoS, Ransomware, XSS, MITM)데이터 분할 : 훈련 집합을 "dst bytes"로 20개의 비i.i.d. 부분집합으로 분할하여 실제 IoT 네트워크의 이질적 클라이언트 트래픽 모의정확도(Acc) : 올바르게 분류된 기록이 전체 기록에서 차지하는 비율정밀도(Pre) : 공격으로 예측된 기록 중 실제 공격인 비율재현율(Recall) : 실제 공격 중 올바르게 탐지된 비율거짓 음성률(FNR) : 실제 이상이 정상으로 잘못 분류된 비율F1 점수(F1) : 정밀도와 재현율의 조화 평균으로 모델 성능 균형FedPG : Grassmann 다양체 기반의 연합 PCA 방법, 희소성 제약 없음FedAE : 자동 인코더 기반의 연합 이상 탐지 방법, 신경망 사용하드웨어 환경 : Intel Xeon Platinum 8352V CPU, NVIDIA RTX 4090 GPU, 64GB RAM운영 체제 : Ubuntu 20.04.4 LTS하이퍼파라미터 : 그리드 탐색을 통해 λ₁, λ₂, p, q 최적화IDS 배포 : 로컬 IoT 장치가 게이트웨이에 연결되어 데이터를 수집하고 이상 탐지 수행지표 FedAE FedPG FedSSP 향상도(vs FedPG) Acc 84.97% 88.61% 90.10% +1.49% Pre 84.97% 90.56% 92.08% +1.52% Recall 100.00% 96.67% 96.67% 0% FNR 0.00% 3.33% 3.33% 0% F1 91.88% 93.52% 94.31% +0.79%
주요 발견 :
FedSSP는 모든 지표에서 FedPG와 동등하거나 우수 FedAE 대비 FedSSP는 정확도에서 5.13%, 정밀도에서 7.11% 향상 재현율과 FNR은 FedPG와 동일하며, 희소성이 주로 정밀도를 향상시킴을 시사 F1 점수의 향상은 전체 성능 균형이 더 나음을 나타냄 3개의 특성(duration, src_bytes, dst_bytes)을 선택하여 DoS 트래픽 기록 시각화:
원본 데이터(그림 1) : 정상 및 이상 샘플이 혼재FedPG 재구성(그림 2) : 정상과 이상을 구분할 수 있으나 경계가 모호FedSSP 재구성(그림 3) : 국소 이상 영역에서 더 나은 성능 , 경계가 더 명확이는 평가 지표의 개선과 일치하며 구조화 희소성의 유효성을 검증한다.
p와 q가 F1 점수에 미치는 영향 연구:
실험 설정 : p, q ∈ {0, 1/2, 2/3}주요 발견 :
q=0일 때 성능 최적(더 강한 요소 희소성) 모든 구성의 F1 점수 ≥ 93.77%, FedPG의 93.52%보다 모두 높음 최소 향상도 0.25%, 이중 희소성의 견고성 증명 논문이 명시적으로 제거 실험을 나열하지는 않았으나, 매개변수 분석이 실제로 다음을 검증한다:
행 희소성(ℓ₂,p) : 서로 다른 p 값이 모두 성능 향상 가져옴요소 희소성(ℓq) : q=0일 때 효과 최적이중 정규화의 필요성 : 모든 구성이 희소성 없는 FedPG보다 우수전통적 방법: 통계 기반 이상 탐지 심층학습 방법: 자동 인코더(FedAE), 심층 신경망 본 논문 위치 : 비지도, 해석 가능한 PCA 방법개인정보 보호 프레임워크: 데이터 중앙 집계 회피 분산 최적화: 합의 알고리즘, ADMM 본 논문 기여 : 연합학습과 구조화 희소 PCA 결합ℓ₁ 정규화: 볼록 최적화이나 편향 큼 ℓp 정규화(p<1): 비볼록이나 희소성 더 나음 본 논문 혁신 : 이중 희소 정규화(행+요소)Grassmann 다양체: 정규직교 제약의 자연스러운 표현 Riemannian 최적화: 켤레 기울기법, 신뢰 영역법 본 논문 적용 : 연합 희소 PCA에서 처음으로 체계적 적용방법 유효성 : FedSSP가 TON_IoT 데이터셋에서 FedPG 및 FedAE보다 우수희소성의 가치 : 이중 희소 정규화가 해석 가능성과 탐지 정확도를 동시에 향상최적화 알고리즘의 효율성 : PAM + Grassmann 다양체 최적화가 비볼록 문제를 효과적으로 해결실용성 : 분산형 IoT 네트워크의 개인정보 보호 이상 탐지에 적용 가능계산 복잡도 : Grassmann 다양체 최적화가 단순 유클리드 최적화보다 더 시간 소요하이퍼파라미터 민감성 : λ₁, λ₂, p, q, β₁, β₂, β₃ 등 다수의 매개변수 조정 필요비볼록성 : 임계점으로의 수렴만 보장, 전역 최적성 보장 안 함단일 데이터셋 : TON_IoT 데이터셋에서만 검증, 더 많은 데이터셋 실험 부족통신 비용 : 논문이 연합학습의 통신 오버헤드를 논의하지 않음논문이 명시적으로 제시한 두 가지 방향:
더 효율적인 최적화 전략 : 다양체 최적화의 계산 비용 감소대조 학습과의 결합 : 대조 학습을 활용하여 이상 탐지 능력 강화이중 희소성 처음 통합 : 행 희소성 + 요소 희소성의 조합이 연합 PCA에서 새로움이론적 완전성 : 근접 연산자의 폐쇄형 해(보조정리 2.1) 및 수렴성 보장 제공실용성 강함 : IoT 네트워크의 실제 요구에 맞게 설계수학적 추론 엄밀 : 문제 모델링에서 최적화 알고리즘까지 추론 완전알고리즘 설계 합리 : PAM 프레임워크 + 다양체 최적화의 결합이 자연스러움근접 연산자 혁신 : ℓq 범수 근접 연산자의 3단계 해가 이론적 기여실제 데이터셋 : 공인된 TON_IoT 데이터셋 사용비교 방법 합리 : 희소성 없는 FedPG와 신경망 기반 FedAE 포함매개변수 분석 상세 : p와 q의 영향 연구부족점 : 데이터셋 단일, 제거 실험 불충분, 통신 비용 미보고일관된 향상 : 여러 지표에서 baseline보다 우수시각화 직관적 : 그림 4가 재구성 효과 개선을 명확히 보여줌견고성 검증 : 매개변수 분석이 다양한 구성에서 방법의 유효성 보여줌부족점 : 향상도 작음(1-2%), 통계적 유의성 미보고구조 명확 : 문제에서 방법에서 실험으로의 논리 연결 명확기호 규범 : 수학 기호 사용 일관성 있음알고리즘 설명 상세 : 두 알고리즘 프레임이 완전부족점 : 일부 기술 세부사항(수렴성 증명 등) 미전개단일 데이터셋 : TON_IoT에서만 검증, 일반화 가능성 미지수대규모 실험 부재 : 더 많은 클라이언트(N>20)에서의 성능 미테스트통신 비용 분석 없음 : 연합학습의 핵심 지표 누락시간 복잡도 분석 부재 : 알고리즘 실행 시간 미보고하이퍼파라미터 많음 : 7개 하이퍼파라미터(λ₁, λ₂, p, q, β₁, β₂, β₃) 조정 어려움비볼록 최적화 : 전역 최적성 보장 안 함, 초기화에 민감계산 비용 높음 : Grassmann 다양체 최적화가 유클리드 최적화보다 비쌈심층학습 방법 부재 : 최신 심층 이상 탐지 방법과 비교 없음다른 희소 방법 부재 : ℓ₁ 정규화 PCA 등FedAE 구현 불명확 : 논문이 "로컬 기록만 사용하여 훈련"이라 하는데 이는 표준 연합학습이 아님수렴 속도 : 알고리즘의 수렴 속도 분석 없음샘플 복잡도 : 효과적인 탐지에 필요한 샘플 수 논의 없음개인정보 보호 보장 : 형식적 개인정보 보호 분석(예: 차분 개인정보 보호) 없음이론적 가치 : 이중 희소 정규화 설계가 영감을 줌방법론 기여 : PAM + 다양체 최적화 조합이 다른 문제로 확장 가능인용 잠재력 : 연합 희소 PCA의 첫 번째 작업으로 높은 인용 가치적용 시나리오 명확 : IoT 네트워크 이상 탐지재현성 좋음 : 코드 오픈소스배포 과제 : 하이퍼파라미터 조정 및 계산 비용이 실제 적용을 제한할 수 있음공백 채움 : 연합학습 + 희소 PCA 결합이 새로운 방향후속 연구 영감 : 더 많은 연합 희소 학습 연구 촉발 가능학제간 가치 : 방법이 다른 분산 학습 시나리오로 확장 가능분산형 IoT 네트워크 : 데이터가 여러 게이트웨이에 분산, 개인정보 보호 민감고차원 희소 데이터 : 특성 차원 높으나 유효 특성 적음비지도 이상 탐지 : 표지된 데이터 부족해석 가능성 요구 높음 : 어떤 특성이 중요한지 이해 필요소규모 데이터 : 희소성이 과적합 야기 가능저차원 데이터 : 희소 정규화의 장점 불명확실시간 탐지 : Grassmann 다양체 최적화가 느릴 수 있음극단적 비i.i.d. : 데이터 분포 이질성에 대한 방법의 견고성 미충분 검증12 Nguyen et al. (2024) : FedPG 방법, 본 논문의 주요 기준선20 Attouch et al. (2010) : PAM 알고리즘의 이론적 기초22 Absil et al. (2009) : Grassmann 다양체 최적화의 고전 교과서23 Zhou et al. (2023) : ℓq 범수 정규화의 이론 분석25 Booij et al. (2021) : TON_IoT 데이터셋의 원본 논문차원 평점 설명 혁신성 9/10 이중 희소 정규화를 연합 PCA에 처음 적용 기술 깊이 8/10 이론 추론 엄밀, 알고리즘 설계 합리 실험 충분성 6/10 데이터셋 단일, 대규모 검증 부족 실용적 가치 7/10 IoT 시나리오에 적합하나 배포에 과제 있음 작성 품질 8/10 구조 명확, 표현 정확 종합 7.6/10 우수한 이론 작업, 실험 추가 강화 가능
권장 독자 : 연합학습 연구자, 희소 최적화 학자, IoT 보안 종사자, 다양체 최적화 애호가