2025-11-13T21:49:11.069891

SAP: Corrective Machine Unlearning with Scaled Activation Projection for Label Noise Robustness

Kodge, Ravikumar, Saha et al.

Label corruption, where training samples are mislabeled due to non-expert annotation or adversarial attacks, significantly degrades model performance. Acquiring large, perfectly labeled datasets is costly, and retraining models from scratch is computationally expensive. To address this, we introduce Scaled Activation Projection (SAP), a novel SVD (Singular Value Decomposition)-based corrective machine unlearning algorithm. SAP mitigates label noise by identifying a small subset of trusted samples using cross-entropy loss and projecting model weights onto a clean activation space estimated using SVD on these trusted samples. This process suppresses the noise introduced in activations due to the mislabeled samples. In our experiments, we demonstrate SAP's effectiveness on synthetic noise with different settings and real-world label noise. SAP applied to the CIFAR dataset with 25% synthetic corruption show upto 6% generalization improvements. Additionally, SAP can improve the generalization over noise robust training approaches on CIFAR dataset by ~3.2% on average. Further, we observe generalization improvements of 2.31% for a Vision Transformer model trained on naturally corrupted Clothing1M.

academic

SAP: 레이블 노이즈 강건성을 위한 스케일된 활성화 투영을 이용한 수정적 기계 언러닝

기본 정보

논문 ID: 2403.08618
제목: SAP: Corrective Machine Unlearning with Scaled Activation Projection for Label Noise Robustness
저자: Sangamesh Kodge, Deepak Ravikumar, Gobinda Saha, Kaushik Roy (Purdue University)
분류: cs.LG cs.AI stat.ML
발표 시간: 2025년 1월 2일 (arXiv v2)
논문 링크: https://arxiv.org/abs/2403.08618
코드 링크: https://github.com/sangamesh-kodge/SAP.git

초록

레이블 손상은 심층 학습에서 중요한 문제로, 비전문가 주석 또는 적대적 공격으로 인한 훈련 샘플의 잘못된 표시는 모델 성능을 크게 저하시킵니다. 대규모 완벽하게 표시된 데이터셋 획득 비용이 높고, 처음부터 모델을 재훈련하는 계산 오버헤드가 큽니다. 이를 해결하기 위해 본 논문은 특이값 분해(SVD) 기반의 수정적 기계 언러닝 알고리즘인 스케일된 활성화 투영(SAP)을 제안합니다. SAP는 교차 엔트로피 손실을 사용하여 소수의 신뢰할 수 있는 샘플을 식별하고, 이러한 신뢰할 수 있는 샘플을 사용하여 SVD로 추정한 깨끗한 활성화 공간에 모델 가중치를 투영하여 레이블 노이즈를 완화합니다. 실험 결과, SAP는 CIFAR 데이터셋에서 25% 합성 손상 시 최대 6%의 일반화 개선을 달성하고, 노이즈 강건 훈련 방법 기반에서 평균 약 3.2% 향상되며, 자연 손상된 Clothing1M 데이터셋의 Vision Transformer 모델에서 2.31%의 일반화 개선을 달성합니다.

연구 배경 및 동기

문제 정의

레이블 노이즈 문제: 대규모 데이터셋에 광범위하게 존재하는 레이블 오류로, 다음에서 비롯될 수 있습니다:
- 인간 주석 오류
- 자동 주석 시스템(예: 대규모 언어 모델)의 오류
- 악의적 데이터 중독 공격
기존 해결책의 한계:
- 데이터 정제 방법: 모델 재훈련 필요로 계산 비용 높음
- 노이즈 강건 훈련: 강건성 향상 가능하지만 성능 격차 완전히 제거 불가
- 전통적 기계 언러닝: 오류 표시와 어려운 학습 샘플 명확히 구분 필요로 실제 적용 어려움
연구 동기:
- 처음부터 재훈련하는 높은 계산 비용 회피
- 오류 표시 샘플 명시적 식별 불필요
- 단일 가중치 업데이트를 통한 효율적 노이즈 완화

핵심 기여

SAP 알고리즘 제안: SVD 기반 수정적 기계 언러닝 알고리즘으로 활성화 투영을 통해 레이블 노이즈 영향 완화
자동화된 신뢰할 수 있는 샘플 선택: 교차 엔트로피 손실을 사용하여 신뢰할 수 있는 샘플 자동 식별로 인간 주석 회피
단일 단계 가중치 업데이트: 단일 SVD 계산 및 가중치 투영을 통한 효율적 모델 수정
광범위한 실험 검증: 합성 노이즈 및 실제 노이즈 시나리오에서 유효성 검증으로 다양한 모델 아키텍처 지원

방법 상세 설명

작업 정의

레이블 노이즈가 포함된 훈련 데이터셋 $D_{Tr}$ 이 주어졌을 때, 목표는 훈련된 모델 매개변수 $θ^*$ 를 수정하여 테스트 셋에서의 일반화 성능이 깨끗한 데이터에서 훈련한 모델과 유사하도록 하되, 재훈련 없이 달성하는 것입니다.

모델 아키텍처

1. 가중치 업데이트 메커니즘

선형 계층 $a_{out} = a_{in}W^T$ 에 대해, SAP는 활성화 정렬 행렬 $W_p$ 를 통해 입력 활성화를 투영합니다:

$\hat{a}_{out} = (a_{in}W_p)W^T = a_{in}(WW_p^T)^T = a_{in}\hat{W}^T$

가중치 업데이트 규칙: $\hat{W} = WW_p^T$

2. 신뢰할 수 있는 데이터 추정

교차 엔트로피 손실을 사용하여 손실이 가장 낮은 $N_{Trust}$ 개 샘플을 신뢰할 수 있는 집합으로 선택합니다:

$D_{Trust} = \arg\min_S \sum_{(x_i,y_i) \in S} L(θ^*, x_i, y_i)$

여기서 $S = \{S_i \subseteq D_{Tr} | |S_i| = N_{Trust}\}$

3. 표현 행렬 구성

선형 계층: $R_{linear} = [(a_i^{in})_{i=1}^{N_{Trust}}]$
합성곱 계층: unfold 연산을 통해 합성곱을 행렬 곱셈으로 변환, $R_{conv} = [(unfold(a_i^{in})^T)_{i=1}^{N_{Trust}}]$

4. SVD 분해 및 중요도 스케일링

표현 행렬에 대해 SVD 분해를 수행합니다: $R^l = U^l Σ^l V^{lT}$

중요도 가중치를 계산합니다: $λ_i = \frac{α\tilde{σ}_i}{(α-1)\tilde{σ}_i + 1}$

여기서 $\tilde{σ}_i = σ_i^2 / \sum_{j=1}^d σ_j^2$ 는 정규화된 특이값이고, $α$ 는 스케일링 계수입니다.

5. 활성화 정렬 행렬

투영 행렬을 구성합니다: $W_p = UΛU^T$ , 여기서 $Λ = diag(λ_1, λ_2, ..., λ_d)$

기술적 혁신점

자동화 처리: 오류 샘플 수동 식별 불필요로 손실 함수를 통해 신뢰할 수 있는 샘플 자동 선택
효율적 업데이트: 단일 SVD 계산 및 행렬 곱셈으로 가중치 업데이트 완료로 반복적 최적화 회피
활성화 공간 투영: 깨끗한 활성화 공간으로의 투영을 통해 노이즈 활성화의 영향 억제
아키텍처 무관성: 선형 계층 및 합성곱 계층에 적용 가능으로 다양한 네트워크 아키텍처 지원

실험 설정

데이터셋

합성 노이즈 데이터셋:
- CIFAR-10/CIFAR-100
- 세 가지 노이즈 유형: 대칭 노이즈, 비대칭 노이즈, 계층적 노이즈
- 노이즈 강도: 10% 및 25%
실제 노이즈 데이터셋:
- Mini-WebVision
- Clothing1M

평가 지표

테스트 셋 정확도
기준 방법과의 성능 비교
일반화 개선 폭

비교 방법

Retrain: 깨끗한 데이터에서 재훈련한 이상적 모델
Vanilla: 노이즈 데이터에서 훈련한 기본 모델
Finetune: 소량의 깨끗한 데이터에서 미세 조정
SSD: 선택적 시냅스 억제 기반 언러닝 알고리즘
SCRUB: 최첨단 기계 언러닝 알고리즘

구현 세부사항

신뢰할 수 있는 샘플 수: 1000개
스케일링 계수 α의 검색 범위: 2000, 300000
모델 아키텍처: VGG11, ResNet18, ResNet50, ViT-B/16
최적화기: SGD, 학습률 0.01, 가중치 감소 5×10^-4

실험 결과

주요 결과

합성 노이즈 실험

CIFAR-10 및 CIFAR-100 데이터셋에서의 결과:

데이터셋	노이즈 강도	Vanilla	SAP	개선 폭
CIFAR-10	25%	76.68±0.48	82.27±0.15	+5.59%
CIFAR-100	25%	50.64±0.60	53.31±0.78	+2.67%

SAP는 모든 노이즈 설정에서 다른 언러닝 방법을 능가하며 평균 1.36%(CIFAR-10) 및 0.39%(CIFAR-100) 개선을 달성합니다.

노이즈 강건 훈련 강화

SAP는 기존 노이즈 강건 방법의 성능을 추가로 향상시킬 수 있습니다:

방법	CIFAR-10 기준	SAP 강화	개선 폭
MixUp	83.12±0.44	86.45±0.52	+3.33%
SAM	83.29±0.28	87.29±0.08	+4.0%
평균	83.69	87.14	+3.45%

실제 노이즈

실제 노이즈 데이터셋에서의 결과:

데이터셋	모델	Vanilla	SAP	개선 폭
Clothing1M	ResNet50	67.48±0.64	69.64±0.57	+2.16%
Clothing1M	ViT-B/16	69.12±0.45	71.43±0.60	+2.31%

제거 실험

신뢰할 수 있는 샘플 수의 영향

실험 결과 신뢰할 수 있는 샘플 수를 1000개로 증가시킨 후 이득이 감소하므로, 성능과 계산 효율의 균형을 위해 1000개 샘플을 선택합니다.

스케일링 계수 α의 영향

α=30000은 다양한 합성 노이즈 설정에서 최고 성능을 보이며, 과도하게 크거나 작은 α 값은 성능을 저하시킵니다.

실험 발견

계산 효율성: SAP는 16회 하이퍼파라미터 검색만 필요한 반면 SCRUB는 675회 필요
강건성: 다양한 노이즈 유형 및 강도에서 안정적 성능 발휘
확장성: 대규모 데이터셋 및 Transformer 모델에 성공적 적용
결정 경계 최적화: 시각화 실험은 SAP가 결정 경계를 평활화하여 과적합 감소를 보여줍니다

결론 및 논의

주요 결론

유효성 검증: SAP는 합성 및 실제 노이즈 시나리오에서 모델 일반화 성능을 크게 향상시킵니다
효율성 장점: 단일 가중치 업데이트 및 간단한 하이퍼파라미터 조정으로 SAP는 현저한 계산 이점을 제공합니다
광범위한 적용성: 다양한 네트워크 아키텍처 및 데이터셋 규모 지원
실용적 가치: 기존 노이즈 강건 방법과 결합하여 성능을 추가로 향상시킬 수 있습니다

한계

신뢰할 수 있는 샘플 가정: 낮은 손실 샘플이 실제로 올바르게 표시되었다는 가정에 의존
하이퍼파라미터 민감성: 스케일링 계수 α의 선택이 성능에 중요한 영향을 미칩니다
노이즈 유형 제한: 주로 레이블 노이즈를 대상으로 하며 다른 유형의 노이즈 처리 능력 제한
이론적 분석 부족: 방법 유효성에 대한 이론적 보장 부재

향후 방향

이론적 분석: SAP 유효성의 이론적 기초 구축
적응형 매개변수 선택: 최적 α를 자동으로 선택하는 방법 개발
확장 적용: 다른 유형의 노이즈 및 작업에서의 적용 탐색
다른 기술과의 결합: 데이터 증강, 적대적 훈련 등 기술과의 결합 연구

심층 평가

장점

방법의 혁신성:
- SVD를 수정적 기계 언러닝에 처음 적용
- 활성화 투영 개념이 새롭고 효과적
- 자동화된 신뢰할 수 있는 샘플 선택으로 인간 개입 회피
실험의 충분성:
- 다양한 노이즈 유형 및 데이터셋 포함
- 여러 기준 방법과의 비교
- 제거 실험 및 매개변수 민감도 분석 포함
실용적 가치:
- 높은 계산 효율로 배포 용이
- 기존 방법과 결합 가능
- 다양한 네트워크 아키텍처 지원
결과의 설득력:
- 일관된 성능 향상
- 통계적 유의성 검증
- 시각화 분석으로 이해도 향상

부족한 점

이론적 기초 약함:
- 방법 유효성에 대한 이론적 분석 부재
- SVD 투영이 노이즈를 효과적으로 억제하는 이유 미설명
가정의 제한:
- 낮은 손실 샘플이 올바르게 표시되었다는 가정이 항상 성립하지 않을 수 있음
- 노이즈 분포에 대한 가정이 강함
매개변수 조정:
- α 선택에 대한 이론적 지침 부재
- 다양한 데이터셋에서 다른 α 값 필요 가능
비교의 제한:
- 최신 노이즈 강건 방법과의 비교 부족
- 데이터 정제 방법과의 직접 비교 부재

영향력

학술적 기여:
- 기계 언러닝 분야에 새로운 연구 방향 제공
- 활성화 투영 개념이 다른 응용을 영감할 수 있음
실제 적용:
- 실제 레이블 노이즈 처리를 위한 실용적 도구 제공
- 기존 훈련 프로세스에 통합 가능
재현성:
- 완전한 코드 구현 제공
- 상세한 실험 설정 설명

적용 시나리오

데이터셋 레이블 품질이 낮은 시나리오
데이터 재주석이 불가능한 경우
훈련된 모델의 빠른 수정이 필요한 응용
계산 자원이 제한된 환경

참고문헌

논문은 관련 분야의 중요한 연구를 인용하고 있으며, 다음을 포함합니다:

기계 언러닝: SCRUB, SSD 등 방법
레이블 노이즈 처리: MixUp, MentorMix, SAM 등
데이터 정제: Confident Learning 등
기초 이론: SVD 분해, 활성화 분석 등

종합 평가: 본 논문에서 제안한 SAP 방법은 레이블 노이즈 처리 분야에서 중요한 가치를 가지며, 정교한 활성화 투영 설계를 통해 효율적인 모델 수정을 구현합니다. 이론적 분석 측면에서는 부족하지만, 실험 검증이 충분하고 실용적 가치가 현저하여 관련 분야에 가치 있는 기여를 제공합니다.