Label corruption, where training samples are mislabeled due to non-expert annotation or adversarial attacks, significantly degrades model performance. Acquiring large, perfectly labeled datasets is costly, and retraining models from scratch is computationally expensive. To address this, we introduce Scaled Activation Projection (SAP), a novel SVD (Singular Value Decomposition)-based corrective machine unlearning algorithm. SAP mitigates label noise by identifying a small subset of trusted samples using cross-entropy loss and projecting model weights onto a clean activation space estimated using SVD on these trusted samples. This process suppresses the noise introduced in activations due to the mislabeled samples. In our experiments, we demonstrate SAP's effectiveness on synthetic noise with different settings and real-world label noise. SAP applied to the CIFAR dataset with 25% synthetic corruption show upto 6% generalization improvements. Additionally, SAP can improve the generalization over noise robust training approaches on CIFAR dataset by ~3.2% on average. Further, we observe generalization improvements of 2.31% for a Vision Transformer model trained on naturally corrupted Clothing1M.
- 논문 ID: 2403.08618
- 제목: SAP: Corrective Machine Unlearning with Scaled Activation Projection for Label Noise Robustness
- 저자: Sangamesh Kodge, Deepak Ravikumar, Gobinda Saha, Kaushik Roy (Purdue University)
- 분류: cs.LG cs.AI stat.ML
- 발표 시간: 2025년 1월 2일 (arXiv v2)
- 논문 링크: https://arxiv.org/abs/2403.08618
- 코드 링크: https://github.com/sangamesh-kodge/SAP.git
레이블 손상은 심층 학습에서 중요한 문제로, 비전문가 주석 또는 적대적 공격으로 인한 훈련 샘플의 잘못된 표시는 모델 성능을 크게 저하시킵니다. 대규모 완벽하게 표시된 데이터셋 획득 비용이 높고, 처음부터 모델을 재훈련하는 계산 오버헤드가 큽니다. 이를 해결하기 위해 본 논문은 특이값 분해(SVD) 기반의 수정적 기계 언러닝 알고리즘인 스케일된 활성화 투영(SAP)을 제안합니다. SAP는 교차 엔트로피 손실을 사용하여 소수의 신뢰할 수 있는 샘플을 식별하고, 이러한 신뢰할 수 있는 샘플을 사용하여 SVD로 추정한 깨끗한 활성화 공간에 모델 가중치를 투영하여 레이블 노이즈를 완화합니다. 실험 결과, SAP는 CIFAR 데이터셋에서 25% 합성 손상 시 최대 6%의 일반화 개선을 달성하고, 노이즈 강건 훈련 방법 기반에서 평균 약 3.2% 향상되며, 자연 손상된 Clothing1M 데이터셋의 Vision Transformer 모델에서 2.31%의 일반화 개선을 달성합니다.
- 레이블 노이즈 문제: 대규모 데이터셋에 광범위하게 존재하는 레이블 오류로, 다음에서 비롯될 수 있습니다:
- 인간 주석 오류
- 자동 주석 시스템(예: 대규모 언어 모델)의 오류
- 악의적 데이터 중독 공격
- 기존 해결책의 한계:
- 데이터 정제 방법: 모델 재훈련 필요로 계산 비용 높음
- 노이즈 강건 훈련: 강건성 향상 가능하지만 성능 격차 완전히 제거 불가
- 전통적 기계 언러닝: 오류 표시와 어려운 학습 샘플 명확히 구분 필요로 실제 적용 어려움
- 연구 동기:
- 처음부터 재훈련하는 높은 계산 비용 회피
- 오류 표시 샘플 명시적 식별 불필요
- 단일 가중치 업데이트를 통한 효율적 노이즈 완화
- SAP 알고리즘 제안: SVD 기반 수정적 기계 언러닝 알고리즘으로 활성화 투영을 통해 레이블 노이즈 영향 완화
- 자동화된 신뢰할 수 있는 샘플 선택: 교차 엔트로피 손실을 사용하여 신뢰할 수 있는 샘플 자동 식별로 인간 주석 회피
- 단일 단계 가중치 업데이트: 단일 SVD 계산 및 가중치 투영을 통한 효율적 모델 수정
- 광범위한 실험 검증: 합성 노이즈 및 실제 노이즈 시나리오에서 유효성 검증으로 다양한 모델 아키텍처 지원
레이블 노이즈가 포함된 훈련 데이터셋 DTr이 주어졌을 때, 목표는 훈련된 모델 매개변수 θ∗를 수정하여 테스트 셋에서의 일반화 성능이 깨끗한 데이터에서 훈련한 모델과 유사하도록 하되, 재훈련 없이 달성하는 것입니다.
선형 계층 aout=ainWT에 대해, SAP는 활성화 정렬 행렬 Wp를 통해 입력 활성화를 투영합니다:
a^out=(ainWp)WT=ain(WWpT)T=ainW^T
가중치 업데이트 규칙: W^=WWpT
교차 엔트로피 손실을 사용하여 손실이 가장 낮은 NTrust개 샘플을 신뢰할 수 있는 집합으로 선택합니다:
DTrust=argminS∑(xi,yi)∈SL(θ∗,xi,yi)
여기서 S={Si⊆DTr∣∣Si∣=NTrust}
- 선형 계층: Rlinear=[(aiin)i=1NTrust]
- 합성곱 계층: unfold 연산을 통해 합성곱을 행렬 곱셈으로 변환, Rconv=[(unfold(aiin)T)i=1NTrust]
표현 행렬에 대해 SVD 분해를 수행합니다: Rl=UlΣlVlT
중요도 가중치를 계산합니다:
λi=(α−1)σ~i+1ασ~i
여기서 σ~i=σi2/∑j=1dσj2는 정규화된 특이값이고, α는 스케일링 계수입니다.
투영 행렬을 구성합니다: Wp=UΛUT, 여기서 Λ=diag(λ1,λ2,...,λd)
- 자동화 처리: 오류 샘플 수동 식별 불필요로 손실 함수를 통해 신뢰할 수 있는 샘플 자동 선택
- 효율적 업데이트: 단일 SVD 계산 및 행렬 곱셈으로 가중치 업데이트 완료로 반복적 최적화 회피
- 활성화 공간 투영: 깨끗한 활성화 공간으로의 투영을 통해 노이즈 활성화의 영향 억제
- 아키텍처 무관성: 선형 계층 및 합성곱 계층에 적용 가능으로 다양한 네트워크 아키텍처 지원
- 합성 노이즈 데이터셋:
- CIFAR-10/CIFAR-100
- 세 가지 노이즈 유형: 대칭 노이즈, 비대칭 노이즈, 계층적 노이즈
- 노이즈 강도: 10% 및 25%
- 실제 노이즈 데이터셋:
- 테스트 셋 정확도
- 기준 방법과의 성능 비교
- 일반화 개선 폭
- Retrain: 깨끗한 데이터에서 재훈련한 이상적 모델
- Vanilla: 노이즈 데이터에서 훈련한 기본 모델
- Finetune: 소량의 깨끗한 데이터에서 미세 조정
- SSD: 선택적 시냅스 억제 기반 언러닝 알고리즘
- SCRUB: 최첨단 기계 언러닝 알고리즘
- 신뢰할 수 있는 샘플 수: 1000개
- 스케일링 계수 α의 검색 범위: 2000, 300000
- 모델 아키텍처: VGG11, ResNet18, ResNet50, ViT-B/16
- 최적화기: SGD, 학습률 0.01, 가중치 감소 5×10^-4
CIFAR-10 및 CIFAR-100 데이터셋에서의 결과:
| 데이터셋 | 노이즈 강도 | Vanilla | SAP | 개선 폭 |
|---|
| CIFAR-10 | 25% | 76.68±0.48 | 82.27±0.15 | +5.59% |
| CIFAR-100 | 25% | 50.64±0.60 | 53.31±0.78 | +2.67% |
SAP는 모든 노이즈 설정에서 다른 언러닝 방법을 능가하며 평균 1.36%(CIFAR-10) 및 0.39%(CIFAR-100) 개선을 달성합니다.
SAP는 기존 노이즈 강건 방법의 성능을 추가로 향상시킬 수 있습니다:
| 방법 | CIFAR-10 기준 | SAP 강화 | 개선 폭 |
|---|
| MixUp | 83.12±0.44 | 86.45±0.52 | +3.33% |
| SAM | 83.29±0.28 | 87.29±0.08 | +4.0% |
| 평균 | 83.69 | 87.14 | +3.45% |
실제 노이즈 데이터셋에서의 결과:
| 데이터셋 | 모델 | Vanilla | SAP | 개선 폭 |
|---|
| Clothing1M | ResNet50 | 67.48±0.64 | 69.64±0.57 | +2.16% |
| Clothing1M | ViT-B/16 | 69.12±0.45 | 71.43±0.60 | +2.31% |
실험 결과 신뢰할 수 있는 샘플 수를 1000개로 증가시킨 후 이득이 감소하므로, 성능과 계산 효율의 균형을 위해 1000개 샘플을 선택합니다.
α=30000은 다양한 합성 노이즈 설정에서 최고 성능을 보이며, 과도하게 크거나 작은 α 값은 성능을 저하시킵니다.
- 계산 효율성: SAP는 16회 하이퍼파라미터 검색만 필요한 반면 SCRUB는 675회 필요
- 강건성: 다양한 노이즈 유형 및 강도에서 안정적 성능 발휘
- 확장성: 대규모 데이터셋 및 Transformer 모델에 성공적 적용
- 결정 경계 최적화: 시각화 실험은 SAP가 결정 경계를 평활화하여 과적합 감소를 보여줍니다
- 데이터 정제 방법:
- 데이터 필터링: 오류 표시 샘플 제거
- 샘플 선택: 동적 훈련 샘플 선택
- 레이블 수정: 오류 레이블 수정
- 노이즈 강건 훈련:
- 정규화 기법: Dropout, 레이블 평활화
- 강건 손실 함수: 대칭 교차 엔트로피, MAE
- 데이터 증강: MixUp, MentorMix
- 수정적 기계 언러닝:
- 전통적 언러닝은 개인정보 보호에 초점
- 수정적 언러닝은 일반화 성능 향상에 초점
기존 방법 대비 SAP의 장점:
- 오류 샘플 명시적 식별 불필요
- 단일 업데이트로 반복적 최적화의 불안정성 회피
- 간단한 하이퍼파라미터 조정 및 높은 계산 효율
- 유효성 검증: SAP는 합성 및 실제 노이즈 시나리오에서 모델 일반화 성능을 크게 향상시킵니다
- 효율성 장점: 단일 가중치 업데이트 및 간단한 하이퍼파라미터 조정으로 SAP는 현저한 계산 이점을 제공합니다
- 광범위한 적용성: 다양한 네트워크 아키텍처 및 데이터셋 규모 지원
- 실용적 가치: 기존 노이즈 강건 방법과 결합하여 성능을 추가로 향상시킬 수 있습니다
- 신뢰할 수 있는 샘플 가정: 낮은 손실 샘플이 실제로 올바르게 표시되었다는 가정에 의존
- 하이퍼파라미터 민감성: 스케일링 계수 α의 선택이 성능에 중요한 영향을 미칩니다
- 노이즈 유형 제한: 주로 레이블 노이즈를 대상으로 하며 다른 유형의 노이즈 처리 능력 제한
- 이론적 분석 부족: 방법 유효성에 대한 이론적 보장 부재
- 이론적 분석: SAP 유효성의 이론적 기초 구축
- 적응형 매개변수 선택: 최적 α를 자동으로 선택하는 방법 개발
- 확장 적용: 다른 유형의 노이즈 및 작업에서의 적용 탐색
- 다른 기술과의 결합: 데이터 증강, 적대적 훈련 등 기술과의 결합 연구
- 방법의 혁신성:
- SVD를 수정적 기계 언러닝에 처음 적용
- 활성화 투영 개념이 새롭고 효과적
- 자동화된 신뢰할 수 있는 샘플 선택으로 인간 개입 회피
- 실험의 충분성:
- 다양한 노이즈 유형 및 데이터셋 포함
- 여러 기준 방법과의 비교
- 제거 실험 및 매개변수 민감도 분석 포함
- 실용적 가치:
- 높은 계산 효율로 배포 용이
- 기존 방법과 결합 가능
- 다양한 네트워크 아키텍처 지원
- 결과의 설득력:
- 일관된 성능 향상
- 통계적 유의성 검증
- 시각화 분석으로 이해도 향상
- 이론적 기초 약함:
- 방법 유효성에 대한 이론적 분석 부재
- SVD 투영이 노이즈를 효과적으로 억제하는 이유 미설명
- 가정의 제한:
- 낮은 손실 샘플이 올바르게 표시되었다는 가정이 항상 성립하지 않을 수 있음
- 노이즈 분포에 대한 가정이 강함
- 매개변수 조정:
- α 선택에 대한 이론적 지침 부재
- 다양한 데이터셋에서 다른 α 값 필요 가능
- 비교의 제한:
- 최신 노이즈 강건 방법과의 비교 부족
- 데이터 정제 방법과의 직접 비교 부재
- 학술적 기여:
- 기계 언러닝 분야에 새로운 연구 방향 제공
- 활성화 투영 개념이 다른 응용을 영감할 수 있음
- 실제 적용:
- 실제 레이블 노이즈 처리를 위한 실용적 도구 제공
- 기존 훈련 프로세스에 통합 가능
- 재현성:
- 데이터셋 레이블 품질이 낮은 시나리오
- 데이터 재주석이 불가능한 경우
- 훈련된 모델의 빠른 수정이 필요한 응용
- 계산 자원이 제한된 환경
논문은 관련 분야의 중요한 연구를 인용하고 있으며, 다음을 포함합니다:
- 기계 언러닝: SCRUB, SSD 등 방법
- 레이블 노이즈 처리: MixUp, MentorMix, SAM 등
- 데이터 정제: Confident Learning 등
- 기초 이론: SVD 분해, 활성화 분석 등
종합 평가: 본 논문에서 제안한 SAP 방법은 레이블 노이즈 처리 분야에서 중요한 가치를 가지며, 정교한 활성화 투영 설계를 통해 효율적인 모델 수정을 구현합니다. 이론적 분석 측면에서는 부족하지만, 실험 검증이 충분하고 실용적 가치가 현저하여 관련 분야에 가치 있는 기여를 제공합니다.