2025-11-13T21:49:11.069891

SAP: Corrective Machine Unlearning with Scaled Activation Projection for Label Noise Robustness

Kodge, Ravikumar, Saha et al.
Label corruption, where training samples are mislabeled due to non-expert annotation or adversarial attacks, significantly degrades model performance. Acquiring large, perfectly labeled datasets is costly, and retraining models from scratch is computationally expensive. To address this, we introduce Scaled Activation Projection (SAP), a novel SVD (Singular Value Decomposition)-based corrective machine unlearning algorithm. SAP mitigates label noise by identifying a small subset of trusted samples using cross-entropy loss and projecting model weights onto a clean activation space estimated using SVD on these trusted samples. This process suppresses the noise introduced in activations due to the mislabeled samples. In our experiments, we demonstrate SAP's effectiveness on synthetic noise with different settings and real-world label noise. SAP applied to the CIFAR dataset with 25% synthetic corruption show upto 6% generalization improvements. Additionally, SAP can improve the generalization over noise robust training approaches on CIFAR dataset by ~3.2% on average. Further, we observe generalization improvements of 2.31% for a Vision Transformer model trained on naturally corrupted Clothing1M.
academic

SAP: Corrective Machine Unlearning con Scaled Activation Projection per la Robustezza al Rumore di Etichetta

Informazioni Fondamentali

  • ID Articolo: 2403.08618
  • Titolo: SAP: Corrective Machine Unlearning with Scaled Activation Projection for Label Noise Robustness
  • Autori: Sangamesh Kodge, Deepak Ravikumar, Gobinda Saha, Kaushik Roy (Purdue University)
  • Classificazione: cs.LG cs.AI stat.ML
  • Data di Pubblicazione: 2 gennaio 2025 (arXiv v2)
  • Link Articolo: https://arxiv.org/abs/2403.08618
  • Link Codice: https://github.com/sangamesh-kodge/SAP.git

Riassunto

Il rumore di etichetta rappresenta un problema critico nell'apprendimento profondo, poiché i campioni di addestramento etichettati erroneamente a causa di annotazioni non professionali o attacchi avversariali riducono significativamente le prestazioni del modello. L'acquisizione di dataset perfettamente etichettati su larga scala è costosa, e l'addestramento da zero comporta un overhead computazionale considerevole. A tal fine, questo articolo propone la Scaled Activation Projection (SAP), un algoritmo di machine unlearning correttivo basato sulla decomposizione ai valori singolari (SVD). SAP mitiga il rumore di etichetta identificando un piccolo numero di campioni affidabili utilizzando la perdita di entropia incrociata e proiettando i pesi del modello in uno spazio di attivazione pulito stimato da questi campioni affidabili mediante SVD. Gli esperimenti dimostrano che SAP può ottenere miglioramenti di generalizzazione fino al 6% su dataset CIFAR con il 25% di corruzione sintetica, miglioramenti medi di circa il 3,2% rispetto ai metodi di addestramento robusto al rumore, e miglioramenti di generalizzazione del 2,31% su modelli Vision Transformer nel dataset naturalmente corrotto Clothing1M.

Contesto di Ricerca e Motivazione

Definizione del Problema

  1. Problema del Rumore di Etichetta: Gli errori di etichettatura sono ubiquitari nei dataset su larga scala, potendo derivare da:
    • Errori di annotazione umana
    • Errori di classificazione di sistemi automatici (come i modelli di linguaggio di grandi dimensioni)
    • Attacchi malevoli di data poisoning
  2. Limitazioni delle Soluzioni Esistenti:
    • Metodi di Data Cleaning: Richiedono l'addestramento da capo del modello, con costi computazionali elevati
    • Addestramento Robusto al Rumore: Sebbene migliori la robustezza, non eliminano completamente il divario di prestazioni
    • Machine Unlearning Tradizionale: Richiede una distinzione esplicita tra campioni etichettati erroneamente e campioni difficili da apprendere, difficile nell'applicazione pratica
  3. Motivazione della Ricerca:
    • Evitare i costi computazionali elevati dell'addestramento da capo
    • Evitare l'identificazione esplicita di campioni etichettati erroneamente
    • Realizzare una mitigazione efficiente del rumore attraverso un singolo aggiornamento dei pesi

Contributi Principali

  1. Proposta dell'Algoritmo SAP: Algoritmo di machine unlearning correttivo basato su SVD che mitiga l'impatto del rumore di etichetta attraverso la proiezione di attivazione
  2. Selezione Automatizzata di Campioni Affidabili: Utilizza la perdita di entropia incrociata per identificare automaticamente campioni affidabili, evitando l'annotazione manuale
  3. Aggiornamento dei Pesi in Un Solo Passo: Realizza la correzione efficiente del modello attraverso un singolo calcolo SVD e proiezione dei pesi
  4. Verifica Sperimentale Estesa: Valida l'efficacia in scenari di rumore sintetico e reale, supportando molteplici architetture di modelli

Spiegazione Dettagliata del Metodo

Definizione del Compito

Dato un dataset di addestramento DTrD_{Tr} contenente rumore di etichetta, l'obiettivo è correggere i parametri del modello già addestrato θθ^* in modo che le prestazioni di generalizzazione sul set di test si avvicinino a quelle di un modello addestrato su dati puliti, senza necessità di riaddestramento.

Architettura del Modello

1. Meccanismo di Aggiornamento dei Pesi

Per uno strato lineare aout=ainWTa_{out} = a_{in}W^T, SAP proietta le attivazioni di input attraverso la matrice di allineamento di attivazione WpW_p:

a^out=(ainWp)WT=ain(WWpT)T=ainW^T\hat{a}_{out} = (a_{in}W_p)W^T = a_{in}(WW_p^T)^T = a_{in}\hat{W}^T

La regola di aggiornamento dei pesi è: W^=WWpT\hat{W} = WW_p^T

2. Stima dei Dati Affidabili

Utilizza la perdita di entropia incrociata per selezionare NTrustN_{Trust} campioni con perdita più bassa come insieme affidabile:

DTrust=argminS(xi,yi)SL(θ,xi,yi)D_{Trust} = \arg\min_S \sum_{(x_i,y_i) \in S} L(θ^*, x_i, y_i)

dove S={SiDTrSi=NTrust}S = \{S_i \subseteq D_{Tr} | |S_i| = N_{Trust}\}

3. Costruzione della Matrice di Rappresentazione

  • Strati Lineari: Rlinear=[(aiin)i=1NTrust]R_{linear} = [(a_i^{in})_{i=1}^{N_{Trust}}]
  • Strati Convoluzionali: Converte la convoluzione in moltiplicazione matriciale attraverso l'operazione unfold, Rconv=[(unfold(aiin)T)i=1NTrust]R_{conv} = [(unfold(a_i^{in})^T)_{i=1}^{N_{Trust}}]

4. Decomposizione SVD e Scaling dell'Importanza

Esegue la decomposizione SVD della matrice di rappresentazione: Rl=UlΣlVlTR^l = U^l Σ^l V^{lT}

Calcola i pesi di importanza: λi=ασ~i(α1)σ~i+1λ_i = \frac{α\tilde{σ}_i}{(α-1)\tilde{σ}_i + 1}

dove σ~i=σi2/j=1dσj2\tilde{σ}_i = σ_i^2 / \sum_{j=1}^d σ_j^2 sono i valori singolari normalizzati, e αα è il coefficiente di scaling.

5. Matrice di Allineamento di Attivazione

Costruisce la matrice di proiezione: Wp=UΛUTW_p = UΛU^T, dove Λ=diag(λ1,λ2,...,λd)Λ = diag(λ_1, λ_2, ..., λ_d)

Punti di Innovazione Tecnica

  1. Elaborazione Automatizzata: Non richiede l'identificazione manuale di campioni errati, selezionando automaticamente campioni affidabili attraverso la funzione di perdita
  2. Aggiornamento Efficiente: Completa l'aggiornamento dei pesi con un singolo calcolo SVD e moltiplicazione matriciale, evitando l'ottimizzazione iterativa
  3. Proiezione nello Spazio di Attivazione: Sopprime l'impatto delle attivazioni rumorose attraverso la proiezione in uno spazio di attivazione pulito
  4. Indipendenza dall'Architettura: Applicabile a strati lineari e convoluzionali, supporta molteplici architetture di rete

Configurazione Sperimentale

Dataset

  1. Dataset con Rumore Sintetico:
    • CIFAR-10/CIFAR-100
    • Tre tipi di rumore: rumore simmetrico, asimmetrico, gerarchico
    • Intensità di rumore: 10% e 25%
  2. Dataset con Rumore nel Mondo Reale:
    • Mini-WebVision
    • Clothing1M

Metriche di Valutazione

  • Accuratezza sul set di test
  • Confronto delle prestazioni con metodi baseline
  • Entità del miglioramento di generalizzazione

Metodi di Confronto

  • Retrain: Modello ideale riaddestrato su dati puliti
  • Vanilla: Modello di base addestrato su dati rumorosi
  • Finetune: Fine-tuning su una piccola quantità di dati puliti
  • SSD: Algoritmo di unlearning basato su inibizione sinaptica selettiva
  • SCRUB: Algoritmo di machine unlearning all'avanguardia

Dettagli di Implementazione

  • Numero di campioni affidabili: 1000
  • Intervallo di ricerca del coefficiente di scaling α: 2000, 300000
  • Architetture di modelli: VGG11, ResNet18, ResNet50, ViT-B/16
  • Ottimizzatore: SGD, tasso di apprendimento 0.01, decadimento dei pesi 5×10^-4

Risultati Sperimentali

Risultati Principali

Esperimenti con Rumore Sintetico

I risultati sui dataset CIFAR-10 e CIFAR-100 dimostrano:

DatasetIntensità RumoreVanillaSAPMiglioramento
CIFAR-1025%76.68±0.4882.27±0.15+5.59%
CIFAR-10025%50.64±0.6053.31±0.78+2.67%

SAP supera altri metodi di unlearning in tutte le configurazioni di rumore, con miglioramenti medi dell'1.36% (CIFAR-10) e dello 0.39% (CIFAR-100).

Potenziamento dell'Addestramento Robusto al Rumore

SAP può ulteriormente migliorare le prestazioni dei metodi robusti al rumore esistenti:

MetodoBaseline CIFAR-10SAP PotenziatoMiglioramento
MixUp83.12±0.4486.45±0.52+3.33%
SAM83.29±0.2887.29±0.08+4.0%
Media83.6987.14+3.45%

Rumore nel Mondo Reale

Risultati su dataset con rumore reale:

DatasetModelloVanillaSAPMiglioramento
Clothing1MResNet5067.48±0.6469.64±0.57+2.16%
Clothing1MViT-B/1669.12±0.4571.43±0.60+2.31%

Esperimenti di Ablazione

Impatto del Numero di Campioni Affidabili

Gli esperimenti mostrano che i benefici diminuiscono dopo aver aumentato il numero di campioni affidabili a 1000, quindi sono stati selezionati 1000 campioni per bilanciare prestazioni ed efficienza computazionale.

Impatto del Coefficiente di Scaling α

α=30000 mostra le migliori prestazioni in varie configurazioni di rumore sintetico; valori di α troppo grandi o troppo piccoli riducono le prestazioni.

Scoperte Sperimentali

  1. Efficienza Computazionale: SAP richiede solo 16 ricerche di iperparametri, mentre SCRUB ne richiede 675
  2. Robustezza: Prestazioni stabili in diversi tipi e intensità di rumore
  3. Scalabilità: Applicazione riuscita a dataset su larga scala e modelli Transformer
  4. Ottimizzazione del Confine Decisionale: Gli esperimenti di visualizzazione mostrano che SAP può lisciare il confine decisionale, riducendo l'overfitting

Lavori Correlati

Classificazione dei Metodi di Gestione del Rumore di Etichetta

  1. Metodi di Data Cleaning:
    • Filtraggio dei dati: Rimozione di campioni etichettati erroneamente
    • Selezione di campioni: Selezione dinamica di campioni di addestramento
    • Correzione di etichette: Correzione di etichette errate
  2. Addestramento Robusto al Rumore:
    • Tecniche di regolarizzazione: Dropout, label smoothing
    • Funzioni di perdita robuste: Entropia incrociata simmetrica, MAE
    • Aumento dei dati: MixUp, MentorMix
  3. Machine Unlearning Correttivo:
    • L'unlearning tradizionale si concentra sulla protezione della privacy
    • L'unlearning correttivo si concentra sul miglioramento delle prestazioni di generalizzazione

Vantaggi di questo Articolo

Rispetto ai metodi esistenti, SAP presenta i seguenti vantaggi:

  • Non richiede l'identificazione esplicita di campioni errati
  • L'aggiornamento singolo evita l'instabilità dell'ottimizzazione iterativa
  • Regolazione degli iperparametri semplice e alta efficienza computazionale

Conclusioni e Discussione

Conclusioni Principali

  1. Verifica dell'Efficacia: SAP migliora significativamente le prestazioni di generalizzazione del modello sia in scenari di rumore sintetico che reale
  2. Vantaggi di Efficienza: L'aggiornamento singolo dei pesi e la semplice regolazione degli iperparametri conferiscono a SAP vantaggi computazionali significativi
  3. Applicabilità Generale: Supporta molteplici architetture di rete e scale di dataset
  4. Valore Pratico: Può essere combinato con metodi robusti al rumore esistenti per ulteriormente migliorare le prestazioni

Limitazioni

  1. Ipotesi di Campioni Affidabili: Dipende dall'ipotesi che i campioni con perdita bassa siano effettivamente etichettati correttamente
  2. Sensibilità agli Iperparametri: La scelta del coefficiente di scaling α ha un impatto importante sulle prestazioni
  3. Limitazioni del Tipo di Rumore: Principalmente orientato al rumore di etichetta, con capacità limitata nel gestire altri tipi di rumore
  4. Analisi Teorica Insufficiente: Manca una garanzia teorica dell'efficacia del metodo

Direzioni Future

  1. Analisi Teorica: Stabilire una base teorica per l'efficacia di SAP
  2. Selezione Adattiva dei Parametri: Sviluppare metodi per selezionare automaticamente il valore ottimale di α
  3. Estensione delle Applicazioni: Esplorare l'applicazione in altri tipi di rumore e compiti
  4. Combinazione con Altre Tecniche: Ricercare la combinazione con aumento dei dati, addestramento avversariale e altre tecniche

Valutazione Approfondita

Punti di Forza

  1. Innovazione del Metodo:
    • Prima applicazione di SVD al machine unlearning correttivo
    • L'idea della proiezione di attivazione è innovativa ed efficace
    • La selezione automatizzata di campioni affidabili evita l'intervento manuale
  2. Completezza Sperimentale:
    • Copre molteplici tipi di rumore e dataset
    • Confronto con molteplici metodi baseline
    • Include esperimenti di ablazione e analisi di sensibilità ai parametri
  3. Valore Pratico:
    • Alta efficienza computazionale, facile da implementare
    • Può essere combinato con metodi esistenti
    • Supporta molteplici architetture di rete
  4. Convincenza dei Risultati:
    • Miglioramenti di prestazioni coerenti
    • Verifica della significatività statistica
    • L'analisi di visualizzazione migliora la comprensione

Insufficienze

  1. Fondamento Teorico Debole:
    • Manca l'analisi teorica dell'efficacia del metodo
    • Non spiega perché la proiezione SVD possa efficacemente sopprimere il rumore
  2. Limitazioni delle Ipotesi:
    • L'ipotesi che i campioni con perdita bassa siano etichettati correttamente potrebbe non sempre essere valida
    • Le ipotesi sulla distribuzione del rumore sono piuttosto forti
  3. Regolazione dei Parametri:
    • La scelta di α manca di guida teorica
    • Dataset diversi potrebbero richiedere valori di α diversi
  4. Limitazioni del Confronto:
    • Il confronto con i metodi robusti al rumore più recenti non è sufficientemente completo
    • Manca il confronto diretto con i metodi di data cleaning

Impatto

  1. Contributo Accademico:
    • Fornisce una nuova direzione di ricerca nel campo del machine unlearning
    • L'idea della proiezione di attivazione potrebbe ispirare altre applicazioni
  2. Applicazione Pratica:
    • Fornisce uno strumento pratico per gestire il rumore di etichetta nel mondo reale
    • Può essere integrato nei flussi di lavoro di addestramento esistenti
  3. Riproducibilità:
    • Fornisce un'implementazione completa del codice
    • La descrizione della configurazione sperimentale è dettagliata

Scenari di Applicazione

  1. Scenari in cui la qualità dell'etichettatura del dataset non è elevata
  2. Situazioni in cui non è possibile re-etichettare i dati
  3. Applicazioni che richiedono una correzione rapida di modelli già addestrati
  4. Ambienti con risorse computazionali limitate

Bibliografia

L'articolo cita lavori importanti nei campi correlati, inclusi:

  • Machine Unlearning: Metodi SCRUB, SSD e altri
  • Gestione del Rumore di Etichetta: MixUp, MentorMix, SAM e altri
  • Data Cleaning: Confident Learning e altri
  • Teoria Fondamentale: Decomposizione SVD, analisi di attivazione e altri

Valutazione Complessiva: Il metodo SAP proposto in questo articolo ha un valore importante nel trattamento del rumore di etichetta. Attraverso un design intelligente della proiezione di attivazione, realizza una correzione efficiente del modello. Sebbene presenti alcune insufficienze nell'analisi teorica, la verifica sperimentale è completa e il valore pratico è significativo, fornendo un contributo prezioso al campo correlato.