2025-11-20T13:58:15.370121

Personal Attribute Leakage in Federated Speech Models

Al-Ali, Ghavamipour, Caselli et al.

Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.

academic

Perdita di Attributi Personali nei Modelli di Linguaggio Federato per il Riconoscimento Vocale

Informazioni Fondamentali

ID Articolo: 2510.13357
Titolo: Personal Attribute Leakage in Federated Speech Models
Autori: Hamdan Al-Ali, Ali Reza Ghavamipour, Tommaso Caselli, Fatih Turkmen, Zeerak Talat, Hanan Aldarmaki
Classificazione: cs.CL cs.AI
Data di Pubblicazione: 15 ottobre 2025 (preprint arXiv)
Link Articolo: https://arxiv.org/abs/2510.13357v1

Riassunto

L'apprendimento federato è un metodo comunemente utilizzato per l'addestramento di modelli di apprendimento automatico con protezione della privacy. Questo articolo analizza la vulnerabilità dei modelli ASR (Automatic Speech Recognition) agli attacchi di inferenza degli attributi in ambienti federati. I ricercatori hanno testato metodi di attacco white-box non parametrici su tre modelli ASR (Wav2Vec2, HuBERT e Whisper) secondo un modello di minaccia passivo. L'attacco funziona basandosi esclusivamente sulle differenze di peso, senza necessità di accesso ai dati vocali originali del parlante bersaglio. Lo studio dimostra la fattibilità di attacchi su attributi demografici sensibili e clinici (genere, età, accento, emozione e disturbi articolatori). I ricercatori hanno scoperto che gli attributi sottorappresentati o assenti nei dati di preaddestramento sono più vulnerabili a tali attacchi di inferenza. In particolare, le informazioni sull'accento possono essere dedotte in modo affidabile da tutti i modelli.

Contesto di Ricerca e Motivazione

Definizione del Problema

Problema Centrale: I modelli ASR in ambienti di apprendimento federato perdono informazioni su attributi personali sensibili degli utenti attraverso gli aggiornamenti dei pesi del modello?
Minacce alla Privacy: I dati vocali contengono informazioni personali ricche, incluse caratteristiche demografiche (genere, età, accento), condizioni cliniche (disturbi articolatori) e stati emotivi

Analisi dell'Importanza

Conformità Legale: La perdita di attributi potrebbe violare il GDPR, l'HIPAA e le leggi antidiscriminazione degli Stati Uniti e dell'Unione Europea
Protezione della Privacy: L'ADA protegge le persone con disabilità dalla discriminazione; la perdita di informazioni su disturbi vocali ha conseguenze gravi
Minacce Pratiche: Anche senza perdita di identità, la sola perdita di attributi come accento o stato emotivo costituisce una grave violazione della privacy

Limitazioni dei Metodi Esistenti

Presupposti dell'Apprendimento Federato: Sebbene l'apprendimento federato migliori la privacy mantenendo l'audio originale sul dispositivo, gli aggiornamenti del modello potrebbero comunque perdere informazioni sensibili
Lacune di Ricerca: I lavori precedenti si sono concentrati principalmente su re-identificazione del parlante e attacchi di inferenza di appartenenza, ma l'ambito della perdita di attributi rimane insufficientemente esplorato
Modello di Minaccia: Manca uno studio sistematico sull'inferenza degli attributi attraverso soli aggiornamenti di peso

Contributi Principali

Studio Sistematico Pioneristico: Prima analisi completa della vulnerabilità alla perdita di attributi personali nei modelli ASR federati
Valutazione Multi-Attributo: Valutazione di tre modelli ASR mainstream su cinque attributi sensibili (genere, età, accento, emozione, disturbi articolatori)
Metodo di Attacco: Propone un metodo di attacco white-box non parametrico basato su differenze di peso, senza necessità di accesso ai dati vocali originali
Scoperte Chiave: Scopre che gli attributi sottorappresentati nei dati di preaddestramento sono più facilmente perduti, in particolare le informazioni sull'accento
Intuizioni Difensive: Fornisce prove empiriche di mitigazione della perdita di attributi attraverso la diversificazione dei dati di preaddestramento

Spiegazione Dettagliata del Metodo

Modello di Minaccia

Lo studio adotta un modello di attaccante passivo lato server:

Capacità dell'Attaccante: Può accedere al modello globale Wg e al modello di addestramento locale del parlante bersaglio Ws
Limitazioni dell'Attacco: Non può accedere all'audio originale, ai testi trascritti o ai metadati
Obiettivo dell'Attacco: Dedurre attributi personali protetti esclusivamente attraverso differenze di peso
Presupposto di Addestramento: Ogni modello viene messo a punto su un singolo enunciato di un singolo parlante

Algoritmo di Attacco di Inferenza degli Attributi

1. Costruzione del Modello Ombra

Simulazione del processo di messa a punto utilizzando dataset pubblici:

Per ogni campione (xi, yi), i = 1,...,n:
1. Messa a punto del modello globale Wg sul campione xi
2. Ottenimento del modello ombra Wi
3. Costruzione del dataset etichettato {(Wi, yi)}

2. Estrazione delle Caratteristiche

Estrazione di riassunti statistici da ogni tensore di parametri p ∈ Wi:

zi = concat([μp, σp, min(p), max(p)] per ogni p ∈ Wi)

dove zi ∈ Rd è un vettore di caratteristiche di lunghezza fissa.

3. Calcolo del Baricentro della Classe

Calcolo del baricentro per ogni classe:

z̄c = (1/Nc) ∑(i=1 a Nc) zi, dove zi ∈ classe c

4. Inferenza degli Attributi

Per il modello bersaglio Ws, estrazione del vettore di caratteristiche zs e classificazione utilizzando distanza euclidea normalizzata:

ĉ = argmin_c (||zs - z̄c||2 / (||zs||2 · ||z̄c||2))

Innovazioni Tecniche

Metodo Non Parametrico: Non richiede l'addestramento di classificatori complessi, utilizza solo riassunti statistici e misure di distanza
Analisi delle Differenze di Peso: Estrae direttamente informazioni sugli attributi dalle variazioni dei parametri del modello
Scalabilità: Il metodo si estende naturalmente a impostazioni multi-classe
Praticità: L'attacco richiede risorse computazionali e quantità di dati relativamente modesti

Configurazione Sperimentale

Dataset

Attributo	Dataset	Campioni	Descrizione
Genere, Età, Accento	Speech Accent Archive (SAA)	200	Registrazioni controllate, stesso script
Disturbi Articolatori	TORGO	15 parlanti	8 con disturbi, 7 normali
Emozione	RAVDESS	24 parlanti	Linguaggio emotivo interpretato da attori professionisti

Configurazione dei Compiti Sperimentali

Rilevamento del Genere: 200 parlanti di lingua madre inglese, 100 maschi 100 femmine, divisione addestramento/test 75/25
Rilevamento dell'Età: 18-24 anni vs 35-44 anni, 70 parlanti maschi, convalida incrociata 5-fold
Rilevamento dell'Accento: 200 parlanti, parlanti di lingua madre inglese vs non madrelingua
Rilevamento dell'Emozione: Tre compiti di classificazione binaria (calmo vs arrabbiato, felice vs triste, calmo vs spaventato)
Rilevamento dei Disturbi Articolatori: Convalida incrociata leave-one-speaker-out

Modelli ASR

Wav2Vec2-Base: 95 milioni di parametri, preaddestrato su LibriSpeech
HuBERT-Large: 300 milioni di parametri, addestrato su LibriSpeech
Whisper-Small: 244 milioni di parametri, addestrato su 680.000 ore di dati multilingue

Risultati Sperimentali

Tassi di Successo Principali dell'Attacco

Compito	Wav2Vec2	HuBERT	Whisper
Rilevamento Genere	64%	63%	46%
Rilevamento Età	100%	97%	94%
Rilevamento Accento	100%	80%	93%
Disturbi Articolatori	59%	76%	81%
Emozione: Calmo vs Arrabbiato	52%	67%	83%
Emozione: Felice vs Triste	50%	54%	75%
Emozione: Calmo vs Spaventato	46%	48%	73%

Scoperte Sperimentali Chiave

Differenze Significative negli Attributi: L'età e l'accento mostrano la perdita più forte (accuratezza 80-100%), mentre il genere è più difficile da prevedere (46-64%)
Differenze nei Modelli: Whisper mostra perdita >70% su tutti gli attributi tranne il genere
Significatività Statistica: I risultati del rilevamento dell'età raggiungono la significatività statistica su tutti i modelli (intervallo di confidenza 95%)

Risultati dell'Analisi per Strato

Attraverso l'analisi per strato di Wav2Vec2 si scopre:

Informazioni sull'Età: Mantiene tassi di rilevamento elevati e coerenti in tutti gli strati
Emozione e Disturbi Articolatori: Mostrano maggiore variabilità negli strati intermedi e finali
Specificità dello Strato: Le prestazioni di alcuni strati specifici a volte superano l'inferenza del modello completo

Classificazione Granulare dell'Accento

Esperimenti di classificazione multi-classe sui 10 accenti più comuni:

Prima dell'Attacco: Accuratezza ≥90% su tutti gli accenti di test
Dopo la Difesa: Messa a punto su dati di accento diversificati riduce il tasso di successo dell'attacco a <20%
Capacità di Generalizzazione: Mantiene elevato tasso di successo dell'attacco su accenti non visti (giapponese, italiano, tedesco, polacco, macedone)

Lavori Correlati

Attacchi alla Privacy nell'Apprendimento Federato

Attacchi di Inferenza di Appartenenza: Shokri et al. hanno proposto per la prima volta attacchi di inferenza di appartenenza contro modelli di apprendimento automatico
Perdite nell'Apprendimento Collaborativo: Melis et al. hanno studiato perdite di caratteristiche accidentali nell'apprendimento collaborativo
Attacchi nel Dominio Vocale: I lavori precedenti si sono concentrati principalmente su re-identificazione del parlante e inferenza di appartenenza

Inferenza degli Attributi Vocali

Metodi Tradizionali: Riconoscimento degli attributi basato su segnali vocali grezzi
Protezione della Privacy: Sensibilità e necessità di protezione della privacy dei dati vocali
Contributo di questo Articolo: Primo lavoro focalizzato sull'inferenza degli attributi esclusivamente attraverso i pesi del modello

Conclusioni e Discussione

Conclusioni Principali

Conferma della Vulnerabilità: I modelli ASR federati presentano effettivamente il rischio di perdita di attributi personali attraverso aggiornamenti di peso
Correlazione degli Attributi: Il grado di perdita è strettamente correlato alla rappresentatività dell'attributo nei dati di preaddestramento
Strategie Difensive: La diversificazione dei dati di preaddestramento può mitigare efficacemente la perdita di attributi noti

Limitazioni

Scala Sperimentale: Alcuni compiti hanno dimensioni di campione ridotte, che potrebbero influire sulla generalizzabilità dei risultati
Limitazioni Linguistiche: Focalizzato principalmente sul linguaggio vocale inglese; la situazione di perdita in ambienti multilingue richiede ulteriori ricerche
Modello di Attacco: Considera solo attaccanti passivi; gli attacchi attivi potrebbero causare perdite più gravi
Vincoli Pratici: L'ipotesi di messa a punto a singolo enunciato potrebbe non allinearsi completamente con scenari di apprendimento federato reali

Direzioni Future

Meccanismi di Difesa: Sviluppare tecniche di protezione della privacy più efficaci, come privacy differenziale e aggregazione sicura
Ricerca Multilingue: Estensione a scenari multilingue e cross-linguistici
Difesa Dinamica: Ricerca di metodi per il rilevamento e la protezione in tempo reale della perdita di attributi
Analisi Teorica: Analisi teorica delle cause fondamentali della perdita di attributi

Valutazione Approfondita

Punti di Forza

Significato della Ricerca: Primo studio sistematico che rivela la vulnerabilità alla perdita di attributi nei modelli ASR federati, con importante significato per la protezione della privacy
Progettazione Metodologica Razionale: Metodo di attacco semplice ed efficace, modello di minaccia realistico e credibile
Esperimenti Completi: Copertura di molteplici attributi, modelli multipli e analisi sperimentali dettagliate
Intuizioni Profonde: Scoperta dell'importante correlazione tra diversità dei dati di preaddestramento e protezione della privacy
Valore Pratico: Fornisce guida importante per la protezione della privacy nei sistemi di apprendimento federato

Insufficienze

Limitazioni dei Dataset: Alcuni esperimenti utilizzano dataset di dimensioni ridotte, che potrebbero influire sull'affidabilità statistica dei risultati
Ipotesi di Attacco: L'ipotesi di messa a punto a singolo enunciato è eccessivamente semplificata; le applicazioni pratiche di solito utilizzano più dati
Valutazione della Difesa: La valutazione dei metodi di difesa è relativamente limitata; è necessaria un'analisi di sicurezza più completa
Complessità Computazionale: Manca un'analisi dettagliata del costo computazionale e della fattibilità dell'attacco

Impatto

Contributo Accademico: Apre una nuova direzione per la ricerca sulla privacy nell'apprendimento federato, con previsione di stimolare ulteriori ricerche correlate
Guida Pratica: Fornisce importanti considerazioni di sicurezza per l'implementazione industriale di sistemi ASR federati
Impatto Normativo: I risultati della ricerca potrebbero influenzare la formulazione e l'implementazione di normative correlate sulla protezione della privacy
Spinta Tecnologica: Promuove lo sviluppo di algoritmi di apprendimento federato più sicuri e tecnologie di protezione della privacy

Scenari Applicabili

Sistemi ASR Federati: Direttamente applicabile alla valutazione della sicurezza di varie applicazioni di riconoscimento vocale federato
Audit della Privacy: Può servire come strumento di audit della sicurezza per sistemi di protezione della privacy
Progettazione del Modello: Fornisce importanti riferimenti per la progettazione di modelli vocali più sicuri
Conformità Normativa: Aiuta le organizzazioni a valutare e garantire la conformità dei sistemi di intelligenza artificiale vocale

Bibliografia

Baevski et al. "wav2vec 2.0: A framework for self-supervised learning of speech representations." NeurIPS 2020.
Hsu et al. "HuBERT: Self-supervised speech representation learning by masked prediction of hidden units." IEEE/ACM TASLP 2021.
Radford et al. "Robust speech recognition via large-scale weak supervision." ICML 2023.
Shokri et al. "Membership inference attacks against machine learning models." IEEE S&P 2017.
Melis et al. "Exploiting unintended feature leakage in collaborative learning." IEEE S&P 2019.

Questo articolo rivela importanti rischi di privacy nell'apprendimento federato nel dominio vocale, fornendo intuizioni e guida preziose per la costruzione di sistemi di intelligenza artificiale vocale più sicuri. La ricerca non solo ha importante valore accademico, ma ha anche profonde implicazioni per le applicazioni pratiche.