Personal Attribute Leakage in Federated Speech Models
Al-Ali, Ghavamipour, Caselli et al.
Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.
academic
Persönliche Attributlecks in föderierten Sprachmodellen
Föderiertes Lernen ist eine gängige Methode zum datenschutzgerechten Training von Modellen des maschinellen Lernens. Dieses Paper analysiert die Anfälligkeit von ASR-Modellen in föderierter Umgebung gegenüber Attributinferenzangriffen. Die Forscher testeten unter einem passiven Bedrohungsmodell nichtparametrische White-Box-Angriffsmethoden gegen drei ASR-Modelle (Wav2Vec2, HuBERT und Whisper). Der Angriff basiert ausschließlich auf Gewichtsdifferenzen und erfordert keinen Zugriff auf die ursprüngliche Sprache des Zielsprechers. Die Studie demonstriert die Machbarkeit von Angriffen auf sensible demografische und klinische Attribute (Geschlecht, Alter, Akzent, Emotion und Artikulationsstörung). Die Forschung zeigt, dass Attribute, die in den Vortrainingsdaten unterrepräsentiert oder fehlend sind, anfälliger für solche Inferenzangriffe sind. Besonders hervorzuheben ist, dass Akzentinformationen zuverlässig aus allen Modellen abgeleitet werden können.
Kernproblem: Geben ASR-Modelle in föderierter Lernumgebung sensible persönliche Attributinformationen von Benutzern durch Modellgewichtsaktualisierungen preis?
Rechtliche Compliance: Attributlecks können gegen GDPR, HIPAA und Antidiskriminierungsgesetze in den USA und der EU verstoßen
Datenschutz: Der Americans with Disabilities Act (ADA) schützt Menschen mit Behinderungen vor Diskriminierung; die Offenlegung von Sprachbehinderungsinformationen hat schwerwiegende Folgen
Praktische Bedrohung: Selbst ohne Identitätsoffenlegung stellt die bloße Offenlegung von Attributen wie Akzent oder Emotionalzustand eine schwerwiegende Datenschutzverletzung dar
Föderierte Lernhypothesen: Obwohl föderiertes Lernen den Datenschutz durch Beibehaltung von Rohaudios auf Geräten verbessert, können Modellaktualisierungen dennoch sensible Informationen preisgeben
Forschungslücke: Frühere Arbeiten konzentrierten sich hauptsächlich auf Sprecherwiederidentifikation und Mitgliedschaftsinferenzangriffe, aber der Umfang von Attributlecks bleibt unzureichend erforscht
Bedrohungsmodell: Es fehlt eine systematische Untersuchung von Attributinferenz nur durch Gewichtsaktualisierungen
Erste systematische Untersuchung: Erste umfassende Analyse der Anfälligkeit für persönliche Attributlecks in föderierter ASR
Multi-Attribut-Bewertung: Bewertung von drei führenden ASR-Modellen auf fünf sensible Attribute (Geschlecht, Alter, Akzent, Emotion, Artikulationsstörung)
Angriffsmethode: Nichtparametrische White-Box-Angriffsmethode basierend auf Gewichtsdifferenzen ohne Zugriff auf Rohsprachdaten
Schlüsselfunde: Attribute mit Unterrepräsentation in Vortrainingsdaten sind anfälliger für Lecks, besonders Akzentinformationen
Schutzerkenntnisse: Empirische Evidenz für die Abschwächung von Attributlecks durch Diversifizierung von Vortrainingsdaten
Verwendung öffentlicher Datensätze zur Simulation des Feinabstimmungsprozesses:
Für jede Stichprobe (xi, yi), i = 1,...,n:
1. Feinabstimmung des globalen Modells Wg auf Stichprobe xi
2. Erhalten des Schattenmodells Wi
3. Konstruktion des beschrifteten Datensatzes {(Wi, yi)}
Signifikante Attributunterschiede: Alter und Akzent zeigen die stärksten Lecks (80-100% Genauigkeit), während Geschlecht am schwierigsten vorherzusagen ist (46-64%)
Modellunterschiede: Whisper zeigt bei allen Attributen außer Geschlecht Leck-Genauigkeit >70%
Statistische Signifikanz: Altererkennung erreicht auf allen Modellen statistische Signifikanz (95% Konfidenzintervall)
Praktische Einschränkungen: Die Annahme einer Feinabstimmung mit einzelnen Äußerungen entspricht möglicherweise nicht vollständig realen Föderiertes-Lernen-Szenarien
Datensatzbeschränkungen: Einige Experimente verwenden kleinere Datensätze, was die statistische Zuverlässigkeit beeinflussen kann
Angriffsannahmen: Die Annahme einer Feinabstimmung mit einzelnen Äußerungen ist zu vereinfacht; praktische Anwendungen verwenden normalerweise mehr Daten
Schutzbeurteilung: Bewertung von Schutzmethoden ist relativ begrenzt; umfassendere Sicherheitsanalyse erforderlich
Rechenkomplexität: Rechenkomplexität und Machbarkeit des Angriffs nicht detailliert analysiert
Baevski et al. "wav2vec 2.0: A framework for self-supervised learning of speech representations." NeurIPS 2020.
Hsu et al. "HuBERT: Self-supervised speech representation learning by masked prediction of hidden units." IEEE/ACM TASLP 2021.
Radford et al. "Robust speech recognition via large-scale weak supervision." ICML 2023.
Shokri et al. "Membership inference attacks against machine learning models." IEEE S&P 2017.
Melis et al. "Exploiting unintended feature leakage in collaborative learning." IEEE S&P 2019.
Dieses Paper offenbart wichtige Datenschutzrisiken beim föderiertem Lernen im Sprachbereich und bietet wertvolle Erkenntnisse und Anleitung für den Aufbau sicherer Sprach-KI-Systeme. Die Forschung hat nicht nur bedeutende akademische Werte, sondern auch tiefgreifende Auswirkungen auf praktische Anwendungen.