Personal Attribute Leakage in Federated Speech Models
Al-Ali, Ghavamipour, Caselli et al.
Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.
يعتبر التعلم الموزع طريقة شائعة لحماية الخصوصية في تدريب نماذج التعلم الآلي. تحلل هذه الورقة ضعف نماذج التعرف على الكلام (ASR) في البيئات الموزعة تجاه هجمات استدلال السمات. اختبر الباحثون طرق هجوم صندوق أبيض غير معاملي تحت نموذج تهديد سلبي على ثلاثة نماذج ASR (Wav2Vec2 و HuBERT و Whisper). يعمل الهجوم فقط على أساس الفروقات في الأوزان، دون الحاجة إلى الوصول إلى الكلام الأصلي للمتحدث المستهدف. تثبت الدراسة جدوى الهجمات على السمات الديموغرافية والسريرية الحساسة (الجنس والعمر واللهجة والعاطفة واضطراب النطق). تكتشف الدراسة أن السمات الممثلة بشكل ناقص أو الغائبة في بيانات التدريب المسبق أكثر عرضة لهذه الهجمات الاستدلالية. وبشكل خاص، يمكن استدلال معلومات اللهجة بشكل موثوق من جميع النماذج.
المشكلة الأساسية: هل نماذج ASR في البيئات التعلم الموزع تسرب السمات الشخصية الحساسة للمستخدمين من خلال تحديثات أوزان النموذج؟
تهديدات الخصوصية: تحتوي بيانات الكلام على معلومات شخصية غنية، بما في ذلك الخصائص الديموغرافية (الجنس والعمر واللهجة) والحالات السريرية (اضطرابات النطق) وحالات العاطفة
Baevski et al. "wav2vec 2.0: إطار عمل للتعلم الذاتي الإشراف لتمثيلات الكلام." NeurIPS 2020.
Hsu et al. "HuBERT: تعلم تمثيل الكلام الذاتي الإشراف من خلال التنبؤ المقنع بالوحدات المخفية." IEEE/ACM TASLP 2021.
Radford et al. "التعرف على الكلام القوي عبر الإشراف الضعيف على نطاق واسع." ICML 2023.
Shokri et al. "هجمات استدلال العضوية ضد نماذج التعلم الآلي." IEEE S&P 2017.
Melis et al. "استغلال تسرب الميزات غير المقصود في التعلم التعاوني." IEEE S&P 2019.
تكشف هذه الورقة عن مخاطر خصوصية مهمة في التعلم الموزع في مجال الكلام، وتوفر رؤى وإرشادات قيمة لبناء أنظمة ذكية للكلام أكثر أماناً. يتمتع البحث ليس فقط بقيمة أكاديمية مهمة، بل له أيضاً تأثير عميق على التطبيقات العملية.