2025-11-20T13:58:15.370121

Personal Attribute Leakage in Federated Speech Models

Al-Ali, Ghavamipour, Caselli et al.

Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.

academic

Утечка личных атрибутов в федеративных моделях распознавания речи

Основная информация

ID статьи: 2510.13357
Название: Personal Attribute Leakage in Federated Speech Models
Авторы: Hamdan Al-Ali, Ali Reza Ghavamipour, Tommaso Caselli, Fatih Turkmen, Zeerak Talat, Hanan Aldarmaki
Классификация: cs.CL cs.AI
Дата публикации: 15 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.13357v1

Аннотация

Федеративное обучение является распространённым методом защиты конфиденциальности при обучении моделей машинного обучения. В данной статье анализируется уязвимость моделей ASR в федеративной среде к атакам вывода атрибутов. Исследователи в рамках пассивной модели угроз протестировали непараметрический метод атаки типа "белый ящик" на трёх моделях ASR (Wav2Vec2, HuBERT и Whisper). Атака работает только на основе различий весов, без необходимости доступа к исходной речи целевого говорящего. Исследование доказывает возможность атак на чувствительные демографические и клинические атрибуты (пол, возраст, акцент, эмоции и дизартрия). Исследование показало, что атрибуты, недостаточно представленные или отсутствующие в данных предварительного обучения, более подвержены таким атакам вывода. В частности, информация об акценте может быть надёжно выведена из всех моделей.

Исследовательский контекст и мотивация

Определение проблемы

Основная проблема: Утекают ли чувствительные личные атрибуты пользователей через обновления весов моделей ASR в федеративной среде обучения?
Угрозы конфиденциальности: Речевые данные содержат богатую личную информацию, включая демографические характеристики (пол, возраст, акцент), клинические состояния (дизартрия) и эмоциональное состояние

Анализ значимости

Правовое соответствие: Утечка атрибутов может нарушить GDPR, HIPAA и антидискриминационные законы США и ЕС
Защита конфиденциальности: ADA защищает инвалидов от дискриминации; утечка информации о нарушениях речи имеет серьёзные последствия
Практические угрозы: Даже без раскрытия личности утечка только атрибутов, таких как акцент или эмоциональное состояние, представляет серьёзное нарушение конфиденциальности

Ограничения существующих подходов

Предположения федеративного обучения: Хотя федеративное обучение улучшает конфиденциальность, сохраняя исходный звук на устройстве, обновления модели всё ещё могут утечь чувствительную информацию
Исследовательский пробел: Предыдущие работы сосредоточены на переидентификации говорящего и атаках вывода членства, но масштаб утечки атрибутов остаётся недостаточно изучен
Модель угрозы: Отсутствует систематическое исследование вывода атрибутов только на основе обновлений весов

Основные вклады

Первое систематическое исследование: Первый комплексный анализ уязвимостей утечки личных атрибутов в федеративных моделях ASR
Оценка множественных атрибутов: Оценка трёх основных моделей ASR на пяти чувствительных атрибутах (пол, возраст, акцент, эмоции, дизартрия)
Метод атаки: Предложен непараметрический метод атаки типа "белый ящик" на основе различий весов без доступа к исходным речевым данным
Ключевые находки: Обнаружено, что атрибуты, недостаточно представленные в данных предварительного обучения, более подвержены утечке, особенно информация об акценте
Рекомендации по защите: Предоставлены эмпирические доказательства смягчения утечки атрибутов путём диверсификации данных предварительного обучения

Подробное описание методологии

Модель угрозы

Исследование применяет модель пассивного атакующего на стороне сервера:

Возможности атакующего: Может получить доступ к глобальной модели Wg и локальной обученной модели целевого говорящего Ws
Ограничения атаки: Не может получить доступ к исходному звуку, транскрипциям или метаданным
Цель атаки: Вывести защищённые личные атрибуты только на основе различий весов
Предположение обучения: Каждая модель настраивается на одном высказывании одного говорящего

Алгоритм атаки вывода атрибутов

1. Построение теневых моделей

Использование открытых наборов данных для имитации процесса настройки:

Для каждого образца (xi, yi), i = 1,...,n:
1. Настроить глобальную модель Wg на образце xi
2. Получить теневую модель Wi
3. Построить размеченный набор данных {(Wi, yi)}

2. Извлечение признаков

Извлечение статистических сводок из каждого тензора параметров p ∈ Wi:

zi = concat([μp, σp, min(p), max(p)] для каждого p ∈ Wi)

где zi ∈ Rd — вектор признаков фиксированной длины.

3. Вычисление центроидов классов

Вычисление центроида для каждого класса:

z̄c = (1/Nc) ∑(i=1 до Nc) zi, где zi ∈ класс c

4. Вывод атрибутов

Для целевой модели Ws извлечение вектора признаков zs и классификация с использованием нормализованного евклидова расстояния:

ĉ = argmin_c (||zs - z̄c||2 / (||zs||2 · ||z̄c||2))

Технические инновации

Непараметрический метод: Не требует обучения сложных классификаторов, использует только статистические сводки и метрики расстояния
Анализ различий весов: Прямое извлечение информации об атрибутах из изменений параметров модели
Масштабируемость: Метод естественно расширяется на многоклассовые задачи
Практичность: Атака требует относительно небольших вычислительных ресурсов и объёма данных

Экспериментальная установка

Наборы данных

Атрибут	Набор данных	Образцы	Описание
Пол, возраст, акцент	Speech Accent Archive (SAA)	200	Контролируемые записи, одинаковый сценарий
Дизартрия	TORGO	15 говорящих	8 с нарушением, 7 нормальных
Эмоции	RAVDESS	24 говорящих	Эмоциональная речь профессиональных актёров

Конфигурация экспериментальных задач

Определение пола: 200 говорящих с английским как родной язык, 100 мужчин и 100 женщин, разделение 75/25 для обучения/тестирования
Определение возраста: 18-24 года vs 35-44 года, 70 мужских говорящих, 5-кратная перекрёстная проверка
Определение акцента: 200 говорящих, носители английского vs неносители английского языка
Определение эмоций: Три бинарные задачи (спокойствие vs гнев, радость vs грусть, спокойствие vs страх)
Определение дизартрии: Перекрёстная проверка с исключением одного говорящего

Модели ASR

Wav2Vec2-Base: 95 млн параметров, предварительное обучение на LibriSpeech
HuBERT-Large: 300 млн параметров, обучение на LibriSpeech
Whisper-Small: 244 млн параметров, обучение на 680 тыс. часов многоязычных данных

Результаты экспериментов

Основные показатели успеха атаки

Задача	Wav2Vec2	HuBERT	Whisper
Определение пола	64%	63%	46%
Определение возраста	100%	97%	94%
Определение акцента	100%	80%	93%
Дизартрия	59%	76%	81%
Эмоции: спокойствие vs гнев	52%	67%	83%
Эмоции: радость vs грусть	50%	54%	75%
Эмоции: спокойствие vs страх	46%	48%	73%

Ключевые экспериментальные находки

Значительные различия атрибутов: Возраст и акцент показывают наиболее сильную утечку (80-100% точности), тогда как пол наиболее сложен для предсказания (46-64%)
Различия моделей: Whisper демонстрирует утечку >70% на всех атрибутах, кроме пола
Статистическая значимость: Результаты определения возраста достигают статистической значимости на всех моделях (95% доверительный интервал)

Результаты послойного анализа

Послойный анализ Wav2Vec2 выявил:

Информация о возрасте: Последовательно высокий показатель обнаружения во всех слоях
Эмоции и дизартрия: Большая вариативность в средних и поздних слоях
Специфичность слоя: Производительность некоторых конкретных слоёв иногда превышает вывод по всей модели

Многоклассовая классификация акцента

Эксперименты многоклассовой классификации на 10 наиболее распространённых акцентах:

До защиты: Достигнута точность ≥90% на всех тестовых акцентах
После защиты: Успешность атаки снизилась до <20% при настройке на данные с диверсифицированными акцентами
Способность к обобщению: Сохранена высокая успешность атаки на невидимые акценты (японский, итальянский, немецкий, польский, македонский)

Связанные работы

Атаки на конфиденциальность в федеративном обучении

Атаки вывода членства: Shokri и др. впервые предложили атаки вывода членства на модели машинного обучения
Утечки в совместном обучении: Melis и др. исследовали непредвиденные утечки признаков в совместном обучении
Атаки в области речи: Предыдущие работы сосредоточены на переидентификации говорящего и выводе членства

Вывод атрибутов речи

Традиционные методы: Определение атрибутов на основе исходного речевого сигнала
Защита конфиденциальности: Чувствительность речевых данных и потребность в защите конфиденциальности
Вклад данной работы: Первый фокус на выводе атрибутов только на основе весов модели

Заключение и обсуждение

Основные выводы

Подтверждение уязвимости: Федеративные модели ASR действительно подвержены риску утечки личных атрибутов через обновления весов
Связь с атрибутами: Степень утечки тесно связана с представленностью атрибутов в данных предварительного обучения
Стратегии защиты: Диверсификация данных предварительного обучения может эффективно смягчить утечку известных атрибутов

Ограничения

Масштаб экспериментов: Некоторые задачи используют небольшие объёмы образцов, что может повлиять на обобщаемость результатов
Языковые ограничения: Основное внимание уделяется английской речи; утечка в многоязычной среде требует дальнейшего исследования
Модель атаки: Рассмотрены только пассивные атакующие; активные атаки могут привести к более серьёзной утечке
Практические ограничения: Предположение о настройке на одно высказывание может не полностью соответствовать реальным сценариям федеративного обучения

Направления будущих исследований

Механизмы защиты: Разработка более эффективных методов защиты конфиденциальности, таких как дифференциальная приватность и безопасная агрегация
Многоязычные исследования: Расширение на многоязычные и кросс-языковые сценарии
Динамическая защита: Исследование методов обнаружения и защиты от утечки атрибутов в реальном времени
Теоретический анализ: Анализ коренных причин утечки атрибутов с теоретической точки зрения

Углубленная оценка

Преимущества

Значимость исследования: Первое систематическое выявление уязвимостей утечки атрибутов в федеративных моделях ASR имеет важное значение для защиты конфиденциальности
Обоснованный дизайн методов: Метод атаки прост и эффективен, модель угрозы реалистична и достоверна
Комплексные эксперименты: Охватывают множество атрибутов, несколько моделей и детальный анализ
Глубокие инсайты: Обнаружена важная связь между диверсификацией данных предварительного обучения и защитой конфиденциальности
Практическая ценность: Предоставляет важное руководство для защиты конфиденциальности в системах федеративного обучения

Недостатки

Ограничения наборов данных: Некоторые эксперименты используют наборы данных небольшого размера, что может повлиять на статистическую надёжность результатов
Предположения атаки: Предположение о настройке на одно высказывание чрезмерно упрощено; на практике обычно используется больше данных
Ограниченная оценка защиты: Оценка методов защиты относительно ограничена, требуется более комплексный анализ безопасности
Сложность вычислений: Не проведён детальный анализ вычислительных затрат и практической осуществимости атаки

Влияние

Академический вклад: Открывает новое направление в исследованиях конфиденциальности федеративного обучения, ожидается стимулирование дальнейших исследований
Практическое руководство: Предоставляет важные соображения безопасности для развёртывания федеративных систем ASR в промышленности
Политическое влияние: Результаты исследования могут повлиять на разработку и реализацию соответствующих нормативных актов по защите конфиденциальности
Технологический прогресс: Способствует развитию более безопасных алгоритмов федеративного обучения и технологий защиты конфиденциальности

Применимые сценарии

Федеративные системы ASR: Прямое применение к оценке безопасности различных приложений федеративного распознавания речи
Аудит конфиденциальности: Может служить инструментом аудита безопасности для систем защиты конфиденциальности
Проектирование моделей: Предоставляет важные справочные материалы для проектирования более безопасных речевых моделей
Нормативное соответствие: Помогает организациям оценить и обеспечить соответствие речевых систем AI нормативным требованиям

Библиография

Baevski et al. "wav2vec 2.0: A framework for self-supervised learning of speech representations." NeurIPS 2020.
Hsu et al. "HuBERT: Self-supervised speech representation learning by masked prediction of hidden units." IEEE/ACM TASLP 2021.
Radford et al. "Robust speech recognition via large-scale weak supervision." ICML 2023.
Shokri et al. "Membership inference attacks against machine learning models." IEEE S&P 2017.
Melis et al. "Exploiting unintended feature leakage in collaborative learning." IEEE S&P 2019.

Данная статья выявляет важные риски конфиденциальности в федеративном обучении в области речи, предоставляя ценные инсайты и руководство для построения более безопасных систем речевого AI. Исследование имеет не только значительную академическую ценность, но и глубокое практическое значение для реальных приложений.