2025-11-20T13:58:15.370121

Personal Attribute Leakage in Federated Speech Models

Al-Ali, Ghavamipour, Caselli et al.

Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.

academic

Fuga de Atributos Personales en Modelos de Habla Federados

Información Básica

ID del Artículo: 2510.13357
Título: Personal Attribute Leakage in Federated Speech Models
Autores: Hamdan Al-Ali, Ali Reza Ghavamipour, Tommaso Caselli, Fatih Turkmen, Zeerak Talat, Hanan Aldarmaki
Clasificación: cs.CL cs.AI
Fecha de Publicación: 15 de octubre de 2025 (preimpresión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.13357v1

Resumen

El aprendizaje federado es un método común para el entrenamiento de modelos de aprendizaje automático con protección de privacidad. Este artículo analiza la vulnerabilidad de los modelos ASR en entornos federados frente a ataques de inferencia de atributos. Los investigadores probaron métodos de ataque de caja blanca no paramétricos bajo un modelo de amenaza pasivo en tres modelos ASR (Wav2Vec2, HuBERT y Whisper). El ataque se ejecuta únicamente basándose en diferencias de pesos, sin necesidad de acceso al habla original del hablante objetivo. El estudio demuestra la viabilidad de ataques contra atributos demográficos y clínicos sensibles (género, edad, acento, emoción y trastorno articulatorio). Los investigadores descubrieron que los atributos subrepresentados o ausentes en los datos de preentrenamiento son más susceptibles a tales ataques de inferencia. En particular, la información de acento puede inferirse de manera confiable de todos los modelos.

Antecedentes de Investigación y Motivación

Definición del Problema

Problema Central: ¿Los modelos ASR en entornos de aprendizaje federado filtran información de atributos personales sensibles de los usuarios a través de actualizaciones de pesos del modelo?
Amenazas a la Privacidad: Los datos de voz contienen información personal abundante, incluyendo características demográficas (género, edad, acento), condiciones clínicas (trastorno articulatorio) y estado emocional

Análisis de Importancia

Cumplimiento Legal: La fuga de atributos puede violar GDPR, HIPAA y leyes antidiscriminación de EE.UU. y la UE
Protección de Privacidad: La ADA protege a las personas con discapacidades de la discriminación; la fuga de información sobre trastornos del habla tiene consecuencias graves
Amenaza Práctica: Incluso sin filtrar identidad, la fuga de atributos como acento o estado emocional constituye una violación grave de privacidad

Limitaciones de Métodos Existentes

Suposiciones del Aprendizaje Federado: Aunque el aprendizaje federado mejora la privacidad manteniendo el audio original en el dispositivo, las actualizaciones del modelo aún pueden filtrar información sensible
Brecha de Investigación: Trabajos anteriores se han enfocado principalmente en reidentificación de hablantes e ataques de inferencia de membresía, pero el alcance de la fuga de atributos sigue sin explorarse completamente
Modelo de Amenaza: Falta investigación sistemática sobre inferencia de atributos únicamente a través de actualizaciones de pesos

Contribuciones Principales

Primer Estudio Sistemático: Primer análisis integral de vulnerabilidades de fuga de atributos personales en modelos ASR federados
Evaluación Multiatributo: Evaluación de tres modelos ASR principales en cinco atributos sensibles (género, edad, acento, emoción, trastorno articulatorio)
Método de Ataque: Propuesta de método de ataque de caja blanca no paramétrico basado en diferencias de pesos, sin necesidad de acceso a datos de voz original
Hallazgos Clave: Descubrimiento de que los atributos subrepresentados en datos de preentrenamiento se filtran más fácilmente, especialmente la información de acento
Perspectivas de Defensa: Proporciona evidencia empírica de mitigación de fuga de atributos mediante diversificación de datos de preentrenamiento

Explicación Detallada del Método

Modelo de Amenaza

El estudio adopta un modelo de atacante pasivo del lado del servidor:

Capacidades del Atacante: Puede acceder al modelo global Wg y al modelo de entrenamiento local del hablante objetivo Ws
Limitaciones del Ataque: No puede acceder al audio original, texto de transcripción o metadatos
Objetivo del Ataque: Inferir atributos personales protegidos únicamente a través de diferencias de pesos
Suposición de Entrenamiento: Cada modelo se ajusta en una única emisión de un solo hablante

Algoritmo de Ataque de Inferencia de Atributos

1. Construcción de Modelos Sombra

Simulación del proceso de ajuste fino usando conjuntos de datos públicos:

Para cada muestra (xi, yi), i = 1,...,n:
1. Ajustar el modelo global Wg en la muestra xi
2. Obtener modelo sombra Wi
3. Construir conjunto de datos etiquetado {(Wi, yi)}

2. Extracción de Características

Extracción de resumen estadístico de cada tensor de parámetros p ∈ Wi:

zi = concat([μp, σp, min(p), max(p)] para cada p ∈ Wi)

donde zi ∈ Rd es un vector de características de longitud fija.

3. Cálculo del Centroide de Clase

Cálculo del centroide para cada clase:

z̄c = (1/Nc) ∑(i=1 a Nc) zi, donde zi ∈ clase c

4. Inferencia de Atributos

Para el modelo objetivo Ws, extracción del vector de características zs y clasificación usando distancia euclidiana normalizada:

ĉ = argmin_c (||zs - z̄c||2 / (||zs||2 · ||z̄c||2))

Puntos de Innovación Técnica

Método No Paramétrico: No requiere entrenar clasificadores complejos, solo utiliza resúmenes estadísticos y medidas de distancia
Análisis de Diferencias de Pesos: Extrae información de atributos directamente de cambios en parámetros del modelo
Escalabilidad: El método se extiende naturalmente a configuraciones multiclase
Practicidad: El ataque requiere recursos computacionales y cantidad de datos relativamente pequeños

Configuración Experimental

Conjuntos de Datos

Atributo	Conjunto de Datos	Muestras	Descripción
Género, Edad, Acento	Speech Accent Archive (SAA)	200	Grabaciones controladas, script idéntico
Trastorno Articulatorio	TORGO	15 hablantes	8 con trastorno, 7 normales
Emoción	RAVDESS	24 hablantes	Habla emocional actuada por actores profesionales

Configuración de Tareas Experimentales

Detección de Género: 200 hablantes de inglés nativos, 100 hombres 100 mujeres, división entrenamiento/prueba 75/25
Detección de Edad: 18-24 años vs 35-44 años, 70 hablantes masculinos, validación cruzada de 5 pliegues
Detección de Acento: 200 hablantes, hablantes de inglés nativos vs no nativos
Detección de Emoción: Tres tareas de clasificación binaria (calma vs ira, alegría vs tristeza, calma vs miedo)
Detección de Trastorno Articulatorio: Validación cruzada dejando un hablante fuera

Modelos ASR

Wav2Vec2-Base: 95 millones de parámetros, preentrenado en LibriSpeech
HuBERT-Large: 300 millones de parámetros, entrenado en LibriSpeech
Whisper-Small: 244 millones de parámetros, entrenado en 680,000 horas de datos multilingües

Resultados Experimentales

Tasas Principales de Éxito del Ataque

Tarea	Wav2Vec2	HuBERT	Whisper
Detección de Género	64%	63%	46%
Detección de Edad	100%	97%	94%
Detección de Acento	100%	80%	93%
Trastorno Articulatorio	59%	76%	81%
Emoción: Calma vs Ira	52%	67%	83%
Emoción: Alegría vs Tristeza	50%	54%	75%
Emoción: Calma vs Miedo	46%	48%	73%

Hallazgos Experimentales Clave

Diferencias de Atributos Significativas: La edad y el acento muestran la fuga más fuerte (precisión de 80-100%), mientras que el género es más difícil de predecir (46-64%)
Diferencias de Modelos: Whisper muestra fuga >70% en todos los atributos excepto género
Significancia Estadística: Los resultados de detección de edad alcanzan significancia estadística en todos los modelos (intervalo de confianza del 95%)

Resultados de Análisis por Capas

El análisis por capas de Wav2Vec2 revela:

Información de Edad: Mantiene tasa de detección consistentemente alta en todas las capas
Emoción y Trastorno Articulatorio: Muestran mayor variabilidad en capas intermedias y posteriores
Especificidad de Capas: El desempeño de capas específicas a veces supera la inferencia del modelo completo

Clasificación de Acento de Grano Fino

Experimentos de clasificación multiclase en los 10 acentos más comunes:

Antes de Defensa: Todos los acentos de prueba alcanzan precisión ≥90%
Después de Defensa: Después del ajuste fino en datos de acento diversificados, la tasa de éxito del ataque cae a <20%
Capacidad de Generalización: Mantiene alta tasa de éxito del ataque en acentos no vistos (japonés, italiano, alemán, polaco, macedonio)

Trabajo Relacionado

Ataques de Privacidad en Aprendizaje Federado

Ataques de Inferencia de Membresía: Shokri et al. propusieron por primera vez ataques de inferencia de membresía contra modelos de aprendizaje automático
Fugas en Aprendizaje Colaborativo: Melis et al. investigaron fugas de características no intencionales en aprendizaje colaborativo
Ataques en Dominio de Voz: Trabajos anteriores se enfocaron principalmente en reidentificación de hablantes e inferencia de membresía

Inferencia de Atributos de Voz

Métodos Tradicionales: Reconocimiento de atributos basado en señales de voz original
Protección de Privacidad: Sensibilidad de datos de voz y necesidades de protección de privacidad
Contribución del Artículo: Primer enfoque en inferencia de atributos únicamente a través de pesos del modelo

Conclusiones y Discusión

Conclusiones Principales

Confirmación de Vulnerabilidad: Los modelos ASR federados efectivamente presentan riesgo de filtrar atributos personales a través de actualizaciones de pesos
Correlación de Atributos: El grado de fuga está estrechamente relacionado con la representatividad del atributo en datos de preentrenamiento
Estrategia de Defensa: La diversificación de datos de preentrenamiento puede mitigar efectivamente la fuga de atributos conocidos

Limitaciones

Escala Experimental: Algunas tareas tienen tamaños de muestra pequeños, lo que puede afectar la generalización de resultados
Limitación de Idioma: Se enfoca principalmente en voz en inglés; la fuga en entornos multilingües requiere investigación adicional
Modelo de Ataque: Solo considera atacantes pasivos; los ataques activos pueden producir fugas más graves
Restricciones Prácticas: La suposición de ajuste fino de una sola emisión puede no alinearse completamente con escenarios reales de aprendizaje federado

Direcciones Futuras

Mecanismos de Defensa: Desarrollo de técnicas de protección de privacidad más efectivas, como privacidad diferencial y agregación segura
Investigación Multilingüe: Extensión a escenarios multilingües y translingües
Defensa Dinámica: Investigación de métodos para detección y defensa en tiempo real contra fuga de atributos
Análisis Teórico: Análisis desde perspectiva teórica de las causas fundamentales de fuga de atributos

Evaluación Profunda

Fortalezas

Significancia de Investigación: Primer análisis sistemático que revela vulnerabilidades de fuga de atributos en modelos ASR federados, con significancia importante para protección de privacidad
Diseño de Método Razonable: Método de ataque simple y efectivo, modelo de amenaza creíble y realista
Experimentos Integrales: Cubre múltiples atributos, múltiples modelos y análisis experimentales detallados
Perspectivas Profundas: Descubre asociación importante entre diversidad de datos de preentrenamiento y protección de privacidad
Valor Práctico: Proporciona orientación importante para protección de privacidad en sistemas de aprendizaje federado

Insuficiencias

Limitaciones de Conjunto de Datos: Algunos experimentos utilizan conjuntos de datos de escala pequeña, lo que puede afectar la confiabilidad estadística de resultados
Suposiciones de Ataque: La suposición de ajuste fino de una sola emisión es demasiado simplificada; las aplicaciones prácticas típicamente utilizan más datos
Evaluación de Defensa: La evaluación de métodos de defensa es relativamente limitada, requiriendo análisis de seguridad más integral
Complejidad Computacional: Falta análisis detallado del costo computacional y viabilidad del ataque

Impacto

Contribución Académica: Abre nueva dirección para investigación de privacidad en aprendizaje federado, se espera genere más investigación relacionada
Orientación Práctica: Proporciona consideraciones de seguridad importantes para despliegue industrial de sistemas ASR federados
Impacto Político: Los resultados de investigación pueden influir en formulación e implementación de regulaciones de protección de privacidad relevantes
Impulso Tecnológico: Promueve desarrollo de algoritmos de aprendizaje federado más seguros y tecnologías de protección de privacidad

Escenarios Aplicables

Sistemas ASR Federados: Directamente aplicable a evaluación de seguridad de diversas aplicaciones de reconocimiento de voz federado
Auditoría de Privacidad: Puede servir como herramienta de auditoría de seguridad para sistemas de protección de privacidad
Diseño de Modelos: Proporciona referencia importante para diseño de modelos de voz más seguros
Cumplimiento Regulatorio: Ayuda a organizaciones a evaluar y asegurar conformidad de sistemas de IA de voz

Referencias

Baevski et al. "wav2vec 2.0: A framework for self-supervised learning of speech representations." NeurIPS 2020.
Hsu et al. "HuBERT: Self-supervised speech representation learning by masked prediction of hidden units." IEEE/ACM TASLP 2021.
Radford et al. "Robust speech recognition via large-scale weak supervision." ICML 2023.
Shokri et al. "Membership inference attacks against machine learning models." IEEE S&P 2017.
Melis et al. "Exploiting unintended feature leakage in collaborative learning." IEEE S&P 2019.

Este artículo revela riesgos importantes de privacidad en el aprendizaje federado en el dominio de voz, proporcionando perspectivas y orientación valiosas para construir sistemas de IA de voz más seguros. La investigación no solo posee valor académico importante, sino que también tiene implicaciones profundas para aplicaciones prácticas.