2025-11-20T13:58:15.370121

Personal Attribute Leakage in Federated Speech Models

Al-Ali, Ghavamipour, Caselli et al.
Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.
academic

Fuga de Atributos Personales en Modelos de Habla Federados

Información Básica

  • ID del Artículo: 2510.13357
  • Título: Personal Attribute Leakage in Federated Speech Models
  • Autores: Hamdan Al-Ali, Ali Reza Ghavamipour, Tommaso Caselli, Fatih Turkmen, Zeerak Talat, Hanan Aldarmaki
  • Clasificación: cs.CL cs.AI
  • Fecha de Publicación: 15 de octubre de 2025 (preimpresión arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.13357v1

Resumen

El aprendizaje federado es un método común para el entrenamiento de modelos de aprendizaje automático con protección de privacidad. Este artículo analiza la vulnerabilidad de los modelos ASR en entornos federados frente a ataques de inferencia de atributos. Los investigadores probaron métodos de ataque de caja blanca no paramétricos bajo un modelo de amenaza pasivo en tres modelos ASR (Wav2Vec2, HuBERT y Whisper). El ataque se ejecuta únicamente basándose en diferencias de pesos, sin necesidad de acceso al habla original del hablante objetivo. El estudio demuestra la viabilidad de ataques contra atributos demográficos y clínicos sensibles (género, edad, acento, emoción y trastorno articulatorio). Los investigadores descubrieron que los atributos subrepresentados o ausentes en los datos de preentrenamiento son más susceptibles a tales ataques de inferencia. En particular, la información de acento puede inferirse de manera confiable de todos los modelos.

Antecedentes de Investigación y Motivación

Definición del Problema

  1. Problema Central: ¿Los modelos ASR en entornos de aprendizaje federado filtran información de atributos personales sensibles de los usuarios a través de actualizaciones de pesos del modelo?
  2. Amenazas a la Privacidad: Los datos de voz contienen información personal abundante, incluyendo características demográficas (género, edad, acento), condiciones clínicas (trastorno articulatorio) y estado emocional

Análisis de Importancia

  1. Cumplimiento Legal: La fuga de atributos puede violar GDPR, HIPAA y leyes antidiscriminación de EE.UU. y la UE
  2. Protección de Privacidad: La ADA protege a las personas con discapacidades de la discriminación; la fuga de información sobre trastornos del habla tiene consecuencias graves
  3. Amenaza Práctica: Incluso sin filtrar identidad, la fuga de atributos como acento o estado emocional constituye una violación grave de privacidad

Limitaciones de Métodos Existentes

  1. Suposiciones del Aprendizaje Federado: Aunque el aprendizaje federado mejora la privacidad manteniendo el audio original en el dispositivo, las actualizaciones del modelo aún pueden filtrar información sensible
  2. Brecha de Investigación: Trabajos anteriores se han enfocado principalmente en reidentificación de hablantes e ataques de inferencia de membresía, pero el alcance de la fuga de atributos sigue sin explorarse completamente
  3. Modelo de Amenaza: Falta investigación sistemática sobre inferencia de atributos únicamente a través de actualizaciones de pesos

Contribuciones Principales

  1. Primer Estudio Sistemático: Primer análisis integral de vulnerabilidades de fuga de atributos personales en modelos ASR federados
  2. Evaluación Multiatributo: Evaluación de tres modelos ASR principales en cinco atributos sensibles (género, edad, acento, emoción, trastorno articulatorio)
  3. Método de Ataque: Propuesta de método de ataque de caja blanca no paramétrico basado en diferencias de pesos, sin necesidad de acceso a datos de voz original
  4. Hallazgos Clave: Descubrimiento de que los atributos subrepresentados en datos de preentrenamiento se filtran más fácilmente, especialmente la información de acento
  5. Perspectivas de Defensa: Proporciona evidencia empírica de mitigación de fuga de atributos mediante diversificación de datos de preentrenamiento

Explicación Detallada del Método

Modelo de Amenaza

El estudio adopta un modelo de atacante pasivo del lado del servidor:

  • Capacidades del Atacante: Puede acceder al modelo global Wg y al modelo de entrenamiento local del hablante objetivo Ws
  • Limitaciones del Ataque: No puede acceder al audio original, texto de transcripción o metadatos
  • Objetivo del Ataque: Inferir atributos personales protegidos únicamente a través de diferencias de pesos
  • Suposición de Entrenamiento: Cada modelo se ajusta en una única emisión de un solo hablante

Algoritmo de Ataque de Inferencia de Atributos

1. Construcción de Modelos Sombra

Simulación del proceso de ajuste fino usando conjuntos de datos públicos:

Para cada muestra (xi, yi), i = 1,...,n:
1. Ajustar el modelo global Wg en la muestra xi
2. Obtener modelo sombra Wi
3. Construir conjunto de datos etiquetado {(Wi, yi)}

2. Extracción de Características

Extracción de resumen estadístico de cada tensor de parámetros p ∈ Wi:

zi = concat([μp, σp, min(p), max(p)] para cada p ∈ Wi)

donde zi ∈ Rd es un vector de características de longitud fija.

3. Cálculo del Centroide de Clase

Cálculo del centroide para cada clase:

z̄c = (1/Nc) ∑(i=1 a Nc) zi, donde zi ∈ clase c

4. Inferencia de Atributos

Para el modelo objetivo Ws, extracción del vector de características zs y clasificación usando distancia euclidiana normalizada:

ĉ = argmin_c (||zs - z̄c||2 / (||zs||2 · ||z̄c||2))

Puntos de Innovación Técnica

  1. Método No Paramétrico: No requiere entrenar clasificadores complejos, solo utiliza resúmenes estadísticos y medidas de distancia
  2. Análisis de Diferencias de Pesos: Extrae información de atributos directamente de cambios en parámetros del modelo
  3. Escalabilidad: El método se extiende naturalmente a configuraciones multiclase
  4. Practicidad: El ataque requiere recursos computacionales y cantidad de datos relativamente pequeños

Configuración Experimental

Conjuntos de Datos

AtributoConjunto de DatosMuestrasDescripción
Género, Edad, AcentoSpeech Accent Archive (SAA)200Grabaciones controladas, script idéntico
Trastorno ArticulatorioTORGO15 hablantes8 con trastorno, 7 normales
EmociónRAVDESS24 hablantesHabla emocional actuada por actores profesionales

Configuración de Tareas Experimentales

  1. Detección de Género: 200 hablantes de inglés nativos, 100 hombres 100 mujeres, división entrenamiento/prueba 75/25
  2. Detección de Edad: 18-24 años vs 35-44 años, 70 hablantes masculinos, validación cruzada de 5 pliegues
  3. Detección de Acento: 200 hablantes, hablantes de inglés nativos vs no nativos
  4. Detección de Emoción: Tres tareas de clasificación binaria (calma vs ira, alegría vs tristeza, calma vs miedo)
  5. Detección de Trastorno Articulatorio: Validación cruzada dejando un hablante fuera

Modelos ASR

  1. Wav2Vec2-Base: 95 millones de parámetros, preentrenado en LibriSpeech
  2. HuBERT-Large: 300 millones de parámetros, entrenado en LibriSpeech
  3. Whisper-Small: 244 millones de parámetros, entrenado en 680,000 horas de datos multilingües

Resultados Experimentales

Tasas Principales de Éxito del Ataque

TareaWav2Vec2HuBERTWhisper
Detección de Género64%63%46%
Detección de Edad100%97%94%
Detección de Acento100%80%93%
Trastorno Articulatorio59%76%81%
Emoción: Calma vs Ira52%67%83%
Emoción: Alegría vs Tristeza50%54%75%
Emoción: Calma vs Miedo46%48%73%

Hallazgos Experimentales Clave

  1. Diferencias de Atributos Significativas: La edad y el acento muestran la fuga más fuerte (precisión de 80-100%), mientras que el género es más difícil de predecir (46-64%)
  2. Diferencias de Modelos: Whisper muestra fuga >70% en todos los atributos excepto género
  3. Significancia Estadística: Los resultados de detección de edad alcanzan significancia estadística en todos los modelos (intervalo de confianza del 95%)

Resultados de Análisis por Capas

El análisis por capas de Wav2Vec2 revela:

  • Información de Edad: Mantiene tasa de detección consistentemente alta en todas las capas
  • Emoción y Trastorno Articulatorio: Muestran mayor variabilidad en capas intermedias y posteriores
  • Especificidad de Capas: El desempeño de capas específicas a veces supera la inferencia del modelo completo

Clasificación de Acento de Grano Fino

Experimentos de clasificación multiclase en los 10 acentos más comunes:

  • Antes de Defensa: Todos los acentos de prueba alcanzan precisión ≥90%
  • Después de Defensa: Después del ajuste fino en datos de acento diversificados, la tasa de éxito del ataque cae a <20%
  • Capacidad de Generalización: Mantiene alta tasa de éxito del ataque en acentos no vistos (japonés, italiano, alemán, polaco, macedonio)

Trabajo Relacionado

Ataques de Privacidad en Aprendizaje Federado

  1. Ataques de Inferencia de Membresía: Shokri et al. propusieron por primera vez ataques de inferencia de membresía contra modelos de aprendizaje automático
  2. Fugas en Aprendizaje Colaborativo: Melis et al. investigaron fugas de características no intencionales en aprendizaje colaborativo
  3. Ataques en Dominio de Voz: Trabajos anteriores se enfocaron principalmente en reidentificación de hablantes e inferencia de membresía

Inferencia de Atributos de Voz

  1. Métodos Tradicionales: Reconocimiento de atributos basado en señales de voz original
  2. Protección de Privacidad: Sensibilidad de datos de voz y necesidades de protección de privacidad
  3. Contribución del Artículo: Primer enfoque en inferencia de atributos únicamente a través de pesos del modelo

Conclusiones y Discusión

Conclusiones Principales

  1. Confirmación de Vulnerabilidad: Los modelos ASR federados efectivamente presentan riesgo de filtrar atributos personales a través de actualizaciones de pesos
  2. Correlación de Atributos: El grado de fuga está estrechamente relacionado con la representatividad del atributo en datos de preentrenamiento
  3. Estrategia de Defensa: La diversificación de datos de preentrenamiento puede mitigar efectivamente la fuga de atributos conocidos

Limitaciones

  1. Escala Experimental: Algunas tareas tienen tamaños de muestra pequeños, lo que puede afectar la generalización de resultados
  2. Limitación de Idioma: Se enfoca principalmente en voz en inglés; la fuga en entornos multilingües requiere investigación adicional
  3. Modelo de Ataque: Solo considera atacantes pasivos; los ataques activos pueden producir fugas más graves
  4. Restricciones Prácticas: La suposición de ajuste fino de una sola emisión puede no alinearse completamente con escenarios reales de aprendizaje federado

Direcciones Futuras

  1. Mecanismos de Defensa: Desarrollo de técnicas de protección de privacidad más efectivas, como privacidad diferencial y agregación segura
  2. Investigación Multilingüe: Extensión a escenarios multilingües y translingües
  3. Defensa Dinámica: Investigación de métodos para detección y defensa en tiempo real contra fuga de atributos
  4. Análisis Teórico: Análisis desde perspectiva teórica de las causas fundamentales de fuga de atributos

Evaluación Profunda

Fortalezas

  1. Significancia de Investigación: Primer análisis sistemático que revela vulnerabilidades de fuga de atributos en modelos ASR federados, con significancia importante para protección de privacidad
  2. Diseño de Método Razonable: Método de ataque simple y efectivo, modelo de amenaza creíble y realista
  3. Experimentos Integrales: Cubre múltiples atributos, múltiples modelos y análisis experimentales detallados
  4. Perspectivas Profundas: Descubre asociación importante entre diversidad de datos de preentrenamiento y protección de privacidad
  5. Valor Práctico: Proporciona orientación importante para protección de privacidad en sistemas de aprendizaje federado

Insuficiencias

  1. Limitaciones de Conjunto de Datos: Algunos experimentos utilizan conjuntos de datos de escala pequeña, lo que puede afectar la confiabilidad estadística de resultados
  2. Suposiciones de Ataque: La suposición de ajuste fino de una sola emisión es demasiado simplificada; las aplicaciones prácticas típicamente utilizan más datos
  3. Evaluación de Defensa: La evaluación de métodos de defensa es relativamente limitada, requiriendo análisis de seguridad más integral
  4. Complejidad Computacional: Falta análisis detallado del costo computacional y viabilidad del ataque

Impacto

  1. Contribución Académica: Abre nueva dirección para investigación de privacidad en aprendizaje federado, se espera genere más investigación relacionada
  2. Orientación Práctica: Proporciona consideraciones de seguridad importantes para despliegue industrial de sistemas ASR federados
  3. Impacto Político: Los resultados de investigación pueden influir en formulación e implementación de regulaciones de protección de privacidad relevantes
  4. Impulso Tecnológico: Promueve desarrollo de algoritmos de aprendizaje federado más seguros y tecnologías de protección de privacidad

Escenarios Aplicables

  1. Sistemas ASR Federados: Directamente aplicable a evaluación de seguridad de diversas aplicaciones de reconocimiento de voz federado
  2. Auditoría de Privacidad: Puede servir como herramienta de auditoría de seguridad para sistemas de protección de privacidad
  3. Diseño de Modelos: Proporciona referencia importante para diseño de modelos de voz más seguros
  4. Cumplimiento Regulatorio: Ayuda a organizaciones a evaluar y asegurar conformidad de sistemas de IA de voz

Referencias

  1. Baevski et al. "wav2vec 2.0: A framework for self-supervised learning of speech representations." NeurIPS 2020.
  2. Hsu et al. "HuBERT: Self-supervised speech representation learning by masked prediction of hidden units." IEEE/ACM TASLP 2021.
  3. Radford et al. "Robust speech recognition via large-scale weak supervision." ICML 2023.
  4. Shokri et al. "Membership inference attacks against machine learning models." IEEE S&P 2017.
  5. Melis et al. "Exploiting unintended feature leakage in collaborative learning." IEEE S&P 2019.

Este artículo revela riesgos importantes de privacidad en el aprendizaje federado en el dominio de voz, proporcionando perspectivas y orientación valiosas para construir sistemas de IA de voz más seguros. La investigación no solo posee valor académico importante, sino que también tiene implicaciones profundas para aplicaciones prácticas.