Federated learning is a common method for privacy-preserving training of machine learning models. In this paper, we analyze the vulnerability of ASR models to attribute inference attacks in the federated setting. We test a non-parametric white-box attack method under a passive threat model on three ASR models: Wav2Vec2, HuBERT, and Whisper. The attack operates solely on weight differentials without access to raw speech from target speakers. We demonstrate attack feasibility on sensitive demographic and clinical attributes: gender, age, accent, emotion, and dysarthria. Our findings indicate that attributes that are underrepresented or absent in the pre-training data are more vulnerable to such inference attacks. In particular, information about accents can be reliably inferred from all models. Our findings expose previously undocumented vulnerabilities in federated ASR models and offer insights towards improved security.
논문 ID : 2510.13357제목 : Personal Attribute Leakage in Federated Speech Models저자 : Hamdan Al-Ali, Ali Reza Ghavamipour, Tommaso Caselli, Fatih Turkmen, Zeerak Talat, Hanan Aldarmaki분류 : cs.CL cs.AI발표 시간 : 2025년 10월 15일 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2510.13357v1 연합 학습은 기계 학습 모델의 개인정보 보호 훈련을 위한 일반적인 방법입니다. 본 논문은 연합 환경에서 ASR 모델의 속성 추론 공격에 대한 취약성을 분석합니다. 연구자들은 수동적 위협 모델 하에서 세 가지 ASR 모델(Wav2Vec2, HuBERT, Whisper)에 대해 비모수 화이트박스 공격 방법을 테스트했습니다. 이 공격은 가중치 차이만을 기반으로 작동하며 대상 화자의 원본 음성에 접근할 필요가 없습니다. 연구는 민감한 인구통계학적 및 임상적 속성(성별, 나이, 억양, 감정, 조음 장애)에 대한 공격의 실행 가능성을 입증했습니다. 연구 결과에 따르면 사전 훈련 데이터에서 대표성이 부족하거나 누락된 속성이 이러한 추론 공격에 더 취약합니다. 특히 억양 정보는 모든 모델에서 안정적으로 추론될 수 있습니다.
핵심 문제 : 연합 학습 환경에서 ASR 모델이 모델 가중치 업데이트를 통해 사용자의 민감한 개인 속성 정보를 유출하는가개인정보 보호 위협 : 음성 데이터는 인구통계학적 특성(성별, 나이, 억양), 임상 상태(조음 장애), 감정 상태를 포함한 풍부한 개인 정보를 포함합니다법적 준수 : 속성 유출은 GDPR, HIPAA 및 미국과 유럽연합의 반차별 법률 위반 가능성이 있습니다개인정보 보호 : ADA는 장애인을 차별로부터 보호하며, 음성 장애 정보 유출은 심각한 결과를 초래합니다실제 위협 : 신원을 유출하지 않더라도 억양이나 감정 상태와 같은 속성만 유출해도 심각한 개인정보 보호 침해입니다연합 학습 가정 : 연합 학습은 원본 음성을 기기에 유지하여 개인정보 보호를 개선하지만, 모델 업데이트는 여전히 민감한 정보를 유출할 수 있습니다연구 공백 : 이전 연구는 주로 화자 재식별 및 멤버십 추론 공격에 중점을 두었으나, 속성 유출의 범위는 여전히 충분히 탐구되지 않았습니다위협 모델 : 가중치 업데이트만을 통한 속성 추론에 대한 체계적 연구가 부족합니다최초 체계적 연구 : 연합 ASR 모델에서 개인 속성 유출 취약성에 대한 최초의 포괄적 분석다중 속성 평가 : 다섯 가지 민감한 속성(성별, 나이, 억양, 감정, 조음 장애)에 대해 세 가지 주요 ASR 모델 평가공격 방법 : 가중치 차이 기반의 비모수 화이트박스 공격 방법 제시, 원본 음성 데이터 접근 불필요주요 발견 : 사전 훈련 데이터에서 대표성이 부족한 속성이 더 쉽게 유출되며, 특히 억양 정보가 유출됨을 발견방어 통찰 : 사전 훈련 데이터 다양화를 통해 속성 유출을 완화할 수 있는 실증적 증거 제공연구는 수동적 서버 측 공격자 모델을 채택합니다:
공격자 능력 : 전역 모델 Wg 및 대상 화자의 로컬 훈련 모델 Ws에 접근 가능공격 제약 : 원본 음성, 전사 텍스트 또는 메타데이터에 접근 불가공격 목표 : 가중치 차이만을 통해 보호된 개인 속성 추론훈련 가정 : 각 모델은 단일 화자의 단일 발화에 대해 미세 조정됨공개 데이터셋을 사용하여 미세 조정 프로세스 시뮬레이션:
각 샘플 (xi, yi), i = 1,...,n에 대해:
1. 샘플 xi에서 전역 모델 Wg 미세 조정
2. 섀도우 모델 Wi 획득
3. 레이블이 지정된 데이터셋 {(Wi, yi)} 구성
각 매개변수 텐서 p ∈ Wi에서 통계 요약 추출:
zi = concat([μp, σp, min(p), max(p)] for each p ∈ Wi)
여기서 zi ∈ Rd는 고정 길이 특성 벡터입니다.
각 클래스의 중심 계산:
z̄c = (1/Nc) ∑(i=1 to Nc) zi, where zi ∈ class c
대상 모델 Ws에 대해 특성 벡터 zs를 추출하고 정규화된 유클리드 거리를 사용하여 분류:
ĉ = argmin_c (||zs - z̄c||2 / (||zs||2 · ||z̄c||2))
비모수 방법 : 복잡한 분류기 훈련 불필요, 통계 요약 및 거리 측정만 사용가중치 차이 분석 : 모델 매개변수 변화에서 직접 속성 정보 추출확장성 : 방법이 자연스럽게 다중 클래스 설정으로 확장됨실용성 : 공격에 필요한 계산 자원 및 데이터량이 상대적으로 적음속성 데이터셋 샘플 수 설명 성별, 나이, 억양 Speech Accent Archive (SAA) 200 제어된 녹음, 동일한 스크립트 조음 장애 TORGO 15 화자 8명 장애, 7명 정상 감정 RAVDESS 24 화자 전문 배우의 감정 음성
성별 감지 : 200명의 모국어 영어 화자, 남성 100명 여성 100명, 75/25 훈련 테스트 분할나이 감지 : 18-24세 vs 35-44세, 70명의 남성 화자, 5-폴드 교차 검증억양 감지 : 200명의 화자, 모국어 vs 비모국어 영어 사용자감정 감지 : 세 가지 이진 분류 작업(침착함 vs 분노, 행복 vs 슬픔, 침착함 vs 두려움)조음 장애 감지 : 화자 제외 교차 검증Wav2Vec2-Base : 9,500만 매개변수, LibriSpeech 사전 훈련HuBERT-Large : 3억 매개변수, LibriSpeech 훈련Whisper-Small : 2.44억 매개변수, 68만 시간 다국어 데이터 훈련작업 Wav2Vec2 HuBERT Whisper 성별 감지 64% 63% 46% 나이 감지 100% 97% 94% 억양 감지 100% 80% 93% 조음 장애 59% 76% 81% 감정: 침착함 vs 분노 52% 67% 83% 감정: 행복 vs 슬픔 50% 54% 75% 감정: 침착함 vs 두려움 46% 48% 73%
속성 차이 현저함 : 나이와 억양이 가장 강한 유출을 보임(80-100% 정확도), 성별이 가장 예측하기 어려움(46-64%)모델 차이 : Whisper는 성별을 제외한 모든 속성에서 >70%의 유출 정확도를 나타냄통계적 유의성 : 나이 감지 결과는 모든 모델에서 통계적 유의성 달성(95% 신뢰 구간)Wav2Vec2의 계층별 분석을 통해 발견:
나이 정보 : 모든 계층에서 일관된 높은 감지율 유지감정 및 조음 장애 : 중후반 계층에서 더 큰 변동성 표시계층 특이성 : 특정 계층의 성능이 때때로 전체 모델 추론을 초과10개의 가장 일반적인 억양에 대한 다중 클래스 분류 실험:
공격 전 : 모든 테스트 억양에서 ≥90% 정확도 달성방어 후 : 다양한 억양 데이터에 대한 미세 조정 후 공격 성공률이 <20%로 감소일반화 능력 : 보지 못한 억양(일본어, 이탈리아어, 독일어, 폴란드어, 마케도니아어)에 대해서도 높은 공격 성공률 유지멤버십 추론 공격 : Shokri 등이 기계 학습 모델에 대한 멤버십 추론 공격 최초 제시협업 학습 유출 : Melis 등이 협업 학습에서의 의도하지 않은 특성 유출 연구음성 영역 공격 : 이전 연구는 주로 화자 재식별 및 멤버십 추론에 중점전통적 방법 : 원본 음성 신호 기반 속성 인식개인정보 보호 : 음성 데이터의 민감성 및 개인정보 보호 필요성본 논문의 기여 : 모델 가중치만을 통한 속성 추론에 최초 중점취약성 확인 : 연합 ASR 모델은 가중치 업데이트를 통해 개인 속성 유출 위험이 실제로 존재합니다속성 관련성 : 유출 정도는 속성이 사전 훈련 데이터에서 대표되는 정도와 밀접한 관련이 있습니다방어 전략 : 사전 훈련 데이터 다양화는 알려진 속성의 유출을 효과적으로 완화할 수 있습니다실험 규모 : 일부 작업의 샘플 크기가 작아 결과의 일반화 가능성에 영향을 미칠 수 있습니다언어 제한 : 주로 영어 음성에 중점을 두었으며, 다국어 환경에서의 유출 상황은 추가 연구가 필요합니다공격 모델 : 수동적 공격자만 고려하며, 능동적 공격은 더 심각한 유출을 초래할 수 있습니다현실적 제약 : 단일 발화 미세 조정 가정은 실제 연합 학습 시나리오와 완전히 일치하지 않을 수 있습니다방어 메커니즘 : 차등 개인정보 보호, 안전한 집계 등 더 효과적인 개인정보 보호 기술 개발다국어 연구 : 다국어 및 언어 간 시나리오로 확대동적 방어 : 속성 유출을 실시간으로 감지하고 방어하는 방법 연구이론적 분석 : 속성 유출의 근본 원인을 이론적 관점에서 분석연구 의의 중대 : 연합 ASR 모델의 속성 유출 취약성을 최초로 체계적으로 규명하여 개인정보 보호에 중요한 의의가 있습니다방법 설계 합리적 : 공격 방법이 간단하고 효과적이며, 위협 모델이 현실적으로 신뢰할 수 있습니다실험 포괄적 : 다양한 속성, 여러 모델 및 상세한 분석 실험을 포함합니다통찰 심층적 : 사전 훈련 데이터 다양성과 개인정보 보호의 중요한 관련성을 발견합니다실용적 가치 : 연합 학습 시스템의 개인정보 보호에 중요한 지침을 제공합니다데이터셋 제한 : 일부 실험에서 사용된 데이터셋 규모가 작아 결과의 통계적 신뢰성에 영향을 미칠 수 있습니다공격 가정 : 단일 발화 미세 조정 가정이 과도하게 단순화되어 있으며, 실제 응용에서는 일반적으로 더 많은 데이터를 사용합니다방어 평가 : 방어 방법에 대한 평가가 상대적으로 제한적이며, 더 포괄적인 보안 분석이 필요합니다계산 복잡도 : 공격의 계산 비용 및 실행 가능성에 대한 상세한 분석이 부족합니다학술적 기여 : 연합 학습 개인정보 보호 연구에 새로운 방향을 개척하여 더 많은 관련 연구를 촉발할 것으로 예상됩니다실무 지침 : 산업계가 연합 ASR 시스템을 배포할 때 중요한 보안 고려사항을 제공합니다정책 영향 : 연구 결과는 관련 개인정보 보호 법규의 제정 및 시행에 영향을 미칠 수 있습니다기술 추진 : 더 안전한 연합 학습 알고리즘 및 개인정보 보호 기술 개발을 촉진합니다연합 ASR 시스템 : 다양한 연합 음성 인식 응용의 보안 평가에 직접 적용 가능개인정보 보호 감사 : 개인정보 보호 시스템의 보안 감사 도구로 사용 가능모델 설계 : 더 안전한 음성 모델 설계에 중요한 참고 자료 제공규제 준수 : 조직이 음성 AI 시스템의 준수성을 평가하고 보장하는 데 도움Baevski et al. "wav2vec 2.0: A framework for self-supervised learning of speech representations." NeurIPS 2020. Hsu et al. "HuBERT: Self-supervised speech representation learning by masked prediction of hidden units." IEEE/ACM TASLP 2021. Radford et al. "Robust speech recognition via large-scale weak supervision." ICML 2023. Shokri et al. "Membership inference attacks against machine learning models." IEEE S&P 2017. Melis et al. "Exploiting unintended feature leakage in collaborative learning." IEEE S&P 2019. 본 논문은 연합 학습이 음성 영역에서 가지는 중요한 개인정보 보호 위험을 규명하여 더 안전한 음성 AI 시스템 구축을 위한 귀중한 통찰과 지침을 제공합니다. 본 연구는 중요한 학술적 가치뿐만 아니라 실제 응용에 심원한 영향을 미칩니다.