Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach
Huang, Zhang, Mumtaz
Membership inference attacks (MIAs) test whether a data point was part of a model's training set, posing serious privacy risks. Existing methods often depend on shadow models or heavy query access, which limits their practicality. We propose GP-MIA, an efficient and interpretable approach based on Gaussian process (GP) meta-modeling. Using post-hoc metrics such as accuracy, entropy, dataset statistics, and optional sensitivity features (e.g. gradients, NTK measures) from a single trained model, GP-MIA trains a GP classifier to distinguish members from non-members while providing calibrated uncertainty estimates. Experiments on synthetic data, real-world fraud detection data, CIFAR-10, and WikiText-2 show that GP-MIA achieves high accuracy and generalizability, offering a practical alternative to existing MIAs.
멤버십 추론 공격(MIAs)은 데이터 포인트가 모델 훈련 세트의 일부인지 여부를 테스트하며, 심각한 개인정보 보호 위험을 구성합니다. 기존 방법은 일반적으로 섀도우 모델이나 대량의 쿼리 접근에 의존하여 실용성을 제한합니다. 본 논문은 가우스 과정(GP) 메타 모델링을 기반으로 한 효율적이고 해석 가능한 방법인 GP-MIA를 제안합니다. 단일 훈련 모델의 사후 지표(정확도, 엔트로피, 데이터세트 통계 및 그래디언트, NTK 측정과 같은 선택적 민감도 특징)를 사용하여, GP-MIA는 GP 분류기를 훈련하여 멤버와 비멤버를 구별하면서 보정된 불확실성 추정을 제공합니다. 합성 데이터, 실제 사기 탐지 데이터, CIFAR-10 및 WikiText-2에 대한 실험은 GP-MIA가 높은 정확도와 일반화 능력을 달성하여 기존 MIAs에 대한 실용적인 대안을 제공함을 보여줍니다.
멤버십 추론 공격은 개인정보 보호에 심각한 위협을 구성하며, 특히 의료, 금융 또는 보안 등 민감한 분야에서 개인 기록이 훈련에 사용되었는지 여부를 공개하는 것만으로도 개인정보 유출을 야기할 수 있습니다. 심층 신경망은 훈련 데이터와 미확인 데이터에서 체계적인 행동 차이를 나타내기 때문에 이러한 공격에 취약합니다.
본 논문은 가우스 과정을 기반으로 한 혁신적인 멤버십 추론 공격 방법을 제안하며, 높은 정확도를 유지하면서 효율성과 실용성을 크게 향상시킵니다. 일부 이론적 및 실험적 부족에도 불구하고, 핵심 아이디어와 실험 결과는 개인정보 보호 공격 연구에 가치 있는 기여를 제공합니다.