Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach
Huang, Zhang, Mumtaz
Membership inference attacks (MIAs) test whether a data point was part of a model's training set, posing serious privacy risks. Existing methods often depend on shadow models or heavy query access, which limits their practicality. We propose GP-MIA, an efficient and interpretable approach based on Gaussian process (GP) meta-modeling. Using post-hoc metrics such as accuracy, entropy, dataset statistics, and optional sensitivity features (e.g. gradients, NTK measures) from a single trained model, GP-MIA trains a GP classifier to distinguish members from non-members while providing calibrated uncertainty estimates. Experiments on synthetic data, real-world fraud detection data, CIFAR-10, and WikiText-2 show that GP-MIA achieves high accuracy and generalizability, offering a practical alternative to existing MIAs.
academic
गॉसियन प्रक्रिया मेटा-मॉडलिंग के माध्यम से प्रशिक्षण डेटा सदस्यता अनुमान: एक पोस्ट-हॉक विश्लेषण दृष्टिकोण
सदस्यता अनुमान हमले (MIAs) यह परीक्षण करते हैं कि क्या डेटा बिंदु किसी मॉडल के प्रशिक्षण सेट का हिस्सा हैं, जो गंभीर गोपनीयता जोखिम का प्रतिनिधित्व करते हैं। मौजूदा विधियां आमतौर पर छाया मॉडल या बड़ी संख्या में क्वेरी एक्सेस पर निर्भर करती हैं, जो उनकी व्यावहारिकता को सीमित करती है। यह पेपर GP-MIA प्रस्तावित करता है, जो गॉसियन प्रक्रिया (GP) मेटा-मॉडलिंग पर आधारित एक कुशल और व्याख्यायोग्य विधि है। एकल प्रशिक्षण मॉडल से पोस्ट-हॉक मेट्रिक्स (जैसे सटीकता, एंट्रॉपी, डेटासेट सांख्यिकी और वैकल्पिक संवेदनशीलता विशेषताएं जैसे ग्रेडिएंट, NTK माप) का उपयोग करके, GP-MIA एक GP वर्गीकारक को प्रशिक्षित करता है जो सदस्यों और गैर-सदस्यों को अलग करता है, साथ ही अंशांकित अनिश्चितता अनुमान भी प्रदान करता है। सिंथेटिक डेटा, वास्तविक दुनिया के धोखाधड़ी पहचान डेटा, CIFAR-10 और WikiText-2 पर प्रयोग दर्शाते हैं कि GP-MIA उच्च सटीकता और सामान्यीकरण क्षमता प्राप्त करता है, जो मौजूदा MIAs के लिए एक व्यावहारिक विकल्प प्रदान करता है।
यह अनुसंधान मशीन लर्निंग मॉडल में सदस्यता अनुमान हमले की समस्या को हल करने का लक्ष्य रखता है। एक प्रशिक्षित मॉडल fθ* और एक परीक्षण नमूना जोड़ी (x,y) दी गई है, लक्ष्य एक अनुमान नियम M(fθ*, x, y) ∈ {0,1} डिजाइन करना है जो यह निर्धारित करता है कि क्या नमूना प्रशिक्षण सेट से संबंधित है।
सदस्यता अनुमान हमले गोपनीयता के लिए गंभीर खतरा पैदा करते हैं, विशेष रूप से चिकित्सा, वित्त या सुरक्षा जैसे संवेदनशील क्षेत्रों में, केवल यह प्रकट करना कि क्या व्यक्तिगत रिकॉर्ड प्रशिक्षण के लिए उपयोग किए गए थे, गोपनीयता उल्लंघन का गठन कर सकते हैं। गहरे तंत्रिका नेटवर्क इस तरह के हमलों के लिए असुरक्षित हैं क्योंकि वे प्रशिक्षण डेटा और अदेखे डेटा पर व्यवस्थित व्यवहार अंतर प्रदर्शित करते हैं।
छाया मॉडल विधि: लक्ष्य व्यवहार को अनुकरण करने के लिए कई सहायक मॉडल को प्रशिक्षित करने की आवश्यकता है, उच्च कम्प्यूटेशनल लागत
संभावना अनुपात हमले (LiRA): मॉडल को कई बार क्वेरी करने और अंशांकन के लिए बड़ी कम्प्यूटेशनल संसाधनों की आवश्यकता है
व्यावहारिकता सीमाएं: मौजूदा विधियों को आमतौर पर बड़ी कम्प्यूटेशनल संसाधनों, सावधानीपूर्वक योजनाबद्ध सहायक डेटा या लक्ष्य मॉडल के कई क्वेरी की आवश्यकता होती है
यह पेपर एक कुशल विधि प्रस्तावित करता है जिसे केवल एकल प्रशिक्षण मॉडल के पोस्ट-हॉक एक्सेस की आवश्यकता है, पुनः प्रशिक्षण या आंतरिक एक्सेस से बचता है, साथ ही अंशांकित अनिश्चितता अनुमान प्रदान करता है, दक्षता और व्याख्यायोग्यता को बढ़ाता है।
GP-MIA ढांचा प्रस्तावित करना: गॉसियन प्रक्रिया मेटा-मॉडलिंग पर आधारित नई पोस्ट-हॉक सदस्यता अनुमान हमले विधि
बहु-स्तरीय विशेषता प्रणाली डिजाइन करना: मूल विशेषताओं (प्रदर्शन मेट्रिक्स, आत्मविश्वास), ग्रेडिएंट विशेषताओं और NTK विशेषताओं का एकीकृत प्रतिनिधित्व
कुशल अनुमान लागू करना: केवल एकल फॉरवर्ड पास (वैकल्पिक बैकवर्ड पास) की आवश्यकता है, छाया मॉडल प्रशिक्षण से बचता है
अनिश्चितता परिमाणीकरण प्रदान करना: GP वर्गीकारक स्वाभाविक रूप से अंशांकित संभाव्यता भविष्यवाणी और अनिश्चितता अनुमान प्रदान करता है
क्रॉस-डोमेन सामान्यीकरण क्षमता सत्यापित करना: सिंथेटिक डेटा, धोखाधड़ी पहचान, छवि वर्गीकरण और भाषा मॉडलिंग के चार अलग-अलग डोमेन में प्रभावशीलता सत्यापित करना
प्रशिक्षित पर्यवेक्षित मॉडल fθ*: Rd → Rm दिया गया है, सदस्यता अनुमान कार्य एक फ़ंक्शन M(fθ*, x, y) डिजाइन करना है जो यह निर्धारित करता है कि क्या परीक्षण नमूना (x,y) प्रशिक्षण सेट X = {(xi, yi)}ni=1 से संबंधित है।
GP-MIA एक लचीली और डेटा-कुशल सदस्यता अनुमान ढांचा प्रदान करता है, जो पोस्ट-हॉक तरीके से छाया मॉडल ओवरहेड से बचता है, साथ ही सूचनापूर्ण वितरण संकेत भी कैप्चर करता है।
Shokri et al. (2017) - छाया मॉडल सदस्यता अनुमान हमले
Carlini et al. (2022) - संभावना अनुपात हमले (LiRA)
Rasmussen & Williams (2006) - गॉसियन प्रक्रिया मशीन लर्निंग
Ye et al. (2022) - संवर्धित सदस्यता अनुमान हमले
Hu et al. (2022) - सदस्यता अनुमान हमले सर्वेक्षण
यह पेपर गॉसियन प्रक्रिया पर आधारित एक नवाचारी सदस्यता अनुमान हमले विधि प्रस्तावित करता है, जो उच्च सटीकता बनाए रखते हुए दक्षता और व्यावहारिकता में महत्वपूर्ण सुधार करता है। कुछ सैद्धांतिक और प्रयोगात्मक कमियों के बावजूद, इसके मुख्य विचार और प्रयोगात्मक परिणाम गोपनीयता हमले अनुसंधान के लिए मूल्यवान योगदान प्रदान करते हैं।