2025-11-11T12:07:09.802097

Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach

Huang, Zhang, Mumtaz

Membership inference attacks (MIAs) test whether a data point was part of a model's training set, posing serious privacy risks. Existing methods often depend on shadow models or heavy query access, which limits their practicality. We propose GP-MIA, an efficient and interpretable approach based on Gaussian process (GP) meta-modeling. Using post-hoc metrics such as accuracy, entropy, dataset statistics, and optional sensitivity features (e.g. gradients, NTK measures) from a single trained model, GP-MIA trains a GP classifier to distinguish members from non-members while providing calibrated uncertainty estimates. Experiments on synthetic data, real-world fraud detection data, CIFAR-10, and WikiText-2 show that GP-MIA achieves high accuracy and generalizability, offering a practical alternative to existing MIAs.

academic

गॉसियन प्रक्रिया मेटा-मॉडलिंग के माध्यम से प्रशिक्षण डेटा सदस्यता अनुमान: एक पोस्ट-हॉक विश्लेषण दृष्टिकोण

मूल जानकारी

पेपर ID: 2510.21846
शीर्षक: Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach
लेखक: Yongchao Huang, Pengfei Zhang, Shahzad Mumtaz
वर्गीकरण: cs.LG cs.AI
प्रकाशन समय: मई 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2510.21846

सारांश

सदस्यता अनुमान हमले (MIAs) यह परीक्षण करते हैं कि क्या डेटा बिंदु किसी मॉडल के प्रशिक्षण सेट का हिस्सा हैं, जो गंभीर गोपनीयता जोखिम का प्रतिनिधित्व करते हैं। मौजूदा विधियां आमतौर पर छाया मॉडल या बड़ी संख्या में क्वेरी एक्सेस पर निर्भर करती हैं, जो उनकी व्यावहारिकता को सीमित करती है। यह पेपर GP-MIA प्रस्तावित करता है, जो गॉसियन प्रक्रिया (GP) मेटा-मॉडलिंग पर आधारित एक कुशल और व्याख्यायोग्य विधि है। एकल प्रशिक्षण मॉडल से पोस्ट-हॉक मेट्रिक्स (जैसे सटीकता, एंट्रॉपी, डेटासेट सांख्यिकी और वैकल्पिक संवेदनशीलता विशेषताएं जैसे ग्रेडिएंट, NTK माप) का उपयोग करके, GP-MIA एक GP वर्गीकारक को प्रशिक्षित करता है जो सदस्यों और गैर-सदस्यों को अलग करता है, साथ ही अंशांकित अनिश्चितता अनुमान भी प्रदान करता है। सिंथेटिक डेटा, वास्तविक दुनिया के धोखाधड़ी पहचान डेटा, CIFAR-10 और WikiText-2 पर प्रयोग दर्शाते हैं कि GP-MIA उच्च सटीकता और सामान्यीकरण क्षमता प्राप्त करता है, जो मौजूदा MIAs के लिए एक व्यावहारिक विकल्प प्रदान करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

यह अनुसंधान मशीन लर्निंग मॉडल में सदस्यता अनुमान हमले की समस्या को हल करने का लक्ष्य रखता है। एक प्रशिक्षित मॉडल fθ* और एक परीक्षण नमूना जोड़ी (x,y) दी गई है, लक्ष्य एक अनुमान नियम M(fθ*, x, y) ∈ {0,1} डिजाइन करना है जो यह निर्धारित करता है कि क्या नमूना प्रशिक्षण सेट से संबंधित है।

समस्या की महत्ता

सदस्यता अनुमान हमले गोपनीयता के लिए गंभीर खतरा पैदा करते हैं, विशेष रूप से चिकित्सा, वित्त या सुरक्षा जैसे संवेदनशील क्षेत्रों में, केवल यह प्रकट करना कि क्या व्यक्तिगत रिकॉर्ड प्रशिक्षण के लिए उपयोग किए गए थे, गोपनीयता उल्लंघन का गठन कर सकते हैं। गहरे तंत्रिका नेटवर्क इस तरह के हमलों के लिए असुरक्षित हैं क्योंकि वे प्रशिक्षण डेटा और अदेखे डेटा पर व्यवस्थित व्यवहार अंतर प्रदर्शित करते हैं।

मौजूदा विधियों की सीमाएं

छाया मॉडल विधि: लक्ष्य व्यवहार को अनुकरण करने के लिए कई सहायक मॉडल को प्रशिक्षित करने की आवश्यकता है, उच्च कम्प्यूटेशनल लागत
संभावना अनुपात हमले (LiRA): मॉडल को कई बार क्वेरी करने और अंशांकन के लिए बड़ी कम्प्यूटेशनल संसाधनों की आवश्यकता है
व्यावहारिकता सीमाएं: मौजूदा विधियों को आमतौर पर बड़ी कम्प्यूटेशनल संसाधनों, सावधानीपूर्वक योजनाबद्ध सहायक डेटा या लक्ष्य मॉडल के कई क्वेरी की आवश्यकता होती है

अनुसंधान प्रेरणा

यह पेपर एक कुशल विधि प्रस्तावित करता है जिसे केवल एकल प्रशिक्षण मॉडल के पोस्ट-हॉक एक्सेस की आवश्यकता है, पुनः प्रशिक्षण या आंतरिक एक्सेस से बचता है, साथ ही अंशांकित अनिश्चितता अनुमान प्रदान करता है, दक्षता और व्याख्यायोग्यता को बढ़ाता है।

मुख्य योगदान

GP-MIA ढांचा प्रस्तावित करना: गॉसियन प्रक्रिया मेटा-मॉडलिंग पर आधारित नई पोस्ट-हॉक सदस्यता अनुमान हमले विधि
बहु-स्तरीय विशेषता प्रणाली डिजाइन करना: मूल विशेषताओं (प्रदर्शन मेट्रिक्स, आत्मविश्वास), ग्रेडिएंट विशेषताओं और NTK विशेषताओं का एकीकृत प्रतिनिधित्व
कुशल अनुमान लागू करना: केवल एकल फॉरवर्ड पास (वैकल्पिक बैकवर्ड पास) की आवश्यकता है, छाया मॉडल प्रशिक्षण से बचता है
अनिश्चितता परिमाणीकरण प्रदान करना: GP वर्गीकारक स्वाभाविक रूप से अंशांकित संभाव्यता भविष्यवाणी और अनिश्चितता अनुमान प्रदान करता है
क्रॉस-डोमेन सामान्यीकरण क्षमता सत्यापित करना: सिंथेटिक डेटा, धोखाधड़ी पहचान, छवि वर्गीकरण और भाषा मॉडलिंग के चार अलग-अलग डोमेन में प्रभावशीलता सत्यापित करना

विधि विवरण

कार्य परिभाषा

प्रशिक्षित पर्यवेक्षित मॉडल fθ*: Rd → Rm दिया गया है, सदस्यता अनुमान कार्य एक फ़ंक्शन M(fθ*, x, y) डिजाइन करना है जो यह निर्धारित करता है कि क्या परीक्षण नमूना (x,y) प्रशिक्षण सेट X = {(xi, yi)}ni=1 से संबंधित है।

मॉडल आर्किटेक्चर

विशेषता निर्माण

GP-MIA तीन वर्गों की नैदानिक विशेषताओं को निकालता है:

मूल विशेषताएं ϕcommon(x):
- प्रदर्शन मेट्रिक्स: वर्गीकरण सटीकता या प्रतिगमन MSE
- आत्मविश्वास माप: भविष्यवाणी संभावना का औसत एंट्रॉपी
- इनपुट सांख्यिकी: विशेषता माध्य और विचरण
- व्यतिक्रमण परिमाण: सूक्ष्म-ट्यूनिंग से पहले और बाद में मॉडल वजन का ℓ2 दूरी
ग्रेडिएंट विशेषताएं ϕgrad(x):
```
ϕgrad(x) = [∥gθ(x)∥F, ∥Jx(x)∥F, ℓ(fθ*(x), y), ∥gℓ(x, y)∥2]
```
जहां gθ(x) = ∇θfθ*(x) पैरामीटर जैकोबियन मैट्रिक्स है, Jx(x) = ∂fθ*(x)/∂x इनपुट जैकोबियन मैट्रिक्स है
NTK विशेषताएं ϕntk(x):
```
ϕntk(x) = [τλ(x), ∥hλ(x)∥2, maxi|hλ(x)i|, smax(x), s̄(x)]
```
तंत्रिका स्पर्शरेखा कर्नल kθ*(x, x') = gθ(x)gθ(x')⊤ के आधार पर लीवरेज स्कोर और प्रक्षेपण सांख्यिकी

GP वर्गीकारक

RBF + सफेद शोर कर्नल के साथ गॉसियन प्रक्रिया वर्गीकारक का उपयोग:

k(x,x') = σ² exp(-1/(2ℓ²) ∥x-x'∥²)

द्विआधारी वर्गीकरण के लिए, GP बर्नौली संभावना के साथ संयुक्त:

p(y* = 1 | x*,D) = ∫ σ(f(x*)) p(f(x*) | x*,D) df(x*)

तकनीकी नवाचार बिंदु

पोस्ट-हॉक विश्लेषण प्रतिमान: छाया मॉडल प्रशिक्षण और दोहराई गई क्वेरी के ओवरहेड से बचता है
बहु-मोडल विशेषता संलयन: प्रदर्शन, सांख्यिकीय और संवेदनशीलता विशेषताओं को जोड़कर समृद्ध सदस्यता संकेत प्रदान करता है
अनिश्चितता परिमाणीकरण: GP ढांचा स्वाभाविक रूप से अंशांकित संभाव्यता भविष्यवाणी प्रदान करता है
मॉडल अज्ञेयवाद: विभिन्न पर्यवेक्षित शिक्षण मॉडल पर लागू होता है

प्रयोगात्मक सेटअप

डेटासेट

सिंथेटिक वर्गीकरण डेटा: scikit-learn का उपयोग करके उत्पन्न, 2000 संतुलित नमूनों के साथ 2-क्लस्टर गॉसियन मिश्रण
क्रेडिट कार्ड धोखाधड़ी पहचान: OpenML सार्वजनिक डेटासेट, 284,807 लेनदेन, केवल 492 सकारात्मक उदाहरण
CIFAR-10: छवि वर्गीकरण, CNN मॉडल को 20 epoch के लिए प्रशिक्षित किया गया
WikiText-2: भाषा मॉडलिंग, कॉम्पैक्ट GPT-2 शैली मॉडल (3 परत, 4 सिर, 192 आयामी एम्बेडिंग)

मूल्यांकन मेट्रिक्स

AUROC: रिसीवर ऑपरेटिंग विशेषता वक्र के तहत क्षेत्र
AUPR: सटीकता-रिकॉल वक्र के तहत क्षेत्र
TPR@1%FPR: 1% झूठी सकारात्मक दर पर सच्ची सकारात्मक दर
भ्रम मैट्रिक्स: सटीकता और रिकॉल

तुलना विधियां

मुख्य रूप से पारंपरिक छाया मॉडल विधि और LiRA विधि के साथ वैचारिक तुलना, GP-MIA की दक्षता लाभ को प्रदर्शित करने पर ध्यान केंद्रित करता है।

कार्यान्वयन विवरण

GP प्रशिक्षण परिवर्तनशील अनुमान का उपयोग करता है
RBF + सफेद शोर कर्नल
विशेषता मानकीकरण
प्रशिक्षण सेट 80%, परीक्षण सेट 20%

प्रयोगात्मक परिणाम

मुख्य परिणाम

सिंथेटिक डेटा: GP विभिन्न सदस्य/गैर-सदस्य वितरणों के अनुकूल हो सकता है, सीमांत मामलों में उपयुक्त अनिश्चितता प्रदर्शित करता है
धोखाधड़ी पहचान:
- AUROC = 0.959
- AUPR = 0.961
- TPR@1%FPR = 0.60
- सदस्य संभावना माध्य ≈ 0.81, गैर-सदस्य ≈ 0.25
CIFAR-10:
- प्रशिक्षण सदस्य डेटासेट: संभावना 0.93
- नया CIFAR-10 डेटासेट: संभावना 0.84
- SVHN/संवर्धित डेटासेट: संभावना ≈ 0.04
- प्रक्षेप डेटासेट: संभावना 0.37
WikiText-2:
- AUROC = 1.000
- AUPR = 1.000
- TPR@1%FPR = 1.000
- शून्य गलत वर्गीकरण, पूर्ण पृथक्करण

विलोपन प्रयोग

दो सिंथेटिक प्रयोगों के माध्यम से GP वर्गीकारक की अनुकूलन क्षमता सत्यापित करना:

बड़े पृथक्करण प्रयोग: जब सदस्य और गैर-सदस्य वितरण में बड़ा अंतर हो, तो GP स्पष्ट वर्गीकरण क्षमता प्रदर्शित करता है
छोटे पृथक्करण प्रयोग: सदस्य वितरण के करीब अधिक गैर-सदस्य डेटा जोड़ने के बाद, GP अस्पष्ट मामलों को बेहतर ढंग से अलग कर सकता है

केस विश्लेषण

t-SNE और PCA दृश्य विशेषता स्थान में सदस्यों और गैर-सदस्यों की पृथक्करणीयता दिखाते हैं
संभाव्यता वितरण ग्राफ GP भविष्यवाणी की द्विमोडल वितरण विशेषता दिखाते हैं
अनिश्चितता परिमाणीकरण सीमांत मामलों में अच्छा प्रदर्शन करता है

प्रयोगात्मक निष्कर्ष

मूल विशेषताएं पहले से ही मजबूत भेदभावपूर्ण संकेत प्रदान करती हैं
संवेदनशीलता विशेषताएं जटिल मॉडल (जैसे भाषा मॉडल) में प्रदर्शन को और बढ़ाती हैं
GP ढांचा विभिन्न वितरण बदलाव के तहत मजबूत रहता है
भाषा मॉडल सदस्यता जानकारी का सबसे स्पष्ट रिसाव करते हैं

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

GP-MIA एक लचीली और डेटा-कुशल सदस्यता अनुमान ढांचा प्रदान करता है, जो पोस्ट-हॉक तरीके से छाया मॉडल ओवरहेड से बचता है, साथ ही सूचनापूर्ण वितरण संकेत भी कैप्चर करता है।

सीमाएं

स्केलेबिलिटी: GP प्रशिक्षण जटिलता O(N³) है, बड़े डेटासेट के लिए चुनौतीपूर्ण हो सकता है
विशेषता निर्भरता: प्रदर्शन विशेषता इंजीनियरिंग गुणवत्ता पर निर्भर करता है
मॉडल एक्सेस: अभी भी लक्ष्य मॉडल के क्वेरी एक्सेस की आवश्यकता है
रक्षा विचार: पेपर में प्रतिकूल रक्षा विधियों की गहन खोज नहीं की गई है

भविष्य की दिशाएं

वैकल्पिक कर्नल चयन की खोज करना
बड़े पैमाने पर मॉडल के लिए स्केलेबल सन्निकटन विकसित करना
व्यापक गोपनीयता रक्षा ढांचे में एकीकृत करना
अधिक समृद्ध विशेषता स्थान का अध्ययन करना

गहन मूल्यांकन

शक्तियां

विधि नवाचार: सदस्यता अनुमान के लिए पहली बार GP का उपयोग, नई तकनीकी पथ प्रदान करता है
प्रयोगात्मक पूर्णता: चार अलग-अलग डोमेन में सत्यापन, अच्छी सामान्यीकरण क्षमता प्रदर्शित करता है
व्यावहारिक मूल्य: छाया मॉडल प्रशिक्षण से बचता है, हमले की लागत को कम करता है
अनिश्चितता परिमाणीकरण: GP ढांचा स्वाभाविक रूप से संभाव्यता भविष्यवाणी प्रदान करता है, व्याख्यायोग्यता बढ़ाता है
लेखन स्पष्टता: विधि विवरण स्पष्ट, प्रयोगात्मक डिजाइन तर्कसंगत

कमियां

सैद्धांतिक विश्लेषण की कमी: यह समझाने के लिए सैद्धांतिक विश्लेषण की कमी है कि GP इस कार्य के लिए विशेष रूप से उपयुक्त क्यों है
सीमित रक्षा चर्चा: इस तरह के हमलों से कैसे बचाव किया जाए, इस पर पर्याप्त खोज नहीं की गई है
स्केलेबिलिटी समस्या: GP की घन जटिलता बड़े पैमाने पर अनुप्रयोग को सीमित कर सकती है
विशेषता चयन: विशेषता इंजीनियरिंग को अभी भी मैनुअल डिजाइन की आवश्यकता है, स्वचालन की डिग्री सीमित है
तुलना प्रयोग: मौजूदा SOTA विधियों के साथ प्रत्यक्ष संख्यात्मक तुलना की कमी

प्रभाव

शैक्षणिक योगदान: सदस्यता अनुमान हमले के लिए नई तकनीकी दिशा प्रदान करता है
व्यावहारिक मूल्य: विधि सरल और कुशल है, कार्यान्वयन और तैनाती में आसान है
पुनरुत्पादनीयता: एल्गोरिथम विवरण विस्तृत, प्रयोगात्मक सेटअप स्पष्ट है
प्रेरणा: GP मेटा-मॉडलिंग विचार अन्य गोपनीयता हमले अनुसंधान को प्रेरित कर सकता है

लागू परिदृश्य

गोपनीयता ऑडिट: तैनात मॉडल के गोपनीयता जोखिम का मूल्यांकन करना
मॉडल निदान: वितरण बदलाव और सामान्यीकरण समस्याओं का पता लगाना
रक्षा अनुसंधान: रक्षा विधियों का मूल्यांकन करने के लिए हमले के बेंचमार्क के रूप में कार्य करना
ब्लैक-बॉक्स सेटिंग: केवल मॉडल आउटपुट एक्सेस की आवश्यकता वाले परिदृश्य

संदर्भ

Shokri et al. (2017) - छाया मॉडल सदस्यता अनुमान हमले
Carlini et al. (2022) - संभावना अनुपात हमले (LiRA)
Rasmussen & Williams (2006) - गॉसियन प्रक्रिया मशीन लर्निंग
Ye et al. (2022) - संवर्धित सदस्यता अनुमान हमले
Hu et al. (2022) - सदस्यता अनुमान हमले सर्वेक्षण

यह पेपर गॉसियन प्रक्रिया पर आधारित एक नवाचारी सदस्यता अनुमान हमले विधि प्रस्तावित करता है, जो उच्च सटीकता बनाए रखते हुए दक्षता और व्यावहारिकता में महत्वपूर्ण सुधार करता है। कुछ सैद्धांतिक और प्रयोगात्मक कमियों के बावजूद, इसके मुख्य विचार और प्रयोगात्मक परिणाम गोपनीयता हमले अनुसंधान के लिए मूल्यवान योगदान प्रदान करते हैं।