Defending Diffusion Models Against Membership Inference Attacks via Higher-Order Langevin Dynamics
Sterling, El-Laham, Bugallo
Recent advances in generative artificial intelligence applications have raised new data security concerns. This paper focuses on defending diffusion models against membership inference attacks. This type of attack occurs when the attacker can determine if a certain data point was used to train the model. Although diffusion models are intrinsically more resistant to membership inference attacks than other generative models, they are still susceptible. The defense proposed here utilizes critically-damped higher-order Langevin dynamics, which introduces several auxiliary variables and a joint diffusion process along these variables. The idea is that the presence of auxiliary variables mixes external randomness that helps to corrupt sensitive input data earlier on in the diffusion process. This concept is theoretically investigated and validated on a toy dataset and a speech dataset using the Area Under the Receiver Operating Characteristic (AUROC) curves and the FID metric.
academic
विसरण मॉडल को उच्च-क्रम लैंजविन गतिविज्ञान के माध्यम से सदस्यता अनुमान हमलों से बचाना
यह पेपर जनरेटिव कृत्रिम बुद्धिमत्ता अनुप्रयोगों में उत्पन्न होने वाली नई डेटा सुरक्षा समस्याओं को संबोधित करता है, विशेष रूप से विसरण मॉडल को सदस्यता अनुमान हमलों (MIA) से बचाने पर ध्यान केंद्रित करता है। सदस्यता अनुमान हमला एक ऐसा हमला है जिसमें हमलावर यह निर्धारित कर सकता है कि क्या कोई विशेष डेटा बिंदु मॉडल को प्रशिक्षित करने के लिए उपयोग किया गया था। हालांकि विसरण मॉडल अन्य जनरेटिव मॉडल की तुलना में सदस्यता अनुमान हमलों के प्रति आंतरिक रूप से अधिक प्रतिरोधी हैं, फिर भी कमजोरियां मौजूद हैं। इस पेपर में प्रस्तावित रक्षा विधि गंभीर रूप से अवमंदित उच्च-क्रम लैंजविन गतिविज्ञान (HOLD++) का उपयोग करती है, जो कई सहायक चर और इन चर के साथ संयुक्त विसरण प्रक्रिया को पेश करती है। मूल विचार यह है कि सहायक चर की उपस्थिति बाहरी यादृच्छिकता को मिश्रित करती है, जो विसरण प्रक्रिया के प्रारंभिक चरण में संवेदनशील इनपुट डेटा को नष्ट करने में सहायता करती है। इस अवधारणा को सैद्धांतिक रूप से अध्ययन किया गया है और खिलौना डेटासेट और भाषण डेटासेट पर AUROC वक्र और FID मेट्रिक्स का उपयोग करके सत्यापित किया गया है।
इस अनुसंधान द्वारा समाधान की जाने वाली मूल समस्या सदस्यता अनुमान हमले (Membership Inference Attacks, MIA) का विसरण मॉडल पर खतरा है। सदस्यता अनुमान हमला एक गोपनीयता हमला है जिसमें हमलावर यह निर्धारित करने का प्रयास करता है कि क्या कोई विशेष डेटा नमूना लक्ष्य मॉडल को प्रशिक्षित करने के लिए उपयोग किया गया था।
डेटा गोपनीयता सुरक्षा की आवश्यकता: जनरेटिव AI अनुप्रयोगों के तीव्र विकास के साथ, विशेष रूप से चिकित्सा डेटा, संवेदनशील बौद्धिक संपत्ति आदि क्षेत्रों में अनुप्रयोग के साथ, प्रशिक्षण डेटा की गोपनीयता की सुरक्षा अत्यंत महत्वपूर्ण हो गई है
विसरण मॉडल की कमजोरी: हालांकि विसरण मॉडल GAN जैसे अन्य जनरेटिव मॉडल की तुलना में बेहतर आंतरिक हमला प्रतिरोध क्षमता रखते हैं, फिर भी वे बैकडोर हमलों, सदस्यता अनुमान हमलों और विरोधी हमलों के लिए असुरक्षित हैं
मौजूदा रक्षा विधियों की सीमाएं: वर्तमान मुख्य रक्षा साधन जैसे अंतर गोपनीयता विसरण मॉडल (DPDM) गोपनीयता-उपयोगिता व्यापार समस्या का सामना करते हैं, अर्थात् गोपनीयता सुरक्षा स्तर उत्पन्न नमूने की गुणवत्ता से सीधे संबंधित है
सदस्यता अनुमान हमलों की रक्षा मुख्य रूप से अंतर गोपनीयता, L2 नियमितकरण और ज्ञान आसवन को शामिल करती है। इस पेपर की प्रेरणा एक नई रक्षा रणनीति की खोज करना है, विसरण प्रक्रिया की संरचना में सुधार के माध्यम से गोपनीयता सुरक्षा को बढ़ाना, बिना सीधे डेटा वृद्धि या कठोर अंतर गोपनीयता बाधाओं के।
गंभीर रूप से अवमंदित उच्च-क्रम लैंजविन गतिविज्ञान (HOLD++) पर आधारित एक नई रक्षा ढांचा प्रस्तावित किया, सहायक चर को पेश करके सदस्यता अनुमान हमलों के प्रति प्रतिरोध को बढ़ाया
HOLD++ के लिए Rényi अंतर गोपनीयता सैद्धांतिक गारंटी स्थापित की, यह साबित किया कि गोपनीयता हानि विसरण प्रक्रिया की शुरुआत में अधिकतम तक पहुंचती है और समय के साथ एकरूप रूप से घटती है
सहायक चर और गोपनीयता सुरक्षा के बीच संबंध का खुलासा किया, यह साबित किया कि माध्य वर्ग त्रुटि को β, L^(-1) और n जैसे पैरामीटर को समायोजित करके "ट्यून" किया जा सकता है
स्विस रोल खिलौना डेटासेट और LJ Speech भाषण डेटासेट पर विधि की प्रभावशीलता का सत्यापन किया, AUROC और FID मेट्रिक्स का उपयोग करके रक्षा प्रभाव और उत्पादन गुणवत्ता का मूल्यांकन किया
इनपुट: प्रशिक्षण डेटासेट D, विसरण मॉडल पैरामीटर
आउटपुट: सदस्यता अनुमान हमलों के प्रति प्रतिरोधी विसरण मॉडल
बाधाएं: उत्पादन गुणवत्ता को बनाए रखते हुए गोपनीयता सुरक्षा को अधिकतम करना
सहायक चर पेश करने से यादृच्छिकता मिश्रण: वेग, त्वरण आदि सहायक चर को पेश करके, विसरण प्रक्रिया के प्रारंभिक चरण में अतिरिक्त यादृच्छिकता को पेश किया जाता है, जिससे हमलावर के लिए मूल डेटा का सटीक अनुमान लगाना कठिन हो जाता है
गैर-नियतात्मक स्कोर फ़ंक्शन: HOLD++ का स्कोर नेटवर्क केवल अंतिम सहायक चर के स्कोर को मॉडल करता है, जिससे पूरी तरह से नियतात्मक हमला असंभव हो जाता है
सैद्धांतिक गोपनीयता गारंटी: कठोर Rényi अंतर गोपनीयता विश्लेषण प्रदान करता है, गोपनीयता हानि की ऊपरी सीमा को साबित करता है
CIFAR-10 पर अप्रत्याशित परिणाम: छवि डेटासेट पर AUROC 0.5 के करीब है, जो दर्शाता है कि निरंतर समय विसरण मॉडल स्वयं MIA के प्रति मजबूत प्रतिरोध क्षमता रखते हैं
भाषण डेटा की विशेषता: मेल स्पेक्ट्रोग्राम छवियों की तुलना में डेटा वृद्धि के लिए अधिक कठिन हैं, जिससे भाषण डेटा MIA हमलों के लिए अधिक असुरक्षित हो जाता है
गुणवत्ता-गोपनीयता व्यापार: उच्च-क्रम मॉडल बेहतर गोपनीयता सुरक्षा प्रदान करते समय, उच्च गुणवत्ता वाले उत्पन्न नमूने भी पैदा कर सकते हैं
यह पेपर 17 महत्वपूर्ण संदर्भों का हवाला देता है, जो विसरण मॉडल मूल सिद्धांत, सदस्यता अनुमान हमले विधियां, अंतर गोपनीयता तकनीक और उच्च-क्रम लैंजविन गतिविज्ञान आदि मुख्य क्षेत्रों के प्रतिनिधि कार्य को शामिल करते हैं, अनुसंधान के लिए मजबूत सैद्धांतिक आधार प्रदान करते हैं।
समग्र मूल्यांकन: यह विसरण मॉडल गोपनीयता सुरक्षा क्षेत्र में महत्वपूर्ण नवाचार महत्व वाला एक पेपर है। उच्च-क्रम लैंजविन गतिविज्ञान को सदस्यता अनुमान हमले रक्षा के साथ जोड़कर, एक नई और प्रभावी समाधान प्रदान करता है। हालांकि प्रयोगात्मक पैमाने और कुछ तकनीकी विवरणों में सुधार की गुंजाइश है, लेकिन इसके सैद्धांतिक योगदान और व्यावहारिक मूल्य इसे इस क्षेत्र में महत्वपूर्ण प्रगति बनाते हैं।