An information theorist's tour of differential privacy
Sarwate, Calmon, Kosut et al.
Since being proposed in 2006, differential privacy has become a standard method for quantifying certain risks in publishing or sharing analyses of sensitive data. At its heart, differential privacy measures risk in terms of the differences between probability distributions, which is a central topic in information theory. A differentially private algorithm is a channel between the underlying data and the output of the analysis. Seen in this way, the guarantees made by differential privacy can be understood in terms of properties of this channel. In this article we examine a few of the key connections between information theory and the formulation/application of differential privacy, giving an ``operational significance'' for relevant information measures.
2006 में प्रस्तावित होने के बाद से, अवकल गोपनीयता संवेदनशील डेटा प्रकाशन या साझा विश्लेषण में कुछ जोखिमों को मापने का एक मानक तरीका बन गई है। अवकल गोपनीयता का मूल संभाव्यता वितरण के बीच अंतर के माध्यम से जोखिम को मापना है, जो सूचना सिद्धांत का एक केंद्रीय विषय है। अवकल गोपनीयता एल्गोरिदम अंतर्निहित डेटा और विश्लेषण आउटपुट के बीच एक चैनल है। इस दृष्टिकोण से, अवकल गोपनीयता द्वारा प्रदान की गई गारंटियों को इस चैनल के गुणों के माध्यम से समझा जा सकता है। यह पेपर सूचना सिद्धांत और अवकल गोपनीयता के निर्माण/अनुप्रयोग के बीच कई महत्वपूर्ण संबंधों की जांच करता है, संबंधित सूचना उपायों के लिए "संचालन अर्थ" प्रदान करता है।
गोपनीयता सुरक्षा की आवश्यकता: बिग डेटा युग के आगमन के साथ, व्यक्तिगत गोपनीयता की सुरक्षा करते हुए उपयोगी डेटा विश्लेषण परिणाम प्रकाशित करना एक महत्वपूर्ण चुनौती बन गई है
सैद्धांतिक आधार की कमी: मौजूदा गोपनीयता सुरक्षा विधियों में कठोर सैद्धांतिक आधार और संचालन योग्य जोखिम परिमाणीकरण विधियों की कमी है
अंतःविषय संबंध: अवकल गोपनीयता और सूचना सिद्धांत के बीच गहरे संबंध हैं, लेकिन व्यवस्थित सैद्धांतिक विश्लेषण की कमी है
सैद्धांतिक ढांचा स्थापित करना: अवकल गोपनीयता और सूचना सिद्धांत के बीच संबंधों को व्यवस्थित रूप से स्पष्ट करना, अवकल गोपनीयता एल्गोरिदम को चैनल के रूप में देखना
परिकल्पना परीक्षण दृष्टिकोण: परिकल्पना परीक्षण के दृष्टिकोण से अवकल गोपनीयता परिभाषा की पुनर्व्याख्या करना, संचालन समझ प्रदान करना
विचलन सिद्धांत अनुप्रयोग: f-विचलन और अवकल गोपनीयता के संबंध का गहन विश्लेषण, विशेष रूप से हॉकी-स्टिक विचलन
गोपनीयता लेखांकन विधि: गोपनीयता हानि वितरण (PLD) के आधार पर संयोजन विश्लेषण विधियों को सारांशित करना
तंत्र अनुकूलन सिद्धांत: अवकल गोपनीयता तंत्र अनुकूलन के लिए सूचना सिद्धांत ढांचा और विशिष्ट एल्गोरिदम प्रदान करना
पेपर में 77 महत्वपूर्ण साहित्य का उद्धरण है, जिसमें शामिल हैं:
अवकल गोपनीयता मूल सिद्धांत (Dwork आदि)
सूचना सिद्धांत शास्त्रीय परिणाम (Csiszár, Rényi आदि)
गोपनीयता लेखांकन विधियां (विभिन्न संख्यात्मक और विश्लेषणात्मक विधियां)
मशीन लर्निंग अनुप्रयोग (DP-SGD आदि)
नवीनतम प्रगति (संश्लेषित डेटा, पैरामीटर चयन आदि)
यह पेपर अवकल गोपनीयता के लिए एक व्यापक सूचना सिद्धांत दृष्टिकोण प्रदान करता है, जो इस क्षेत्र का एक महत्वपूर्ण सैद्धांतिक योगदान है। अवकल गोपनीयता एल्गोरिदम को चैनल के रूप में देखकर, लेखकों ने सफलतापूर्वक सूचना सिद्धांत उपकरणों को गोपनीयता तंत्र के विश्लेषण और अनुकूलन के लिए लागू किया है, सैद्धांतिक अनुसंधान और व्यावहारिक अनुप्रयोग दोनों के लिए मूल्यवान अंतर्दृष्टि प्रदान करता है।