An information theorist's tour of differential privacy
Sarwate, Calmon, Kosut et al.
Since being proposed in 2006, differential privacy has become a standard method for quantifying certain risks in publishing or sharing analyses of sensitive data. At its heart, differential privacy measures risk in terms of the differences between probability distributions, which is a central topic in information theory. A differentially private algorithm is a channel between the underlying data and the output of the analysis. Seen in this way, the guarantees made by differential privacy can be understood in terms of properties of this channel. In this article we examine a few of the key connections between information theory and the formulation/application of differential privacy, giving an ``operational significance'' for relevant information measures.
منذ اقتراحها في عام 2006، أصبحت الخصوصية التفاضلية الطريقة المعيارية لتحديد كمية المخاطر المرتبطة بنشر أو مشاركة البيانات الحساسة للتحليل. يكمن جوهر الخصوصية التفاضلية في قياس المخاطر من خلال الاختلافات بين التوزيعات الاحتمالية، وهي موضوع أساسي في نظرية المعلومات. تمثل خوارزميات الخصوصية التفاضلية قناة بين البيانات الأساسية والمخرجات التحليلية. من هذا المنظور، يمكن فهم الضمانات التي توفرها الخصوصية التفاضلية من خلال خصائص هذه القناة. تستكشف هذه الورقة عدة روابط رئيسية بين نظرية المعلومات وصياغة/تطبيق الخصوصية التفاضلية، مما يوفر "معنى تشغيليًا" لمقاييس المعلومات ذات الصلة.
النظرية الأساسية للخصوصية التفاضلية (Dwork وآخرون)
النتائج الكلاسيكية لنظرية المعلومات (Csiszár, Rényi وآخرون)
طرق محاسبة الخصوصية (طرق عددية وتحليلية مختلفة)
تطبيقات التعلم الآلي (DP-SGD وغيرها)
التطورات الأخيرة (البيانات الاصطناعية، اختيار المعاملات وغيرها)
توفر هذه الورقة منظورًا شاملاً لنظرية المعلومات للخصوصية التفاضلية، وهي مساهمة نظرية مهمة في هذا المجال. من خلال اعتبار خوارزميات الخصوصية التفاضلية كقنوات، نجح المؤلفون في تطبيق أدوات نظرية المعلومات لتحليل وتحسين آليات الخصوصية، مما يوفر رؤى قيمة للبحث النظري والتطبيقات العملية على حد سواء.