यह पेपर प्रोजेक्टेड लैंजविन एल्गोरिदम की मिक्सिंग टाइम्स और शोर यादृच्छिक ग्रेडिएंट डिसेंट (SGD) की प्राइवेसी वक्र का अध्ययन करता है, जो गैर-विस्तारक पुनरावृत्तियों की सीमा से परे है। विशेष रूप से, लेखकों ने प्रोजेक्टेड लैंजविन एल्गोरिदम के लिए नई मिक्सिंग टाइम सीमाएं प्राप्त की हैं, जो कुछ महत्वपूर्ण मामलों में आयाम-मुक्त हैं और सटीकता में बहु-लॉगरिदमिक हैं, जो चिकनी उत्तल मामले में मौजूदा परिणामों से निकटता से मेल खाती हैं। इसके अलावा, यह पेपर सबसैम्पलिंग शोर SGD एल्गोरिदम के लिए नई प्राइवेसी वक्र ऊपरी सीमाएं स्थापित करता है। ये सीमाएं ग्रेडिएंट नियमितता पर महत्वपूर्ण निर्भरता दिखाती हैं, जो चिकनेपन के बाहर व्यापक उत्तल हानि कार्यों के लिए उपयोगी हैं।
सैंपलिंग समस्या का महत्व: लॉग-अवतल वितरण π ∝ e^(-f) से सैंपलिंग एक मौलिक एल्गोरिदमिक समस्या है, जो वॉल्यूम अनुमान, अनुकूलन, बेयेसियन सांख्यिकी, मशीन लर्निंग और विभेदक गोपनीयता जैसी समस्याओं के लिए एक मूल निर्माण खंड है।
लैंजविन एल्गोरिदम: लैंजविन एल्गोरिदम लैंजविन प्रसार को असतत करके लक्ष्य वितरण का अनुमान लगाता है:
dL_t = -∇f(L_t)dt + √2dW_t
असतत करने के बाद मार्कोव श्रृंखला प्राप्त होती है:
X_{t+1} = Π_X[X_t - η∇f(X_t) + √(2η)ξ_t]
मौजूदा विधियों की सीमाएं:
अधिकांश अनुसंधान दृढ़ता से उत्तल चिकनी संभावित कार्य सेटिंग पर केंद्रित है
गैर-चिकनी उत्तल संभावित कार्यों पर अनुसंधान कम है
PABI (पुनरावृत्ति द्वारा गोपनीयता प्रवर्धन) तकनीक मुख्य रूप से गैर-विस्तारक पुनरावृत्तियों तक सीमित है
यह पेपर PABI तकनीक को गैर-विस्तारक पुनरावृत्तियों से परे विस्तारित करने का लक्ष्य रखता है, कंटीन्यूटी मॉड्यूलस (modulus of continuity) के माध्यम से अंतर्निहित मैपिंग की नियमितता को मापकर, जिससे गैर-अवकलनीय कार्यों सहित अधिक व्यापक संभावित कार्य वर्गों को संभाला जा सके।
PABI फ्रेमवर्क का विस्तार: PABI तकनीक को कंटीन्यूटी मॉड्यूलस वाले सामान्य मैपिंग तक विस्तारित करना, यहां तक कि असंतत मैपिंग को भी संभाल सकता है।
अनुकूलन समस्या डिजाइन: PABI अनुप्रयोग के लिए सर्वोत्तम Rényi विचलन सीमाएं प्राप्त करने के लिए एक अनुकूलन समस्या डिजाइन करना, जिसकी व्यावहारिकता संबंधित ग्रेडिएंट मैपिंग के कंटीन्यूटी मॉड्यूलस से निकटता से संबंधित है।
स्पष्ट समाधान: यह साबित करना कि जब कंटीन्यूटी मॉड्यूलस φ(δ) = √(cδ² + h) रूप का हो, तो अनुकूलन समस्या को सटीक रूप से स्पष्ट रूप से हल किया जा सकता है।
मिक्सिंग टाइम सीमाएं: उत्तल और (p,M)-कमजोर चिकनी मामलों के लिए नई मिक्सिंग टाइम सीमाएं स्थापित करना, कुछ मामलों में आयाम-मुक्त और सटीकता में बहु-लॉगरिदमिक।
प्राइवेसी वक्र विश्लेषण: शोर SGD के लिए नई प्राइवेसी वक्र ऊपरी सीमाएं स्थापित करना, जो ग्रेडिएंट नियमितता पर महत्वपूर्ण निर्भरता दिखाती हैं।
लेम्मा 3.2: मान लीजिए X ⊆ ℝ^d एक बंद उत्तल समुच्चय है, Φ में कंटीन्यूटी मॉड्यूलस φ है। यादृच्छिक चर X, X' और गाऊसी शोर ξ ~ N(0, σ²I) के लिए, मान लीजिए Y = Π_XΦ(X) + ξ, Y' = Π_XΦ(X') + ξ, तो किसी भी 0 < a ≤ φ(δ) के लिए:
यह पेपर मुख्य रूप से एक सैद्धांतिक कार्य है, जो कठोर गणितीय प्रमाण के माध्यम से सीमाएं स्थापित करता है, न कि अनुभवजन्य प्रयोगों के माध्यम से। विश्लेषण में शामिल हैं:
मिक्सिंग टाइम विश्लेषण: कुल भिन्नता दूरी का उपयोग करके अभिसरण गति का मूल्यांकन
गोपनीयता विश्लेषण: Rényi विभेदक गोपनीयता फ्रेमवर्क का उपयोग
अनुकूलन विश्लेषण: शिफ्ट अनुकूलन समस्या के इष्टतम समाधान के अस्तित्व और अद्वितीयता को साबित करना
Altschuler, J. and Talwar, K. (2022, 2023). पुनरावृत्ति द्वारा गोपनीयता प्रवर्धन
Feldman, V. et al. (2018). पुनरावृत्ति द्वारा गोपनीयता प्रवर्धन
Dalalyan, A. (2017). लैंजविन मोंटे कार्लो विश्लेषण
Bubeck, S. et al. (2018). प्रोजेक्टेड लैंजविन मोंटे कार्लो
यह पेपर सैद्धांतिक मशीन लर्निंग और विभेदक गोपनीयता के क्षेत्र में महत्वपूर्ण योगदान देता है, कंटीन्यूटी मॉड्यूलस के नवीन उपयोग के माध्यम से, PABI तकनीक की प्रयोज्यता की सीमा को सफलतापूर्वक विस्तारित करता है, और गैर-चिकनी अनुकूलन और गोपनीयता-संरक्षित एल्गोरिदम विश्लेषण के लिए नए सैद्धांतिक उपकरण प्रदान करता है।