Sparse Polyak: an adaptive step size rule for high-dimensional M-estimation
Qiao, Maros
We propose and study Sparse Polyak, a variant of Polyak's adaptive step size, designed to solve high-dimensional statistical estimation problems where the problem dimension is allowed to grow much faster than the sample size. In such settings, the standard Polyak step size performs poorly, requiring an increasing number of iterations to achieve optimal statistical precision-even when, the problem remains well conditioned and/or the achievable precision itself does not degrade with problem size. We trace this limitation to a mismatch in how smoothness is measured: in high dimensions, it is no longer effective to estimate the Lipschitz smoothness constant. Instead, it is more appropriate to estimate the smoothness restricted to specific directions relevant to the problem (restricted Lipschitz smoothness constant). Sparse Polyak overcomes this issue by modifying the step size to estimate the restricted Lipschitz smoothness constant. We support our approach with both theoretical analysis and numerical experiments, demonstrating its improved performance.
academic
Sparse Polyak: उच्च-आयामी M-अनुमान के लिए एक अनुकूली चरण आकार नियम
यह पेपर Sparse Polyak प्रस्तावित करता है और अध्ययन करता है, जो Polyak अनुकूली चरण आकार का एक प्रकार है, जो विशेष रूप से उच्च-आयामी सांख्यिकीय अनुमान समस्याओं को हल करने के लिए डिज़ाइन किया गया है, जहां समस्या आयाम नमूना आकार की तुलना में बहुत तेजी से बढ़ता है। इस सेटिंग में, मानक Polyak चरण आकार खराब प्रदर्शन करता है, और इष्टतम सांख्यिकीय सटीकता तक पहुंचने के लिए अधिक से अधिक पुनरावृत्तियों की आवश्यकता होती है - भले ही समस्या अच्छी तरह से स्थित हो और/या प्राप्त करने योग्य सटीकता स्वयं समस्या के पैमाने के साथ खराब न हो। यह पेपर इस सीमा को चिकनाई माप के तरीके में विसंगति के लिए जिम्मेदार ठहराता है: उच्च आयामों में, Lipschitz चिकनाई स्थिरांक का अनुमान लगाना अब प्रभावी नहीं है। इसके बजाय, समस्या से संबंधित विशिष्ट दिशाओं तक सीमित चिकनाई का अनुमान लगाना अधिक उपयुक्त है (प्रतिबंधित Lipschitz चिकनाई स्थिरांक)। Sparse Polyak प्रतिबंधित Lipschitz चिकनाई स्थिरांक का अनुमान लगाने के लिए चरण आकार को संशोधित करके इस समस्या को दूर करता है।
उच्च-आयामी चुनौतियां: उच्च-आयामी सेटिंग में, पारंपरिक Lipschitz चिकनाई स्थिरांक अनुमान विफल हो जाता है, जिससे चरण आकार का चयन अत्यधिक रूढ़िवादी हो जाता है
प्रदर्शन में गिरावट: मानक Polyak चरण आकार समस्या आयाम बढ़ने के साथ महत्वपूर्ण रूप से खराब हो जाता है, भले ही समस्या की स्थिति संख्या समान रहे
दर अपरिवर्तनीयता की कमी: मौजूदा विधियां निश्चित चरण आकार IHT के समान अभिसरण गारंटी बनाए रखने में विफल हैं
पुनरावृत्तीय कठोर थ्रेसहोल्डिंग (IHT) एल्गोरिदम उच्च-आयामी विरल पुनर्प्राप्ति में उत्कृष्ट प्रदर्शन करता है, लेकिन प्रतिबंधित Lipschitz चिकनाई (RSS) स्थिरांक L̄ को जानने की आवश्यकता है
मौजूदा अनुकूली चरण आकार विधियां उच्च-आयामी सेटिंग में सैद्धांतिक गारंटी और व्यावहारिक प्रदर्शन की कमी करती हैं
एक ऐसी विधि की आवश्यकता है जो चरण आकार को अनुकूलित रूप से समायोजित कर सके और दर अपरिवर्तनीयता बनाए रखे
पहला उच्च-आयामी अनुकूली चरण आकार नियम: उच्च-आयामी सेटिंग में अच्छा प्रदर्शन करने वाला और दर अपरिवर्तनीयता बनाए रखने वाला पहला अनुकूली चरण आकार नियम प्रस्तावित किया
सैद्धांतिक नवाचार: उच्च आयामों में चिकनाई माप की मौलिक समस्या की पहचान की, वैश्विक स्थिरांक के बजाय प्रतिबंधित Lipschitz चिकनाई स्थिरांक का अनुमान लगाने का प्रस्ताव दिया
अभिसरण गारंटी: ज्ञात सर्वोत्तम निश्चित चरण आकार के समान रैखिक अभिसरण दर स्थापित की, इष्टतम सांख्यिकीय सटीकता प्राप्त की
व्यापक प्रयोज्यता: कई सांख्यिकीय मॉडल (लॉजिस्टिक प्रतिगमन, रैखिक प्रतिगमन, मैट्रिक्स प्रतिगमन आदि) के लिए सैद्धांतिक गारंटी प्रदान की
समर्थन पुनर्प्राप्ति: संकेत-से-शोर अनुपात शर्तों के तहत समर्थन पुनर्प्राप्ति गारंटी प्रदान की
इनपुट: फ़ंक्शन f, लक्ष्य फ़ंक्शन मान f̂, विरल पैरामीटर s, पुनरावृत्ति संख्या T
प्रारंभिकीकरण: θ_0 ∈ R^d, ||θ_0||_0 ≤ s
for t = 0 to T-1 do:
चरण आकार की गणना करें: γ_t = max{f(θ_t) - f̂, 0} / (5||HT_s(∇f(θ_t))||²)
अपडेट करें: θ_{t+1} = HT_s(θ_t - γ_t∇f(θ_t))
end for
परिणाम 1 (समर्थन पुनर्प्राप्ति):
संकेत-से-शोर अनुपात शर्त |θ̂|_min ≥ 7||HT_s(∇f(θ̂))||/μ̄ के तहत, एल्गोरिदम समर्थन सेट को सटीक रूप से पुनः प्राप्त कर सकता है।
Malitsky & Mishchenko (2020) - आधुनिक अनुकूली विधियां
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला सैद्धांतिक पेपर है जो उच्च-आयामी अनुकूलन में एक महत्वपूर्ण समस्या के लिए एक नवीन समाधान प्रस्तावित करता है। सैद्धांतिक विश्लेषण कठोर है, प्रायोगिक सत्यापन व्यापक है, और संबंधित क्षेत्र के लिए महत्वपूर्ण योगदान मूल्य है। हालांकि कुछ तकनीकी सीमाएं हैं, लेकिन समग्र रूप से यह क्षेत्र में एक महत्वपूर्ण प्रगति है।