Revisit First-order Methods for Geodesically Convex Optimization
Shu, Jiang, Shi et al.
In a seminal work of Zhang and Sra, gradient descent methods for geodesically convex optimization were comprehensively studied. In particular, Zhang and Sra derived a comparison inequality that relates the iterative points in the optimization process. Since their seminal work, numerous follow-ups have studied different downstream usages of their comparison lemma.
In this work, we introduce the concept of quasilinearization to optimization, presenting a novel framework for analyzing geodesically convex optimization. By leveraging this technique, we establish state-of-the-art convergence rates -- for both deterministic and stochastic settings -- under weaker assumptions than previously required. The technique of quasilinearization may prove valuable for other non-Euclidean optimization problems.
academic
जियोडेसिकली उत्तल अनुकूलन के लिए प्रथम-क्रम विधियों का पुनर्विचार
यह पेपर जियोडेसिकली उत्तल अनुकूलन में प्रथम-क्रम विधियों का पुनर्विचार करता है। झांग और श्रा के अग्रणी कार्य में जियोडेसिकली उत्तल अनुकूलन के लिए ग्रेडिएंट डिसेंट विधि का व्यापक अध्ययन किया गया था, विशेष रूप से अनुकूलन प्रक्रिया में पुनरावृत्ति बिंदुओं के तुलनात्मक असमानताएं प्राप्त की गई थीं। यह पेपर अनुकूलन क्षेत्र में अर्ध-रैखिकीकरण (quasilinearization) की अवधारणा प्रस्तुत करता है और जियोडेसिकली उत्तल अनुकूलन के विश्लेषण के लिए एक नई रूपरेखा प्रस्तावित करता है। इस तकनीक का उपयोग करके, पहले की तुलना में कमजोर धारणा शर्तों के तहत, नियतात्मक और यादृच्छिक सेटिंग्स के लिए अत्याधुनिक अभिसरण दर स्थापित की गई है। अर्ध-रैखिकीकरण तकनीक अन्य गैर-यूक्लिडीय अनुकूलन समस्याओं के लिए मूल्यवान हो सकती है।
मौजूदा विधियों की सीमाएं: झांग और श्रा की शास्त्रीय विधि दो मजबूत धारणाओं पर निर्भर करती है:
(A1) अनुभागीय वक्रता की एकसमान निचली सीमा (CBB शर्त)
(A2) प्रक्षेपवक्र व्यास की पूर्व ऊपरी सीमा
व्यावहारिक समस्या: कई महत्वपूर्ण हैडामार्ड मैनिफोल्ड CBB शर्त को संतुष्ट नहीं करते हैं, उदाहरण के लिए विकृत उत्पाद मैनिफोल्ड, जिनकी वक्रता नकारात्मक अनंत तक जा सकती है।
मूल चुनौती: धारणा (A1) और (A2) को हटाते हुए अत्याधुनिक अभिसरण दर को कैसे बनाए रखें?
प्रमेय 1 (नियतात्मक स्थिति): मान लीजिए f हैडामार्ड मैनिफोल्ड M पर एक जियोडेसिकली उत्तल फलन है, प्रॉक्सिमल ग्रेडिएंट एल्गोरिदम निम्नलिखित को संतुष्ट करता है:
f(xt)−f(x∗)≤ηt∣x0x∗∣2
प्रमेय 2 (यादृच्छिक स्थिति): सीमित विचरण धारणा के तहत, यादृच्छिक प्रॉक्सिमल ग्रेडिएंट एल्गोरिदम चरण आकार ηt=2Lt1 के साथ निम्नलिखित को संतुष्ट करता है:
∑t=1Tαt1∑t=1Tαt(EF(xt)−F(x∗))≤2∑t=1Tαt∣x0x∗∣2+∑t=1Tαtσ2log(T+1)
पेपर 61 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से:
बर्ग और निकोलाएव (2008): अर्ध-रैखिकीकरण का मूल कार्य
झांग और श्रा (2016): जियोडेसिकली उत्तल अनुकूलन का शास्त्रीय विश्लेषण
बोनाबेल (2013): रीमैनियन मैनिफोल्ड पर यादृच्छिक ग्रेडिएंट डिसेंट
हैडामार्ड मैनिफोल्ड अनुकूलन पर कई हाल के कार्य
समग्र मूल्यांकन: यह एक उच्च गुणवत्ता का सैद्धांतिक पेपर है जो अर्ध-रैखिकीकरण तकनीक के परिचय के माध्यम से जियोडेसिकली उत्तल अनुकूलन क्षेत्र की महत्वपूर्ण खुली समस्या को सफलतापूर्वक हल करता है। हालांकि संख्यात्मक प्रयोगों की कमी है, लेकिन इसका सैद्धांतिक योगदान महत्वपूर्ण है और यह गैर-यूक्लिडीय अनुकूलन के लिए नई विश्लेषण रूपरेखा और उपकरण प्रदान करता है।