Iterative Implicit Gradients for Nonconvex Optimization with Variational Inequality Constraints
Kaushik, Jin
We propose an optimization proxy in terms of iterative implicit gradient methods for solving constrained optimization problems with nonconvex loss functions. This framework can be applied to a broad range of machine learning settings, including meta-learning, hyperparameter optimization, large-scale complicated constrained optimization, and reinforcement learning. The proposed algorithm builds upon the iterative differentiation (ITD) approach. We extend existing convergence and rate analyses from the bilevel optimization literature to a constrained bilevel setting, motivated by learning under explicit constraints. Since solving bilevel problems using first-order methods requires evaluating the gradient of the inner-level optimal solution with respect to the outer variable (the implicit gradient), we develop an efficient computation strategy suitable for large-scale structures. Furthermore, we establish error bounds relative to the true gradients and provide non-asymptotic convergence rate guarantees.
academic
गैर-उत्तल अनुकूलन के लिए पुनरावृत्तीय निहित प्रवणता: परिवर्तनशील असमानता बाधाएं
यह पेपर गैर-उत्तल हानि फलन वाली बाधित अनुकूलन समस्याओं को हल करने के लिए पुनरावृत्तीय निहित प्रवणता विधि पर आधारित एक अनुकूलन प्रॉक्सी प्रस्तावित करता है। यह ढांचा मेटा-लर्निंग, हाइपरपैरामीटर अनुकूलन, बड़े पैमाने पर जटिल बाधित अनुकूलन और सुदृढ़ीकरण सीखने जैसे मशीन लर्निंग परिदृश्यों में व्यापक रूप से लागू होता है। यह एल्गोरिथ्म पुनरावृत्तीय विभेदन (ITD) विधि पर आधारित है, जो द्विस्तरीय अनुकूलन साहित्य में मौजूदा अभिसरण और अभिसरण दर विश्लेषण को बाधित द्विस्तरीय सेटिंग तक विस्तारित करता है। चूंकि द्विस्तरीय समस्या को हल करने के लिए प्रथम-क्रम विधियों को आंतरिक स्तर के इष्टतम समाधान की बाहरी स्तर के चर के संबंध में प्रवणता (निहित प्रवणता) का मूल्यांकन करने की आवश्यकता होती है, लेखकों ने बड़े पैमाने की संरचनाओं के लिए कुशल कम्प्यूटेशनल रणनीतियां विकसित की हैं और वास्तविक प्रवणता के संबंध में त्रुटि सीमाएं स्थापित की हैं, जो गैर-स्पर्शोन्मुख अभिसरण दर गारंटी प्रदान करती हैं।
बाधित अनुकूलन का महत्व: मेटा-लर्निंग और हाइपरपैरामीटर अनुकूलन जैसे अनुप्रयोगों में, पारंपरिक विधियां अक्सर बाधाओं को नजरअंदाज करती हैं, लेकिन व्यावहारिक अनुप्रयोगों में, सुरक्षा, निष्पक्षता और उच्च-स्तरीय नियमों के अनुपालन को सुनिश्चित करने के लिए बाधाएं महत्वपूर्ण हैं।
द्विस्तरीय अनुकूलन की चुनौतियां: मेटा-लर्निंग को स्वाभाविक रूप से द्विस्तरीय अनुकूलन समस्या के रूप में व्यक्त किया जा सकता है, जहां आंतरिक अनुकूलन कार्य-विशिष्ट अनुकूलन को कैप्चर करता है, और बाहरी अनुकूलन पूर्वाग्रह या जोखिम वाले निर्णयों को रोकने के लिए सुरक्षा बाधाएं जोड़ सकता है। हालांकि, मौजूदा द्विस्तरीय अनुकूलन विधियां कम्प्यूटेशनल रूप से मांग वाली हैं, विशेष रूप से आंतरिक समस्या के समाधान के माध्यम से बैकप्रोपेगेशन को उच्च मेमोरी उपयोग और जटिल व्युत्पन्न गणनाओं की आवश्यकता होती है।
मौजूदा विधियों की सीमाएं:
रैखिक बाधित अनुकूलन समस्याओं के लिए, निहित प्रवणता की गणना सीधी नहीं है
बाधाओं की संख्या बढ़ने के साथ, व्युत्क्रम मैट्रिक्स H तेजी से कठिन हो जाता है
व्युत्क्रम मैट्रिक्स चरण को सरल बनाने के लिए विश्वसनीय सन्निकटन तकनीकों की कमी
प्रत्येक पुनरावृत्ति में मैट्रिक्स H की व्युत्क्रमणीयता सुनिश्चित करने के लिए कुछ बाधा योग्यता शर्तों को पूरा करना आवश्यक है
इस पेपर की मूल प्रेरणा एक ऐसी द्विस्तरीय अनुकूलन विधि विकसित करना है जो परिवर्तनशील असमानता बाधाओं को संभाल सके, पारंपरिक विधियों में मैट्रिक्स व्युत्क्रम और बैकप्रोपेगेशन की कठिनाइयों से बचे, और सैद्धांतिक अभिसरण गारंटी प्रदान करे।
बैकप्रोपेगेशन से बचना: एक अनुकूलन प्रॉक्सी प्रस्तावित किया गया है जो merit फलन (विशेष रूप से D-gap फलन) और परिवर्तनशील असमानता के प्राकृतिक मानचित्र से संबंधित निश्चित बिंदु सूत्र के माध्यम से निहित प्रवणता की गणना करता है, जो आंतरिक समस्या के माध्यम से बैकप्रोपेगेशन की आवश्यकता से बचता है।
समस्या श्रेणी का विस्तार: बाधित अनुकूलन समस्या (P) को हल करता है, जो साहित्य में आमतौर पर अध्ययन किए जाने वाले अनबाधित द्विस्तरीय सूत्रीकरण के विपरीत है। विशेष रूप से परिवर्तनशील असमानता (VI) बाधाओं द्वारा प्रतिबंधित गैर-चिकने अनुकूलन समस्याओं की श्रेणी पर ध्यान केंद्रित करता है, जहां द्विस्तरीय अनुकूलन इस व्यापक सूत्रीकरण का एक विशेष मामला है।
सैद्धांतिक विश्लेषण का विस्तार: परिवर्तनशील असमानता बाधाओं को शामिल करने वाली अनुकूलन समस्याओं की व्यापक श्रेणी तक मौजूदा विश्लेषण ढांचे को विस्तारित करता है, निहित प्रवणता और उद्देश्य फलन प्रवणता के वास्तविक प्रवणता के संबंध में त्रुटि सीमाएं प्राप्त करता है, और गैर-स्पर्शोन्मुख अभिसरण दर परिणाम स्थापित करता है।
Merit फलन विधि: KKT शर्तों के प्रत्यक्ष विभेदन से बचने के लिए D-gap फलन का उपयोग करता है, जो मैट्रिक्स व्युत्क्रम की कम्प्यूटेशनल कठिनाइयों को दरकिनार करता है।
निश्चित बिंदु पुनरावृत्ति: VI समाधान को निश्चित बिंदु समस्या में परिवर्तित करता है, जिससे निहित प्रवणता गणना अधिक कुशल और संख्यात्मक रूप से स्थिर हो जाती है।
संकुचन मानचित्र गुण: साबित करता है कि निश्चित बिंदु मानचित्र zb∗(⋅,x) एक संकुचन मानचित्र है, जो आंतरिक पुनरावृत्ति के अभिसरण को सुनिश्चित करता है।
लेम्मा 12: आंतरिक अभिसरण
आंतरिक पुनरावृत्ति R-रैखिक दर पर अभिसरित होती है:
∥yk−y∗∥≤C1ϕab(y0,x)1−C1+C2C21(C1+C2C2)k
प्रस्ताव 14: निहित प्रवणता त्रुटि सीमा
∥∇xyT−∇xy∗∥≤(Lxin+1−qxLyinCxin′)CyinqxT−1T+1−qxCxin′qxT
प्रमेय 15: मुख्य अभिसरण परिणाम
एल्गोरिथ्म अभिसरण दर O(1/K) है:
mink∈{0,…,K}∥∇xf(y∗(xk),xk)∥2≤β(21−βL)Kf(y∗(x0),x0)−f(y∗(xK+1),xK+1)+उच्च-क्रमपद
पेपर 40 संबंधित संदर्भों का हवाला देता है, जो द्विस्तरीय अनुकूलन, परिवर्तनशील असमानताएं, बाधित अनुकूलन और मेटा-लर्निंग सहित कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है।
समग्र मूल्यांकन: यह सैद्धांतिक योगदान में उत्कृष्ट एक उत्कृष्ट पेपर है, जो पुनरावृत्तीय विभेदन विधि को परिवर्तनशील असमानता बाधाओं के साथ द्विस्तरीय अनुकूलन समस्या तक सफलतापूर्वक विस्तारित करता है, पूर्ण सैद्धांतिक विश्लेषण और अभिसरण गारंटी प्रदान करता है। यद्यपि प्रायोगिक सत्यापन के पहलू में कुछ कमी है, लेकिन इसका सैद्धांतिक नवाचार और पद्धति योगदान बाधित अनुकूलन क्षेत्र के लिए महत्वपूर्ण नए उपकरण प्रदान करता है।