An Augmented Lagrangian Value Function Method for Lower-level Constrained Stochastic Bilevel Optimization
Nie, Li, Wen
Recently, lower-level constrained bilevel optimization has attracted increasing attention. However, existing methods mostly focus on either deterministic cases or problems with linear constraints. The main challenge in stochastic cases with general constraints is the bias and variance of the hyper-gradient, arising from the inexact solution of the lower-level problem. In this paper, we propose a novel stochastic augmented Lagrangian value function method for solving stochastic bilevel optimization problems with nonlinear lower-level constraints. Our approach reformulates the original bilevel problem using an augmented Lagrangian-based value function and then applies a penalized stochastic gradient method that carefully manages the noise from stochastic oracles. We establish an equivalence between the stochastic single-level reformulation and the original constrained bilevel problem and provide a non-asymptotic rate of convergence for the proposed method. The rate is further enhanced by employing variance reduction techniques. Extensive experiments on synthetic problems and real-world applications demonstrate the effectiveness of our approach.
academic
निम्न-स्तर की बाधित स्टोकेस्टिक द्विस्तरीय अनुकूलन के लिए एक संवर्धित लैग्रेंजियन मान फलन विधि
यह पेपर अरैखिक निम्न-स्तर की बाधाओं के साथ स्टोकेस्टिक द्विस्तरीय अनुकूलन समस्याओं के लिए एक नई स्टोकेस्टिक संवर्धित लैग्रेंजियन मान फलन विधि प्रस्तावित करता है। यह विधि संवर्धित लैग्रेंजियन मान फलन के माध्यम से मूल द्विस्तरीय समस्या को पुनर्निर्मित करती है, और स्टोकेस्टिक ओरेकल से आने वाले शोर को सावधानीपूर्वक प्रबंधित करने के लिए दंडात्मक स्टोकेस्टिक ग्रेडिएंट विधि लागू करती है। लेखक स्टोकेस्टिक एकल-स्तरीय पुनर्निर्माण और मूल बाधित द्विस्तरीय समस्या के बीच समतुल्यता स्थापित करते हैं, और गैर-स्पर्शोन्मुख अभिसरण दर विश्लेषण प्रदान करते हैं। विचरण में कमी की तकनीकों के माध्यम से अभिसरण दर में और सुधार किया गया है। संश्लेषित समस्याओं और वास्तविक अनुप्रयोगों पर व्यापक प्रयोग विधि की प्रभावशीलता को सत्यापित करते हैं।
समस्या की पृष्ठभूमि: निम्न-स्तर की बाधाओं के साथ द्विस्तरीय अनुकूलन (LC-BLO) मशीन लर्निंग क्षेत्र में व्यापक रूप से लागू होता है, जिसमें हाइपरपैरामीटर अनुकूलन, मेटा-लर्निंग, सुदृढ़ शिक्षा आदि शामिल हैं। इस प्रकार की समस्याओं में पदानुक्रमित संरचना होती है, जहां ऊपरी-स्तर की समस्या का समाधान निम्न-स्तर की बाधित अनुकूलन समस्या के इष्टतम समाधान पर निर्भर करता है।
मौजूदा विधियों की सीमाएं:
अधिकांश मौजूदा विधियां केवल नियतात्मक मामलों या रैखिक बाधा समस्याओं पर ध्यान केंद्रित करती हैं
स्टोकेस्टिक सेटिंग में अरैखिक बाधा समस्याओं के लिए प्रभावी समाधान की कमी है
मुख्य चुनौती निम्न-स्तर की समस्या के अनुमानित समाधान से उत्पन्न हाइपरग्रेडिएंट पूर्वाग्रह और विचरण है
तकनीकी चुनौतियां:
हाइपर-उद्देश्य फलन की गैर-चिकनाई
निम्न-स्तर की समस्या के अनुमानित समाधान से उत्पन्न हाइपरग्रेडिएंट पूर्वाग्रह
स्टोकेस्टिक ओरेकल द्वारा लाया गया शोर प्रबंधन
अनुसंधान प्रेरणा: स्टोकेस्टिक अरैखिक बाधित द्विस्तरीय अनुकूलन के सिद्धांत और एल्गोरिदम में अंतराल को भरना, और व्यावहारिक मशीन लर्निंग अनुप्रयोगों के लिए सैद्धांतिक गारंटी के साथ कुशल एल्गोरिदम प्रदान करना।
नई पुनर्निर्माण विधि: स्टोकेस्टिक संवर्धित लैग्रेंजियन फलन और इसके मोरो लिफाफे के आधार पर द्विस्तरीय समस्या के पुनर्निर्माण का प्रस्ताव, जो निम्न-स्तर की समस्या के अनुमानित समाधान से आने वाले शोर को प्रभावी ढंग से संभालता है
सैद्धांतिक समतुल्यता: स्टोकेस्टिक एकल-स्तरीय पुनर्निर्माण और मूल द्विस्तरीय समस्या के बीच समतुल्यता स्थापित करना, जो एक व्यावहारिक और सैद्धांतिक रूप से ठोस विधि प्रदान करता है
पहला अभिसरण विश्लेषण: अरैखिक LC-BLO के लिए स्टोकेस्टिक सेटिंग में मान फलन विधि का पहला अभिसरण विश्लेषण, Õ(cε⁻²), Õ(cc₁²ε⁻²) का नमूना जटिलता प्रमाणित करता है
विचरण में कमी सुधार: विचरण में कमी की तकनीकों के माध्यम से ऊपरी-स्तर के चर की नमूना जटिलता को Õ(c^1.5ε⁻^1.5) तक सुधारा गया
संश्लेषित समस्याएं: SALVF और SALVF-VR दोनों वैश्विक इष्टतम समाधान के पास अभिसरित होते हैं, SALVF-VR का वितरण अधिक केंद्रित है, जो विचरण में कमी के त्वरण प्रभाव को सत्यापित करता है
SVM हाइपरपैरामीटर अनुकूलन:
SALVF परीक्षण सटीकता में सभी आधार विधियों से बेहतर है
हालांकि BLOCC भी समान शिखर सटीकता तक पहुंच सकता है, लेकिन SALVF की पुनरावृत्ति अधिक समय-कुशल है
डायबिटीज डेटासेट पर लगभग 80% परीक्षण सटीकता, फोरक्लास डेटासेट पर लगभग 75% परीक्षण सटीकता प्राप्त करता है
वजन क्षय ट्यूनिंग:
सभी द्विस्तरीय विधियां बिना वजन क्षय के आधार से बेहतर प्रदर्शन करती हैं, अधिक-फिटिंग को प्रभावी ढंग से कम करती हैं
SALVF समय दक्षता में सर्वोत्तम है, दोहरे-लूप पुनरावृत्ति प्रक्रिया की सरलता के कारण
निहित ग्रेडिएंट विधियां (IG): मुख्य रूप से हाइपरग्रेडिएंट की गणना पर ध्यान केंद्रित करती हैं, लेकिन दूसरे-क्रम व्युत्पन्न की आवश्यकता होती है, उच्च कम्प्यूटेशनल लागत
निम्न-स्तर मान फलन विधियां (LLVF): निम्न-स्तर की समस्या मान फलन का परिचय, हेसियन-मुक्त विकल्प के रूप में
दंड विधियां: बाधित समस्याओं को अबाधित समस्याओं में परिवर्तित करके समाधान करना
पेपर 49 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से:
द्विस्तरीय अनुकूलन के शास्त्रीय कार्य और नवीनतम प्रगति
संवर्धित लैग्रेंजियन विधि की सैद्धांतिक नींव
स्टोकेस्टिक अनुकूलन और विचरण में कमी की तकनीकें
मशीन लर्निंग में अनुप्रयोग के मामले
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला सैद्धांतिक और अनुप्रयोग-केंद्रित पेपर है जो एक महत्वपूर्ण लेकिन कठिन समस्या पर वास्तविक प्रगति प्राप्त करता है, स्टोकेस्टिक बाधित द्विस्तरीय अनुकूलन क्षेत्र में महत्वपूर्ण योगदान देता है। विधि नई है, सिद्धांत कठोर है, प्रयोग व्यापक हैं, और इसमें उत्कृष्ट शैक्षणिक मूल्य और व्यावहारिक संभावनाएं हैं।