Asymmetric Burer-Monteiro Factorization with Theoretically Sound Penalty for Semidefinite Programming
Hu, Kwok
In the solving of large-scale semidefinite programs (SDPs), the symmetric Burer-Monteiro factorization (BMF) offers an economical low-rank solution of the form $XX^\top$. However, BMF turns a convex SDP into a more difficult nonconvex optimization problem in some cases, which limits the use of off-the-shelf convex optimization algorithms. To alleviate this problem, we convert symmetric BMF to its asymmetric counterpart involving $XY^\top$, and use a penalty with parameter $γ$ to encourage $X$ and $Y$ to be close. We show that the resultant asymmetric BMF is multi-convex, and thus convex optimization can again be used to solve the subproblems involving $X$ and $Y$ in an alternating manner. More importantly, to ensure that $X=Y$ on convergence, we derive theoretically sound conditions for exact $γ$ that are independent of both the application problem and underlying algorithm. Experiments demonstrate that the proposed method is more advantageous over existing related approaches.
academic
अर्धनिर्धारित प्रोग्रामिंग के लिए सैद्धांतिक रूप से ध्वनि दंड के साथ असममित बुरर-मोंटेइरो गुणनखंडन
बड़े पैमाने पर अर्धनिर्धारित प्रोग्रामिंग (SDPs) समस्याओं को हल करने में, सममित बुरर-मोंटेइरो गुणनखंडन (BMF) XX⊤ के रूप में आर्थिक निम्न-रैंक समाधान प्रदान करता है। हालांकि, BMF उत्तल SDP को अधिक कठिन गैर-उत्तल अनुकूलन समस्या में परिवर्तित करता है, जो तैयार उत्तल अनुकूलन एल्गोरिदम के उपयोग को सीमित करता है। इस समस्या को कम करने के लिए, यह पेपर सममित BMF को XY⊤ से संबंधित असममित रूप में परिवर्तित करता है, और पैरामीटर γ के साथ एक दंड पद का उपयोग करके X और Y को करीब लाने के लिए प्रोत्साहित करता है। अनुसंधान से पता चलता है कि परिणामी असममित BMF बहु-उत्तल है, इसलिए X और Y से संबंधित उप-समस्याओं को वैकल्पिक तरीके से हल करने के लिए उत्तल अनुकूलन का फिर से उपयोग किया जा सकता है। अधिक महत्वपूर्ण रूप से, अभिसरण पर X=Y सुनिश्चित करने के लिए, पेपर अनुप्रयोग समस्या और अंतर्निहित एल्गोरिदम से स्वतंत्र सटीक γ के लिए सैद्धांतिक पर्याप्त शर्तें प्राप्त करता है।
बड़े पैमाने पर अर्धनिर्धारित प्रोग्रामिंग की चुनौतियाँ: कई मशीन लर्निंग समस्याओं को minZ∈Sn+f(Z) के रूप में अर्धनिर्धारित प्रोग्रामिंग को हल करके निम्न-रैंक सकारात्मक अर्धनिर्धारित मैट्रिक्स सीखने की आवश्यकता होती है। बड़ी समस्याओं के लिए, पारंपरिक आंतरिक बिंदु विधि को O(n3) समय जटिलता की आवश्यकता होती है, जो स्केलेबल नहीं है।
बुरर-मोंटेइरो गुणनखंडन की सीमाएं: हालांकि सममित BMF Z=XX⊤ गुणनखंडन के माध्यम से स्वचालित रूप से सकारात्मक अर्धनिर्धारित बाधा को संतुष्ट कर सकता है और चर आयाम को कम कर सकता है, लेकिन यह उत्तल समस्या को गैर-उत्तल समस्या में परिवर्तित करता है, जो उत्तल अनुकूलन एल्गोरिदम के सीधे अनुप्रयोग को सीमित करता है।
मौजूदा विधियों की कमियाँ:
सममित BMF में X और X⊤ अलग नहीं हैं, कुशल विभाजन या वैकल्पिक एल्गोरिदम का उपयोग नहीं किया जा सकता
मौजूदा असममित विधियों में दंड पैरामीटर सेटिंग में सैद्धांतिक गारंटी की कमी है, अनुमानी समायोजन पर निर्भर है
यह पेपर असममित गुणनखंडन XY⊤ के माध्यम से उत्तल अनुकूलन एल्गोरिदम की प्रयोज्यता को पुनः प्राप्त करने का लक्ष्य रखता है, साथ ही दंड पैरामीटर सेटिंग के लिए सैद्धांतिक रूप से कठोर प्रदान करता है, विधि की सार्वभौमिकता और विश्वसनीयता सुनिश्चित करता है।
एल्गोरिदम 1: विस्तारित बुरर-मोंटेइरो गुणनखंडन का वैकल्पिक अनुकूलन
1. प्रारंभिकीकरण: X⁰, Y⁰, γ⁰, K
2. k = 1, ..., K के लिए करें
3. उत्तल एल्गोरिदम के माध्यम से Xᵏ ≈ argmin_X F(X, Yᵏ⁻¹; γᵏ⁻¹) को अद्यतन करें
4. उत्तल एल्गोरिदम के माध्यम से Yᵏ ≈ argmin_Y F(Xᵏ, Y; γᵏ⁻¹) को अद्यतन करें
5. γᵏ को अद्यतन करें
6. यदि रुकने की कसौटी संतुष्ट है तो Xᵏ या Yᵏ को लौटाएं
7. अंत के लिए
तीन वैकल्पिक उत्तल एल्गोरिदम का समर्थन करता है:
वैकल्पिक न्यूनीकरण (AM): सीधे उप-समस्याओं को हल करना
सरल समस्या पर विचार करें minx∈R21(x2+a)2, इसका दंड रूप है:
minx,y∈RF(x,y,γ)=21(xy+a)2+2γ(x−y)2
प्रयोग दिखाते हैं कि जब γ बहुत छोटा हो तो मौजूदा अनुकूली रणनीति विफल हो सकती है (जैसे a=1,y0=−1,γ0=10−5 पर गलत समाधान में अभिसरण), जबकि यह विधि सही तरीके से संभाल सकती है।
लेम्मा 1: पर्याप्त अवरोहण शर्त और योग योग्य शर्त ∑k=1∞(γk+1−γk)∥Xk−Yk∥F2<∞ के तहत, अनुक्रम {(Xk,Yk)} सीमा बिंदु (X∞,Y∞) में अभिसरण करता है और X∞=Y∞।
प्रमेय 2: एल्गोरिदम 1 F के महत्वपूर्ण बिंदु (Xˉ,Yˉ) में अभिसरण करता है और Xˉ=Yˉ, अर्थात्, Xˉ (या Yˉ) मूल समस्या का महत्वपूर्ण बिंदु है।
पारंपरिक विधियाँ: आंतरिक बिंदु विधि बहुपद समय जटिलता है लेकिन O(n3) स्केलेबल नहीं है; प्रक्षेपित उप-प्रवणता विधि को महंगे eigenvalue अपघटन की आवश्यकता है
पेपर 46 संबंधित संदर्भों का हवाला देता है, जो अर्धनिर्धारित प्रोग्रामिंग, मैट्रिक्स गुणनखंडन, उत्तल अनुकूलन आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को कवर करता है, अनुसंधान के लिए ठोस सैद्धांतिक आधार प्रदान करता है।
समग्र मूल्यांकन: यह सिद्धांत और व्यवहार दोनों पर ध्यान देने वाला एक उत्कृष्ट पेपर है, BMF विधि के सैद्धांतिक विश्लेषण में महत्वपूर्ण सफलता प्राप्त की है, बड़े पैमाने पर अर्धनिर्धारित प्रोग्रामिंग समाधान के लिए नए विचार और उपकरण प्रदान करता है। हालांकि प्रायोगिक सत्यापन की व्यापकता में सुधार की गुंजाइश है, लेकिन इसका सैद्धांतिक योगदान और विधि नवाचार इसे इस क्षेत्र का महत्वपूर्ण कार्य बनाता है।