2025-11-10T02:58:56.248145

Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth

Melcher, Jalilzadeh, Hamedani

In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.

academic

उत्तल-अवतल काठी बिंदु समस्याओं के लिए द्विघात वृद्धि के साथ एकीकृत प्राथमिक-द्वैत एल्गोरिथ्म का रैखिक अभिसरण

मूल जानकारी

पेपर ID: 2510.11990
शीर्षक: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
लेखक: Cody Melcher (University of Arizona), Afrooz Jalilzadeh (University of Arizona), Erfan Yazdandoost Hamedani (University of Arizona)
वर्गीकरण: math.OC (अनुकूलन और नियंत्रण)
प्रकाशन तिथि: 13 अक्टूबर 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2510.11990

सारांश

यह पेपर काठी बिंदु (SP) समस्याओं का अध्ययन करता है, विशेष रूप से द्विपक्षीय द्विघात फलन वृद्धि (QFG) या द्विपक्षीय द्विघात प्रवणता वृद्धि (QGG) शर्तों को संतुष्ट करने वाली उत्तल-अवतल अनुकूलन समस्याओं पर ध्यान केंद्रित करता है। ये शर्तें काठी बिंदु समस्याओं के लिए विशेष रूप से तैयार की गई नई शर्तें हैं, जो न्यूनतमकरण समस्याओं में द्विघात वृद्धि शर्तों का विस्तार हैं। ये शर्तें पारंपरिक दृढ़ उत्तलता-दृढ़ अवतलता आवश्यकताओं को शिथिल करती हैं, जिससे समस्याओं की एक व्यापक श्रेणी शामिल होती है। लेखकों ने गैर-द्विरेखीय उद्देश्य फलनों के साथ काठी बिंदु समस्याओं को हल करने के लिए सामान्यीकृत त्वरित प्राथमिक-द्वैत (GAPD) एल्गोरिथ्म प्रस्तावित किया है, जो मौजूदा विधियों को एकीकृत और विस्तारित करता है। यह सिद्ध किया गया है कि यह विधि इन शिथिल शर्तों के तहत रैखिक अभिसरण दर प्राप्त करती है। इसके अतिरिक्त, द्विपक्षीय QFG या QGG को संतुष्ट करने वाली संरचित काठी बिंदु समस्याओं के उदाहरण प्रदान किए गए हैं, जो विधि की व्यावहारिक प्रयोज्यता और प्रासंगिकता को प्रदर्शित करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

यह पेपर निम्नलिखित काठी बिंदु समस्या का अध्ययन करता है: $\min_{x \in X} \max_{y \in Y} f(x,y)$ जहाँ $f: X \times Y \rightarrow \mathbb{R}$ किसी भी $y \in Y$ के लिए $x$ में उत्तल है, किसी भी $x \in X$ के लिए $y$ में अवतल है, और $X \subseteq \mathcal{X}$ तथा $Y \subseteq \mathcal{Y}$ बंद उत्तल समुच्चय हैं।

अनुसंधान प्रेरणा

पारंपरिक विधियों की सीमाएं: काठी बिंदु समस्याओं के लिए मौजूदा रैखिक अभिसरण परिणाम आमतौर पर दृढ़ उत्तलता-दृढ़ अवतलता शर्तों की आवश्यकता होती है, जो कई व्यावहारिक अनुप्रयोगों में बहुत कठोर है।
व्यापक अनुप्रयोग: काठी बिंदु समस्याओं का खेल सिद्धांत, वितरण-मजबूत शिक्षा, जनरेटिव प्रतिकूल नेटवर्क और अन्य क्षेत्रों में महत्वपूर्ण अनुप्रयोग है।
सैद्धांतिक अंतराल: हालांकि न्यूनतमकरण समस्याओं में द्विघात वृद्धि शर्तें (QFG और QGG) रैखिक अभिसरण की गारंटी देने के लिए सिद्ध हुई हैं, इन शर्तों को काठी बिंदु समस्याओं तक विस्तारित करना एक गैर-तुच्छ चुनौती है और बड़े हिस्से में अन्वेषित नहीं है।
विधि एकीकरण: APD, OGDA जैसी मौजूदा प्राथमिक-द्वैत विधियों में एकीकृत विश्लेषण ढांचे का अभाव है।

मुख्य योगदान

द्विपक्षीय वृद्धि शर्तें प्रस्तावित करना: पहली बार QFG और QGG शर्तों को काठी बिंदु समस्याओं तक विस्तारित करना, द्विपक्षीय द्विघात फलन वृद्धि और द्विपक्षीय द्विघात प्रवणता वृद्धि शर्तों को परिभाषित करना।
एकीकृत एल्गोरिथ्म ढांचा: सामान्यीकृत त्वरित प्राथमिक-द्वैत (GAPD) एल्गोरिथ्म प्रस्तावित करना, जो मौजूदा APD और OGDA विधियों को एकीकृत करता है।
रैखिक अभिसरण गारंटी: द्विपक्षीय QFG या QGG शर्तों के तहत GAPD एल्गोरिथ्म द्वारा रैखिक अभिसरण दर प्राप्त करना।
Bregman दूरी विस्तार: विश्लेषण ढांचे को Bregman दूरी तक विस्तारित करना, विधि की लचीलापन और प्रयोज्यता को बढ़ाना।
संरचित समस्या श्रेणियां: द्विपक्षीय वृद्धि शर्तों को संतुष्ट करने वाली विशिष्ट संरचित काठी बिंदु समस्याओं के उदाहरण प्रदान करना।

विधि विवरण

कार्य परिभाषा

उत्तल-अवतल काठी बिंदु अनुकूलन समस्याओं का अध्ययन करना, जहाँ उद्देश्य फलन पारंपरिक दृढ़ उत्तलता-दृढ़ अवतलता शर्तों के बजाय द्विपक्षीय द्विघात वृद्धि शर्तों को संतुष्ट करता है।

मुख्य परिभाषाएं

द्विपक्षीय द्विघात प्रवणता वृद्धि (Two-Sided QGG)

काठी बिंदु समस्या के लिए, यदि स्थिरांक $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ मौजूद हैं जैसे कि किसी भी $x \in X$ और $y \in Y$ के लिए: $\langle F(z) - F(\bar{z}), z - \bar{z} \rangle \geq 2D_Z^M(z, \bar{z})$ जहाँ $z = [x^T, y^T]^T$ , $\bar{z} = P_{Z^*}(z)$ , $F(z) = [\nabla_x f(x,y)^T, -\nabla_y f(x,y)^T]^T$ , $M = \text{diag}(\{μ_x I_n, μ_y I_m\})$ ।

द्विपक्षीय द्विघात फलन वृद्धि (Two-Sided QFG)

यदि स्थिरांक $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ मौजूद हैं जैसे कि: $f(x, \bar{y}) - f(\bar{x}, y) \geq D_Z^M(z, \bar{z})$

GAPD एल्गोरिथ्म आर्किटेक्चर

GAPD एल्गोरिथ्म के मुख्य अपडेट नियम हैं:

गति पद गणना:
- $q_k^y = \nabla_y f(x_k, y_k) - \nabla_y f(x_{k-1}, y_{k-1})$
- $q_k^x = \nabla_x f(x_k, y_k) - \nabla_x f(x_{k-1}, y_{k-1})$
द्वैत चर अपडेट: $y_{k+1} = \arg\min_{y \in Y} \left\{-\langle \nabla_y f(x_k, y_k) + α_k q_k^y, y \rangle + \frac{1}{σ_k} D_Y(y, y_k) \right\}$
समग्र प्रवणता निर्माण: $s_k = θ_k \nabla_x f(x_k, y_{k+1}) + (1-θ_k) \nabla_x f(x_k, y_k) + β_k q_k^x$
प्राथमिक चर अपडेट: $x_{k+1} = \arg\min_{x \in X} \left\{ \langle s_k, x \rangle + \frac{1}{τ_k} D_X(x, x_k) \right\}$

तकनीकी नवाचार बिंदु

एकीकरण: पैरामीटर $θ_k$ $θ_{k}$ के माध्यम से मौजूदा विधियों को एकीकृत करना:
- $θ_k = 0$ : OGDA में विघटित होता है
- $θ_k = 1, β_k = 0$ : APD में विघटित होता है
Bregman दूरी: यूक्लिडियन दूरी के बजाय Bregman दूरी का उपयोग करना, अधिक लचीलापन प्रदान करना।
द्विपक्षीय शर्तें: पहली बार एकपक्षीय वृद्धि शर्तों को काठी बिंदु समस्याओं के द्विपक्षीय संस्करण तक विस्तारित करना।

सैद्धांतिक विश्लेषण

मुख्य अभिसरण प्रमेय

प्रमेय 4.4: मान लीजिए $\{(x_k, y_k)\}_{k≥0}$ एल्गोरिथ्म 1 द्वारा उत्पन्न अनुक्रम है। मान लीजिए कि अनुमान 2.1-4.3 सत्य हैं, तो किसी भी $K ≥ 1$ और $Γ \succ 0$ के लिए: $D_Z^{A_K - Γ B_K}(\bar{z}_K, z_K) ≤ \frac{t_0}{t_K} D_Z^{A_0}(\bar{z}_0, z_0)$

रैखिक अभिसरण दर

परिणाम 4.5: उपयुक्त पैरामीटर चयन के तहत, पुनरावृत्ति अनुक्रम रैखिक दर पर इष्टतम समाधान समुच्चय में अभिसरित होता है: $D_Z(\bar{z}_K, z_K) ≤ D_Z^{R_K}(\bar{z}_0, z_0)$ जहाँ $R_K = \frac{α^{K+1}}{(1-α)c_M}$ , अभिसरण दर पैरामीटर $ς > 0$ पर निर्भर करती है (QFG के लिए $ς = θ$ , QGG के लिए $ς = 2(1-θ)$ )।

संरचित समस्या श्रेणियां

समस्या श्रेणी

निम्नलिखित संरचित उत्तल-अवतल काठी बिंदु समस्या पर विचार करें: $\min_{x \in X} \max_{y \in Y} h(C_1 x) + \langle Ax, y \rangle - g(C_2 y)$ जहाँ $h: \mathbb{R}^p \rightarrow \mathbb{R}$ और $g: \mathbb{R}^q \rightarrow \mathbb{R}$ दृढ़ उत्तल फलन हैं।

शर्तों को संतुष्ट करने के लिए पर्याप्त शर्तें

प्रस्ताव 5.1: यदि स्थिरांक $ξ_1, ξ_2, ξ_3, ξ_4 > 0$ मौजूद हैं जैसे कि:

$ξ_1 C_1^T C_1 \succeq A^T A$ , $ξ_2 C_1^T C_1 \succeq \|λ^*\|^2 G^T G$
$ξ_3 C_2^T C_2 \succeq AA^T$ , $ξ_4 C_2^T C_2 \succeq \|ν^*\|^2 F^T F$

तो यह समस्या श्रेणी द्विपक्षीय QGG और QFG शर्तों को संतुष्ट करती है।

संख्यात्मक प्रयोग

प्रयोग सेटअप

यादृच्छिक रूप से उत्पन्न काठी बिंदु समस्या पर विचार करें: $\min_{x \in \mathbb{R}^n} \max_{y \in \mathbb{R}^m} \frac{1}{2}\|C_1 x - b_1\|_2^2 + \langle Ax, y \rangle - \frac{1}{2}\|C_2 y - b_2\|_2^2$

प्रयोग परिणाम

आयाम परीक्षण: तीन अलग-अलग आयामों $(n,m,p,q) \in \{(75,60,60,50), (150,120,120,100), (300,240,240,200)\}$ के तहत परीक्षण।
प्रदर्शन तुलना: GAPD विभिन्न $θ$ मानों के तहत मानक GDA विधि से बेहतर प्रदर्शन करता है।
पैरामीटर प्रभाव: $θ = 0.99$ सर्वोत्तम प्रदर्शन प्राप्त करता है, $θ = 1$ के मामले से थोड़ा बेहतर।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

द्विघात वृद्धि शर्तों को काठी बिंदु समस्याओं तक सफलतापूर्वक विस्तारित करना, द्विपक्षीय QFG और QGG शर्तें प्रस्तावित करना
GAPD एल्गोरिथ्म शिथिल शर्तों के तहत रैखिक अभिसरण प्राप्त करता है, मौजूदा विधियों को एकीकृत करता है
नई वृद्धि शर्तों को संतुष्ट करने वाली संरचित समस्या श्रेणियां प्रदान करना

सीमाएं

शर्त सत्यापन: व्यावहारिक अनुप्रयोगों में द्विपक्षीय वृद्धि शर्तों को सत्यापित करना चुनौतीपूर्ण हो सकता है
पैरामीटर चयन: इष्टतम पैरामीटर $θ$ का चयन समस्या-विशिष्ट ज्ञान की आवश्यकता है
बाधा प्रबंधन: मुख्य रूप से सरल बाधा समुच्चय पर ध्यान केंद्रित करता है, जटिल बाधाओं के प्रबंधन में सीमित

भविष्य की दिशाएं

एकपक्षीय द्विघात वृद्धि शर्तों के तहत अभिसरण व्यवहार का अध्ययन करना
वितरित अनुकूलन में अनुप्रयोगों की खोज करना
अधिक जटिल बाधा अनुकूलन समस्याओं तक विस्तार करना

गहन मूल्यांकन

शक्तियां

सैद्धांतिक नवाचार: पहली बार द्विघात वृद्धि शर्तों को काठी बिंदु समस्याओं तक व्यवस्थित रूप से विस्तारित करना, महत्वपूर्ण सैद्धांतिक अंतराल को भरना
एकीकृत ढांचा: GAPD एल्गोरिथ्म कई मौजूदा विधियों को सुंदरता से एकीकृत करता है
व्यावहारिक मूल्य: शिथिल शर्तें विधि को समस्याओं की व्यापक श्रेणी के लिए लागू करती हैं
कठोर विश्लेषण: पूर्ण अभिसरण विश्लेषण और विशिष्ट अभिसरण दर प्रदान करता है

कमियां

सीमित प्रयोग: संख्यात्मक प्रयोग अपेक्षाकृत सरल हैं, व्यावहारिक अनुप्रयोग परिदृश्यों का सत्यापन अभाव है
शर्त संबंध: द्विपक्षीय QFG और QGG शर्तों के बीच संबंध विश्लेषण अधिक गहन हो सकता है
कम्प्यूटेशनल जटिलता: प्रत्येक पुनरावृत्ति की कम्प्यूटेशनल जटिलता का विस्तृत विश्लेषण नहीं

प्रभाव

शैक्षणिक योगदान: काठी बिंदु अनुकूलन सिद्धांत के लिए महत्वपूर्ण सैद्धांतिक उपकरण प्रदान करता है
व्यावहारिक मूल्य: विधि की एकीकरण और लचीलापन कई अनुप्रयोग क्षेत्रों में संभावना प्रदान करता है
विस्तारशीलता: बाद के अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है

लागू परिदृश्य

मशीन लर्निंग में प्रतिकूल प्रशिक्षण
वितरण-मजबूत अनुकूलन
खेल सिद्धांत अनुप्रयोग
विशेष संरचना वाली उत्तल अनुकूलन समस्याएं

संदर्भ

पेपर काठी बिंदु अनुकूलन, भिन्नात्मक असमानताएं, द्विघात वृद्धि शर्तें और अन्य संबंधित क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हुए 46 संबंधित संदर्भों का हवाला देता है, जो इस अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।