2025-11-10T02:43:53.338320

Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization

Huang

In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.

academic

बहु-उद्देश्य अनुकूलन के लिए नए एक्सट्रापोलेशन पद के साथ तीव्र त्वरित प्रॉक्सिमल ग्रेडिएंट विधि

मूल जानकारी

पेपर ID: 2507.06737
शीर्षक: बहु-उद्देश्य अनुकूलन के लिए नए एक्सट्रापोलेशन पद के साथ तीव्र त्वरित प्रॉक्सिमल ग्रेडिएंट विधि
लेखक: Huang Chengzhi
वर्गीकरण: math.OC (अनुकूलन और नियंत्रण)
प्रकाशन समय: 17 अक्टूबर, 2025
पेपर लिंक: https://arxiv.org/abs/2507.06737

सारांश

इस पेपर में एक नई एक्सट्रापोलेशन गुणांक योजना और एक्सट्रापोलेशन पद प्रस्तावित किया गया है, और एक त्वरित प्रॉक्सिमल ग्रेडिएंट एल्गोरिदम विकसित किया गया है। यह एल्गोरिदम उप-रैखिक अभिसरण दर प्राप्त करता है। प्रस्तावित योजना केवल Lipschitz स्थिरांक अनुमान अनुक्रम के लिए हल्के प्रारंभिक शर्तों की आवश्यकता है, जिसके तहत अभिसरण विश्लेषण का समर्थन करने के लिए महत्वपूर्ण समानता गुण प्राप्त किए जा सकते हैं। संख्यात्मक प्रयोग प्रस्तावित विधि की प्रभावशीलता और व्यावहारिक प्रदर्शन को सत्यापित करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या को हल करना: बहु-उद्देश्य अनुकूलन समस्याएं, विशेष रूप से मिश्रित बिना-बाधा वाली बहु-उद्देश्य अनुकूलन समस्याएं: $\min_{x \in \mathbb{R}^n} F(x) \equiv (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T$ जहां $f_i$ चिकनी उत्तल फलन हैं, $g_i$ उत्तल फलन हैं (संभवतः गैर-चिकने)।
समस्या की महत्ता: बहु-उद्देश्य अनुकूलन व्यावहारिक अनुप्रयोगों में व्यापक रूप से मौजूद है, जैसे छवि पुनर्स्थापन, संपीड़ित संवेदन आदि क्षेत्र। इस तरह की समस्याओं में आमतौर पर कोई एकल इष्टतम समाधान नहीं होता है, बल्कि Pareto इष्टतम समाधान के एक समूह से बना होता है।
मौजूदा विधियों की सीमाएं:
- Tanabe आदि ने FISTA को बहु-उद्देश्य अनुकूलन तक विस्तारित किया, $O(1/k^2)$ अभिसरण दर प्राप्त की
- Sonntag आदि और Zhang आदि के काम में सैद्धांतिक प्रमाण अधूरे हैं, उनका अभिसरण विश्लेषण सहायक फलन $\sigma(z) = \min_{i=1,\ldots,m} F_i(x_k) - F_i(z)$ की गैर-नकारात्मकता पर निर्भर करता है, यह शर्त सुनिश्चित करना कठिन है
अनुसंधान प्रेरणा: मौजूदा विधियों के सैद्धांतिक विश्लेषण में खामियों को दूर करना, Lipschitz स्थिरांक के प्रारंभिक अनुमान के लिए अधिक हल्की आवश्यकताओं वाली विधि प्रस्तावित करना, और महत्वपूर्ण समानता के माध्यम से $\sigma$ की गैर-नकारात्मकता पर निर्भरता से बचना।

मुख्य योगदान

नई एक्सट्रापोलेशन पद योजना प्रस्तावित करना: $y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})$ के एक्सट्रापोलेशन रूप का उपयोग, जहां $\alpha \geq 3$
हल्की प्रारंभिक शर्तें स्थापित करना: केवल Lipschitz स्थिरांक अनुमान अनुक्रम के लिए कमजोर प्रारंभिक शर्तों की आवश्यकता है
महत्वपूर्ण समानता गुण प्राप्त करना: सहायक फलन की गैर-नकारात्मकता पर निर्भरता से बचा गया, सैद्धांतिक विश्लेषण में सुधार किया गया
उप-रैखिक अभिसरण दर प्रमाणित करना: चिकने मामले में $O(1/k^2)$ अभिसरण दर, गैर-चिकने मामले में $O(1/k)$ अभिसरण दर प्राप्त करना
गैर-चिकने मामले तक विस्तार करना: चिकनाई तकनीकों के माध्यम से पूरी तरह गैर-चिकने बहु-उद्देश्य अनुकूलन समस्याओं को संभालना

विधि विवरण

कार्य परिभाषा

मिश्रित बिना-बाधा वाली बहु-उद्देश्य अनुकूलन समस्या (MOP) पर विचार करें: $\min_{x \in \mathbb{R}^n} F(x) = (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T$

जहां:

$f_i: \mathbb{R}^n \to \mathbb{R}$ निरंतर अवकलनीय उत्तल फलन हैं
$g_i: \mathbb{R}^n \to \mathbb{R}$ उत्तल फलन हैं (संभवतः गैर-चिकने)
उद्देश्य कमजोर Pareto इष्टतम समाधान खोजना है

मॉडल आर्किटेक्चर

चिकने मामले का एल्गोरिदम (Algorithm 1)

मुख्य उप-समस्या: $\min_{z \in \mathbb{R}^n} \phi_{L(f)}(z; x, y) = \max_{i=1,\ldots,m}[\langle\nabla f_i(y), z-y\rangle + g_i(z) + f_i(y) - F_i(x)] + \frac{L(f)}{2}\|z-y\|^2$

एल्गोरिदम के चरण:

एक्सट्रापोलेशन बिंदु की गणना करें: $y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})$
उप-समस्या को हल करें: $x_{k+1} = p_{s_k}(x_k, y_k)$
पैरामीटर अपडेट करें: $s_{k+1} = \eta s_k$ , जहां $\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}$

पैरामीटर शर्तें:

जब $\alpha > 3$ हो: $0 < \frac{\alpha-2}{\alpha-3}s_0 < \frac{1}{L(f)}$
जब $\alpha = 3$ हो: $0 < s_0 < \frac{1}{L(f)}$

गैर-चिकने मामले का एल्गोरिदम (Algorithm 2)

चिकनाई फलन $\tilde{f}_i(x, \mu)$ के माध्यम से गैर-चिकने फलन $f_i(x)$ का अनुमान लगाएं, जहां चिकनाई फलन निम्नलिखित को संतुष्ट करता है:

निरंतर अवकलनीयता: निश्चित $\mu > 0$ के लिए, $\tilde{f}(\cdot, \mu)$ निरंतर अवकलनीय है
सामंजस्य: $\lim_{z \to x, \mu \downarrow 0} \tilde{f}(z, \mu) = f(x)$
ग्रेडिएंट सामंजस्य: $\{\lim_{z \to x, \mu \downarrow 0} \nabla\tilde{f}(z, \mu)\} \subseteq \partial f(x)$

तकनीकी नवाचार बिंदु

नई एक्सट्रापोलेशन गुणांक डिजाइन: विशिष्ट पैरामीटर अपडेट विधि $\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}$ के माध्यम से $s_k < \frac{1}{L(f)}$ को सुनिश्चित करना
महत्वपूर्ण समानता व्युत्पत्ति: बीजगणितीय संचालन और पैरामीटर चयन के माध्यम से, $\sigma_k(z)$ की गैर-नकारात्मकता पर निर्भरता से बचा गया
एकीकृत ढांचा: जब $\alpha = 3$ हो तो मौजूदा विधियों में विघटित होता है, लेकिन अधिक पूर्ण सैद्धांतिक विश्लेषण प्रदान करता है

प्रयोग सेटअप

डेटासेट

पेपर तीन त्रि-उद्देश्य अनुकूलन समस्याओं के संख्यात्मक प्रयोगों का उल्लेख करता है:

BK1&ℓ1 समस्या
JOS1&ℓ1 समस्या
SP1&ℓ1 समस्या

मूल्यांकन मेट्रिक्स

merit फलन $u_0(x) = \sup_{z \in \mathbb{R}^n} \min_{i=1,\ldots,m}[F_i(x) - F_i(z)]$ का उपयोग करके एल्गोरिदम प्रदर्शन का मूल्यांकन करें, यह फलन निम्नलिखित को संतुष्ट करता है:

$u_0(x) \geq 0$ सभी $x$ के लिए
$x$ कमजोर Pareto इष्टतम है यदि और केवल यदि $u_0(x) = 0$

कार्यान्वयन विवरण

रोकने की कसौटी: $\|x_k - x_{k+1}\| < \varepsilon$
गैर-चिकने मामले के लिए $\mu_k < \varepsilon$ भी आवश्यक है
पैरामीटर अपडेट: $\mu_{k+1} = \frac{k+\alpha-2}{k+\alpha-1}\mu_k$ , $s_{k+1} = \frac{k+\alpha-2}{k+\alpha-3}s_k$

प्रयोग परिणाम

मुख्य परिणाम

पेपर तीन त्रि-उद्देश्य अनुकूलन समस्याओं के Pareto सीमांत ग्राफ प्रदर्शित करता है, लेकिन प्रदान किए गए दस्तावेज़ में विशिष्ट संख्यात्मक परिणाम और प्रदर्शन तुलना डेटा पूर्ण नहीं हैं।

अभिसरण सैद्धांतिक परिणाम

चिकने मामले (Theorem 4.3): $u_0(x_k) \leq \frac{L(f)(\alpha-1)^2}{2(k+\alpha-1)^2}R$ $O(1/k^2)$ की अभिसरण दर प्राप्त करता है।

गैर-चिकने मामले (Theorem 6.2): $u_0(x_{k+1}) \leq O\left(\frac{1}{k}\right)$ $O(1/k)$ की अभिसरण दर प्राप्त करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

नई एक्सट्रापोलेशन पद के साथ त्वरित प्रॉक्सिमल ग्रेडिएंट विधि प्रस्तावित की गई है, जो चिकने और गैर-चिकने बहु-उद्देश्य अनुकूलन के लिए उपयुक्त है
पूर्ण अभिसरण सैद्धांतिकी स्थापित की गई है, मौजूदा विधियों की सैद्धांतिक खामियों से बचा गया है
चिकने मामले में $O(1/k^2)$ अभिसरण दर, गैर-चिकने मामले में $O(1/k)$ अभिसरण दर प्राप्त की गई है

सीमाएं

प्रयोग भाग अपर्याप्त: संख्यात्मक प्रयोग परिणाम प्रदर्शन अधूरा है, विस्तृत प्रदर्शन तुलना की कमी है
पैरामीटर चयन प्रतिबंध: प्रारंभिक पैरामीटर $s_0$ और $\alpha$ के लिए विशिष्ट आवश्यकताएं हैं
गैर-चिकने मामले की अभिसरण दर धीमी: चिकने मामले की तुलना में, गैर-चिकना संस्करण अभिसरण दर $O(1/k)$ तक कम हो जाती है

भविष्य की दिशाएं

गैर-चिकने मामले की अभिसरण दर में सुधार के लिए बेहतर चिकनाई तकनीकों की खोज करना
स्वचालित पैरामीटर चयन रणनीति का अनुसंधान करना
बाधित बहु-उद्देश्य अनुकूलन समस्याओं तक विस्तार करना

गहन मूल्यांकन

लाभ

सैद्धांतिक योगदान महत्वपूर्ण: मौजूदा विधियों के सैद्धांतिक विश्लेषण में मुख्य खामियों को हल किया, पूर्ण अभिसरण प्रमाण प्रदान किया
विधि डिजाइन चतुर: विशिष्ट पैरामीटर अपडेट रणनीति के माध्यम से एल्गोरिदम की सैद्धांतिक गारंटी सुनिश्चित की गई
ढांचा एकीकरण: चिकने और गैर-चिकने मामलों को एकीकृत ढांचे में शामिल किया गया
गणितीय कठोरता: प्रमाण प्रक्रिया विस्तृत है, तर्क स्पष्ट है

कमियां

प्रयोग सत्यापन अपर्याप्त: संख्यात्मक प्रयोग भाग बहुत सरल है, अन्य उन्नत विधियों के साथ विस्तृत तुलना की कमी है
व्यावहारिकता विश्लेषण अधूरा: एल्गोरिदम की कम्प्यूटेशनल जटिलता और व्यावहारिक अनुप्रयोग परिदृश्यों का गहन विश्लेषण अभाव है
पैरामीटर संवेदनशीलता पर चर्चा नहीं: पैरामीटर चयन के एल्गोरिदम प्रदर्शन पर प्रभाव का विश्लेषण नहीं किया गया है

प्रभाव

सैद्धांतिक मूल्य उच्च: बहु-उद्देश्य अनुकूलन त्वरित विधियों के लिए अधिक पूर्ण सैद्धांतिक आधार प्रदान करता है
व्यावहारिक मूल्य सत्यापन के लिए प्रतीक्षा: वास्तविक समस्याओं में इसकी प्रभावशीलता को सत्यापित करने के लिए अधिक प्रयोगों की आवश्यकता है
पुनरुत्पादनीयता अच्छी: एल्गोरिदम विवरण स्पष्ट है, सैद्धांतिक विश्लेषण पूर्ण है

लागू परिदृश्य

मिश्रित संरचना वाली बहु-उद्देश्य अनुकूलन समस्याएं
छवि प्रसंस्करण और संपीड़ित संवेदन आदि अनुप्रयोग क्षेत्र
सैद्धांतिक गारंटी की आवश्यकता वाले अनुकूलन परिदृश्य

संदर्भ

पेपर बहु-उद्देश्य अनुकूलन क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:

Tanabe आदि द्वारा बहु-उद्देश्य FISTA पर अग्रणी कार्य
Nesterov त्वरण विधि की संबंधित सैद्धांतिकी
चिकनाई तकनीकों का संबंधित साहित्य
बहु-उद्देश्य अनुकूलन की शास्त्रीय सैद्धांतिकी आधार

समग्र मूल्यांकन: यह एक सैद्धांतिक योगदान में उत्कृष्ट पेपर है, जो मौजूदा बहु-उद्देश्य त्वरित प्रॉक्सिमल ग्रेडिएंट विधियों में सैद्धांतिक खामियों को सफलतापूर्वक हल करता है, और पूर्ण अभिसरण विश्लेषण प्रदान करता है। हालांकि, पेपर में प्रयोग सत्यापन और व्यावहारिकता विश्लेषण के पहलुओं में सुधार की गुंजाइश है।