2025-11-10T02:43:53.338320

Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization

Huang
In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
academic

बहु-उद्देश्य अनुकूलन के लिए नए एक्सट्रापोलेशन पद के साथ तीव्र त्वरित प्रॉक्सिमल ग्रेडिएंट विधि

मूल जानकारी

  • पेपर ID: 2507.06737
  • शीर्षक: बहु-उद्देश्य अनुकूलन के लिए नए एक्सट्रापोलेशन पद के साथ तीव्र त्वरित प्रॉक्सिमल ग्रेडिएंट विधि
  • लेखक: Huang Chengzhi
  • वर्गीकरण: math.OC (अनुकूलन और नियंत्रण)
  • प्रकाशन समय: 17 अक्टूबर, 2025
  • पेपर लिंक: https://arxiv.org/abs/2507.06737

सारांश

इस पेपर में एक नई एक्सट्रापोलेशन गुणांक योजना और एक्सट्रापोलेशन पद प्रस्तावित किया गया है, और एक त्वरित प्रॉक्सिमल ग्रेडिएंट एल्गोरिदम विकसित किया गया है। यह एल्गोरिदम उप-रैखिक अभिसरण दर प्राप्त करता है। प्रस्तावित योजना केवल Lipschitz स्थिरांक अनुमान अनुक्रम के लिए हल्के प्रारंभिक शर्तों की आवश्यकता है, जिसके तहत अभिसरण विश्लेषण का समर्थन करने के लिए महत्वपूर्ण समानता गुण प्राप्त किए जा सकते हैं। संख्यात्मक प्रयोग प्रस्तावित विधि की प्रभावशीलता और व्यावहारिक प्रदर्शन को सत्यापित करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

  1. समस्या को हल करना: बहु-उद्देश्य अनुकूलन समस्याएं, विशेष रूप से मिश्रित बिना-बाधा वाली बहु-उद्देश्य अनुकूलन समस्याएं: minxRnF(x)(f1(x)+g1(x),,fm(x)+gm(x))T\min_{x \in \mathbb{R}^n} F(x) \equiv (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T जहां fif_i चिकनी उत्तल फलन हैं, gig_i उत्तल फलन हैं (संभवतः गैर-चिकने)।
  2. समस्या की महत्ता: बहु-उद्देश्य अनुकूलन व्यावहारिक अनुप्रयोगों में व्यापक रूप से मौजूद है, जैसे छवि पुनर्स्थापन, संपीड़ित संवेदन आदि क्षेत्र। इस तरह की समस्याओं में आमतौर पर कोई एकल इष्टतम समाधान नहीं होता है, बल्कि Pareto इष्टतम समाधान के एक समूह से बना होता है।
  3. मौजूदा विधियों की सीमाएं:
    • Tanabe आदि ने FISTA को बहु-उद्देश्य अनुकूलन तक विस्तारित किया, O(1/k2)O(1/k^2) अभिसरण दर प्राप्त की
    • Sonntag आदि और Zhang आदि के काम में सैद्धांतिक प्रमाण अधूरे हैं, उनका अभिसरण विश्लेषण सहायक फलन σ(z)=mini=1,,mFi(xk)Fi(z)\sigma(z) = \min_{i=1,\ldots,m} F_i(x_k) - F_i(z) की गैर-नकारात्मकता पर निर्भर करता है, यह शर्त सुनिश्चित करना कठिन है
  4. अनुसंधान प्रेरणा: मौजूदा विधियों के सैद्धांतिक विश्लेषण में खामियों को दूर करना, Lipschitz स्थिरांक के प्रारंभिक अनुमान के लिए अधिक हल्की आवश्यकताओं वाली विधि प्रस्तावित करना, और महत्वपूर्ण समानता के माध्यम से σ\sigma की गैर-नकारात्मकता पर निर्भरता से बचना।

मुख्य योगदान

  1. नई एक्सट्रापोलेशन पद योजना प्रस्तावित करना: yk=xk+k+α4k+α1(xkxk1)y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1}) के एक्सट्रापोलेशन रूप का उपयोग, जहां α3\alpha \geq 3
  2. हल्की प्रारंभिक शर्तें स्थापित करना: केवल Lipschitz स्थिरांक अनुमान अनुक्रम के लिए कमजोर प्रारंभिक शर्तों की आवश्यकता है
  3. महत्वपूर्ण समानता गुण प्राप्त करना: सहायक फलन की गैर-नकारात्मकता पर निर्भरता से बचा गया, सैद्धांतिक विश्लेषण में सुधार किया गया
  4. उप-रैखिक अभिसरण दर प्रमाणित करना: चिकने मामले में O(1/k2)O(1/k^2) अभिसरण दर, गैर-चिकने मामले में O(1/k)O(1/k) अभिसरण दर प्राप्त करना
  5. गैर-चिकने मामले तक विस्तार करना: चिकनाई तकनीकों के माध्यम से पूरी तरह गैर-चिकने बहु-उद्देश्य अनुकूलन समस्याओं को संभालना

विधि विवरण

कार्य परिभाषा

मिश्रित बिना-बाधा वाली बहु-उद्देश्य अनुकूलन समस्या (MOP) पर विचार करें: minxRnF(x)=(f1(x)+g1(x),,fm(x)+gm(x))T\min_{x \in \mathbb{R}^n} F(x) = (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T

जहां:

  • fi:RnRf_i: \mathbb{R}^n \to \mathbb{R} निरंतर अवकलनीय उत्तल फलन हैं
  • gi:RnRg_i: \mathbb{R}^n \to \mathbb{R} उत्तल फलन हैं (संभवतः गैर-चिकने)
  • उद्देश्य कमजोर Pareto इष्टतम समाधान खोजना है

मॉडल आर्किटेक्चर

चिकने मामले का एल्गोरिदम (Algorithm 1)

मुख्य उप-समस्या: minzRnϕL(f)(z;x,y)=maxi=1,,m[fi(y),zy+gi(z)+fi(y)Fi(x)]+L(f)2zy2\min_{z \in \mathbb{R}^n} \phi_{L(f)}(z; x, y) = \max_{i=1,\ldots,m}[\langle\nabla f_i(y), z-y\rangle + g_i(z) + f_i(y) - F_i(x)] + \frac{L(f)}{2}\|z-y\|^2

एल्गोरिदम के चरण:

  1. एक्सट्रापोलेशन बिंदु की गणना करें: yk=xk+k+α4k+α1(xkxk1)y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})
  2. उप-समस्या को हल करें: xk+1=psk(xk,yk)x_{k+1} = p_{s_k}(x_k, y_k)
  3. पैरामीटर अपडेट करें: sk+1=ηsks_{k+1} = \eta s_k, जहां η=(k+α2)2(k+α1)(k+α3)\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}

पैरामीटर शर्तें:

  • जब α>3\alpha > 3 हो: 0<α2α3s0<1L(f)0 < \frac{\alpha-2}{\alpha-3}s_0 < \frac{1}{L(f)}
  • जब α=3\alpha = 3 हो: 0<s0<1L(f)0 < s_0 < \frac{1}{L(f)}

गैर-चिकने मामले का एल्गोरिदम (Algorithm 2)

चिकनाई फलन f~i(x,μ)\tilde{f}_i(x, \mu) के माध्यम से गैर-चिकने फलन fi(x)f_i(x) का अनुमान लगाएं, जहां चिकनाई फलन निम्नलिखित को संतुष्ट करता है:

  • निरंतर अवकलनीयता: निश्चित μ>0\mu > 0 के लिए, f~(,μ)\tilde{f}(\cdot, \mu) निरंतर अवकलनीय है
  • सामंजस्य: limzx,μ0f~(z,μ)=f(x)\lim_{z \to x, \mu \downarrow 0} \tilde{f}(z, \mu) = f(x)
  • ग्रेडिएंट सामंजस्य: {limzx,μ0f~(z,μ)}f(x)\{\lim_{z \to x, \mu \downarrow 0} \nabla\tilde{f}(z, \mu)\} \subseteq \partial f(x)

तकनीकी नवाचार बिंदु

  1. नई एक्सट्रापोलेशन गुणांक डिजाइन: विशिष्ट पैरामीटर अपडेट विधि η=(k+α2)2(k+α1)(k+α3)\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)} के माध्यम से sk<1L(f)s_k < \frac{1}{L(f)} को सुनिश्चित करना
  2. महत्वपूर्ण समानता व्युत्पत्ति: बीजगणितीय संचालन और पैरामीटर चयन के माध्यम से, σk(z)\sigma_k(z) की गैर-नकारात्मकता पर निर्भरता से बचा गया
  3. एकीकृत ढांचा: जब α=3\alpha = 3 हो तो मौजूदा विधियों में विघटित होता है, लेकिन अधिक पूर्ण सैद्धांतिक विश्लेषण प्रदान करता है

प्रयोग सेटअप

डेटासेट

पेपर तीन त्रि-उद्देश्य अनुकूलन समस्याओं के संख्यात्मक प्रयोगों का उल्लेख करता है:

  • BK1&ℓ1 समस्या
  • JOS1&ℓ1 समस्या
  • SP1&ℓ1 समस्या

मूल्यांकन मेट्रिक्स

merit फलन u0(x)=supzRnmini=1,,m[Fi(x)Fi(z)]u_0(x) = \sup_{z \in \mathbb{R}^n} \min_{i=1,\ldots,m}[F_i(x) - F_i(z)] का उपयोग करके एल्गोरिदम प्रदर्शन का मूल्यांकन करें, यह फलन निम्नलिखित को संतुष्ट करता है:

  • u0(x)0u_0(x) \geq 0 सभी xx के लिए
  • xx कमजोर Pareto इष्टतम है यदि और केवल यदि u0(x)=0u_0(x) = 0

कार्यान्वयन विवरण

  • रोकने की कसौटी: xkxk+1<ε\|x_k - x_{k+1}\| < \varepsilon
  • गैर-चिकने मामले के लिए μk<ε\mu_k < \varepsilon भी आवश्यक है
  • पैरामीटर अपडेट: μk+1=k+α2k+α1μk\mu_{k+1} = \frac{k+\alpha-2}{k+\alpha-1}\mu_k, sk+1=k+α2k+α3sks_{k+1} = \frac{k+\alpha-2}{k+\alpha-3}s_k

प्रयोग परिणाम

मुख्य परिणाम

पेपर तीन त्रि-उद्देश्य अनुकूलन समस्याओं के Pareto सीमांत ग्राफ प्रदर्शित करता है, लेकिन प्रदान किए गए दस्तावेज़ में विशिष्ट संख्यात्मक परिणाम और प्रदर्शन तुलना डेटा पूर्ण नहीं हैं।

अभिसरण सैद्धांतिक परिणाम

चिकने मामले (Theorem 4.3): u0(xk)L(f)(α1)22(k+α1)2Ru_0(x_k) \leq \frac{L(f)(\alpha-1)^2}{2(k+\alpha-1)^2}RO(1/k2)O(1/k^2) की अभिसरण दर प्राप्त करता है।

गैर-चिकने मामले (Theorem 6.2): u0(xk+1)O(1k)u_0(x_{k+1}) \leq O\left(\frac{1}{k}\right)O(1/k)O(1/k) की अभिसरण दर प्राप्त करता है।

संबंधित कार्य

  1. बहु-उद्देश्य FISTA विस्तार: Tanabe आदि ने पहली बार FISTA को बहु-उद्देश्य अनुकूलन तक विस्तारित किया, O(1/k2)O(1/k^2) अभिसरण दर प्राप्त की
  2. एकरस रूपांतर: Nishimura आदि ने बहु-उद्देश्य FISTA का एकरस रूपांतर प्रस्तावित किया
  3. सामान्यीकृत ढांचा: Tanabe आदि ने हाइपरपैरामीटर पेश करके ढांचे को एकल-उद्देश्य मामले तक सामान्यीकृत किया
  4. Nesterov-शैली योजना: Sonntag आदि और Zhang आदि ने अधिक प्रभावी एक्सट्रापोलेशन पद का उपयोग करने का प्रयास किया, लेकिन सैद्धांतिक विश्लेषण अधूरा है
  5. गैर-चिकनी विधि: Gebken आदि ने गैर-चिकने बहु-उद्देश्य अनुकूलन के लिए उप-ग्रेडिएंट अवतरण एल्गोरिदम प्रस्तावित किया

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. नई एक्सट्रापोलेशन पद के साथ त्वरित प्रॉक्सिमल ग्रेडिएंट विधि प्रस्तावित की गई है, जो चिकने और गैर-चिकने बहु-उद्देश्य अनुकूलन के लिए उपयुक्त है
  2. पूर्ण अभिसरण सैद्धांतिकी स्थापित की गई है, मौजूदा विधियों की सैद्धांतिक खामियों से बचा गया है
  3. चिकने मामले में O(1/k2)O(1/k^2) अभिसरण दर, गैर-चिकने मामले में O(1/k)O(1/k) अभिसरण दर प्राप्त की गई है

सीमाएं

  1. प्रयोग भाग अपर्याप्त: संख्यात्मक प्रयोग परिणाम प्रदर्शन अधूरा है, विस्तृत प्रदर्शन तुलना की कमी है
  2. पैरामीटर चयन प्रतिबंध: प्रारंभिक पैरामीटर s0s_0 और α\alpha के लिए विशिष्ट आवश्यकताएं हैं
  3. गैर-चिकने मामले की अभिसरण दर धीमी: चिकने मामले की तुलना में, गैर-चिकना संस्करण अभिसरण दर O(1/k)O(1/k) तक कम हो जाती है

भविष्य की दिशाएं

  1. गैर-चिकने मामले की अभिसरण दर में सुधार के लिए बेहतर चिकनाई तकनीकों की खोज करना
  2. स्वचालित पैरामीटर चयन रणनीति का अनुसंधान करना
  3. बाधित बहु-उद्देश्य अनुकूलन समस्याओं तक विस्तार करना

गहन मूल्यांकन

लाभ

  1. सैद्धांतिक योगदान महत्वपूर्ण: मौजूदा विधियों के सैद्धांतिक विश्लेषण में मुख्य खामियों को हल किया, पूर्ण अभिसरण प्रमाण प्रदान किया
  2. विधि डिजाइन चतुर: विशिष्ट पैरामीटर अपडेट रणनीति के माध्यम से एल्गोरिदम की सैद्धांतिक गारंटी सुनिश्चित की गई
  3. ढांचा एकीकरण: चिकने और गैर-चिकने मामलों को एकीकृत ढांचे में शामिल किया गया
  4. गणितीय कठोरता: प्रमाण प्रक्रिया विस्तृत है, तर्क स्पष्ट है

कमियां

  1. प्रयोग सत्यापन अपर्याप्त: संख्यात्मक प्रयोग भाग बहुत सरल है, अन्य उन्नत विधियों के साथ विस्तृत तुलना की कमी है
  2. व्यावहारिकता विश्लेषण अधूरा: एल्गोरिदम की कम्प्यूटेशनल जटिलता और व्यावहारिक अनुप्रयोग परिदृश्यों का गहन विश्लेषण अभाव है
  3. पैरामीटर संवेदनशीलता पर चर्चा नहीं: पैरामीटर चयन के एल्गोरिदम प्रदर्शन पर प्रभाव का विश्लेषण नहीं किया गया है

प्रभाव

  1. सैद्धांतिक मूल्य उच्च: बहु-उद्देश्य अनुकूलन त्वरित विधियों के लिए अधिक पूर्ण सैद्धांतिक आधार प्रदान करता है
  2. व्यावहारिक मूल्य सत्यापन के लिए प्रतीक्षा: वास्तविक समस्याओं में इसकी प्रभावशीलता को सत्यापित करने के लिए अधिक प्रयोगों की आवश्यकता है
  3. पुनरुत्पादनीयता अच्छी: एल्गोरिदम विवरण स्पष्ट है, सैद्धांतिक विश्लेषण पूर्ण है

लागू परिदृश्य

  1. मिश्रित संरचना वाली बहु-उद्देश्य अनुकूलन समस्याएं
  2. छवि प्रसंस्करण और संपीड़ित संवेदन आदि अनुप्रयोग क्षेत्र
  3. सैद्धांतिक गारंटी की आवश्यकता वाले अनुकूलन परिदृश्य

संदर्भ

पेपर बहु-उद्देश्य अनुकूलन क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:

  • Tanabe आदि द्वारा बहु-उद्देश्य FISTA पर अग्रणी कार्य
  • Nesterov त्वरण विधि की संबंधित सैद्धांतिकी
  • चिकनाई तकनीकों का संबंधित साहित्य
  • बहु-उद्देश्य अनुकूलन की शास्त्रीय सैद्धांतिकी आधार

समग्र मूल्यांकन: यह एक सैद्धांतिक योगदान में उत्कृष्ट पेपर है, जो मौजूदा बहु-उद्देश्य त्वरित प्रॉक्सिमल ग्रेडिएंट विधियों में सैद्धांतिक खामियों को सफलतापूर्वक हल करता है, और पूर्ण अभिसरण विश्लेषण प्रदान करता है। हालांकि, पेपर में प्रयोग सत्यापन और व्यावहारिकता विश्लेषण के पहलुओं में सुधार की गुंजाइश है।