2025-11-16T17:31:12.997131

On the convergence of stochastic variance reduced gradient for linear inverse problems

Jin, Zhou
Stochastic variance reduced gradient (SVRG) is an accelerated version of stochastic gradient descent based on variance reduction, and is promising for solving large-scale inverse problems. In this work, we analyze SVRG and a regularized version that incorporates a priori knowledge of the problem, for solving linear inverse problems in Hilbert spaces. We prove that, with suitable constant step size schedules and regularity conditions, the regularized SVRG can achieve optimal convergence rates in terms of the noise level without any early stopping rules, and standard SVRG is also optimal for problems with nonsmooth solutions under a priori stopping rules. The analysis is based on an explicit error recursion and suitable prior estimates on the inner loop updates with respect to the anchor point. Numerical experiments are provided to complement the theoretical analysis.
academic

रैखिक व्युत्क्रम समस्याओं के लिए स्टोकेस्टिक विचरण कम प्रवणता के अभिसरण पर

मूल जानकारी

  • पेपर ID: 2510.14759
  • शीर्षक: रैखिक व्युत्क्रम समस्याओं के लिए स्टोकेस्टिक विचरण कम प्रवणता के अभिसरण पर
  • लेखक: Bangti Jin, Zehui Zhou (हांगकांग चीनी विश्वविद्यालय गणित विभाग)
  • वर्गीकरण: math.NA cs.NA math.OC
  • प्रकाशन समय: 16 अक्टूबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.14759

सारांश

स्टोकेस्टिक विचरण कम प्रवणता विधि (SVRG) विचरण कमी पर आधारित स्टोकेस्टिक प्रवणता अवतरण का त्वरित संस्करण है, जो बड़े पैमाने की व्युत्क्रम समस्याओं को हल करने में आशाजनक है। यह पेपर SVRG और इसके पूर्व ज्ञान के साथ संयुक्त नियमितकरण संस्करण का विश्लेषण करता है, जो हिल्बर्ट स्पेस में रैखिक व्युत्क्रम समस्याओं को हल करने के लिए है। अनुसंधान प्रमाणित करता है कि उपयुक्त स्थिर चरण अनुसूची और नियमितता शर्तों के तहत, नियमितकृत SVRG शोर स्तर के संबंध में इष्टतम अभिसरण दर प्राप्त कर सकता है, किसी भी प्रारंभिक रोक नियम की आवश्यकता के बिना; मानक SVRG पूर्व रोक नियम के तहत गैर-चिकनी समाधान समस्याओं के लिए भी इष्टतम है। विश्लेषण स्पष्ट त्रुटि पुनरावृत्ति और एंकर बिंदुओं के बारे में आंतरिक लूप अपडेट के संबंध में उपयुक्त पूर्व अनुमानों पर आधारित है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या विवरण

यह पेपर हिल्बर्ट स्पेस में रैखिक व्युत्क्रम समस्या का अध्ययन करता है: Ax=yA_\dagger x = y_\dagger

जहां:

  • A:XY=Y1××YnA_\dagger: X \to Y = Y_1 \times \cdots \times Y_n प्रणाली संचालक है
  • xXx \in X अज्ञात संकेत है, yYy_\dagger \in Y सटीक डेटा है
  • व्यावहारिक रूप से केवल शोर युक्त डेटा yδ=y+ξy^\delta = y_\dagger + \xi प्राप्त किया जा सकता है, शोर स्तर δ=ξY\delta = \|\xi\|_Y

अनुसंधान प्रेरणा

  1. बड़े पैमाने की समस्या की आवश्यकता: रैखिक व्युत्क्रम समस्याएं कंप्यूटर टोमोग्राफी, पॉज़िट्रॉन उत्सर्जन टोमोग्राफी जैसे व्यावहारिक अनुप्रयोगों में व्यापक रूप से दिखाई देती हैं, डेटा का आकार विशाल है
  2. मौजूदा विधियों की सीमाएं: पारंपरिक पुनरावृत्तिमूलक विधियां बड़े पैमाने की समस्याओं पर कम्प्यूटेशनल दक्षता में कमजोर हैं
  3. SVRG लाभ: स्टोकेस्टिक विचरण कम प्रवणता विधि उत्कृष्ट स्केलेबिलिटी रखती है, लेकिन व्युत्क्रम समस्याओं में इसका सैद्धांतिक विश्लेषण अभी भी अधूरा है
  4. नियमितकरण आवश्यकता: मानक SVRG को नियमितकरण प्राप्त करने के लिए प्रारंभिक रोक नियम की आवश्यकता है, जबकि पूर्व ज्ञान का समावेश इसे सुधार सकता है

मुख्य योगदान

  1. सैद्धांतिक विश्लेषण में सुधार: रैखिक व्युत्क्रम समस्याओं को हल करने के लिए SVRG और नियमितकृत SVRG (rSVRG) का संपूर्ण अभिसरण सिद्धांत स्थापित किया
  2. इष्टतम अभिसरण दर: उपयुक्त शर्तों के तहत दोनों विधियां इष्टतम अभिसरण दर O(δ2ν/(1+2ν))O(\delta^{2\nu/(1+2\nu)}) प्राप्त कर सकती हैं
  3. नियमितकरण गुण: rSVRG में आंतरिक नियमितकरण तंत्र है, प्रारंभिक रोक नियम की आवश्यकता नहीं है; मानक SVRG पूर्व रोक के तहत भी नियमितकरण गुण रखता है
  4. अपेक्षित और समान अभिसरण: साथ ही अपेक्षित अर्थ और समान अर्थ में अभिसरण दर स्थापित की, मौजूदा परिणामों का विस्तार किया
  5. शर्तों में छूट: मौजूदा कार्य की तुलना में SVRG इष्टतम अभिसरण के लिए शर्तें अधिक शिथिल हैं

विधि विवरण

कार्य परिभाषा

अनुकूलन समस्या पर विचार करें: J(x)=12nAxyδY2=1ni=1nfi(x)J(x) = \frac{1}{2n}\|A_\dagger x - y^\delta\|_Y^2 = \frac{1}{n}\sum_{i=1}^n f_i(x) जहां fi(x)=12A,ixyiδYi2f_i(x) = \frac{1}{2}\|A_{\dagger,i}x - y^\delta_i\|_{Y_i}^2

एल्गोरिदम आर्किटेक्चर

मानक SVRG (एल्गोरिदम 1)

प्रारंभिकीकरण: x₀^δ = x₀, आवृत्ति M, चरण आकार {ηₖ}
for K = 0,1,... do
    gₖ = J'(x_{KM}^δ) = (1/n)A_†*(A_†x_{KM}^δ - y^δ) की गणना करें
    for t = 0,1,...,M-1 do
        यादृच्छिक रूप से i_{KM+t} ∈ {1,...,n} का नमूना लें
        अपडेट x_{KM+t+1}^δ = x_{KM+t}^δ - η_{KM+t}(A*_{i_{KM+t}}A_{i_{KM+t}}(x_{KM+t}^δ - x_{KM}^δ) + gₖ)
    end
end

नियमितकृत SVRG (एल्गोरिदम 2)

संचालक AA_\dagger को अनुमानित संचालक AA से बदलें, काटे गए एकवचन मान अपघटन के माध्यम से प्राप्त: A()=j=1Jσjϕj,ψjA(\cdot) = \sum_{j=1}^J \sigma_j\langle\phi_j, \cdot\rangle\psi_j जहां σjaδb\sigma_j \geq a\delta^b को संतुष्ट करने वाले मुख्य एकवचन मान रखे जाते हैं।

मुख्य मान्यताएं (मान्यता 2.1)

  1. चरण आकार शर्त: ηj=c0L1\eta_j = c_0 \leq L^{-1}, जहां L=max1inAi2L = \max_{1\leq i\leq n}\|A_i\|^2
  2. स्रोत शर्त: ν>0\nu > 0 और wN(A)w \in N(A_\dagger)^\perp मौजूद हैं जैसे कि xx0=Bνwx_\dagger - x_0 = B_\dagger^\nu w
  3. संचालक सन्निकटन: जब a>0a > 0 हो, तो AA काटे गए SVD के माध्यम से निर्मित है, σjaδb\sigma_j \geq a\delta^b के एकवचन मान रखे जाते हैं

तकनीकी नवाचार बिंदु

  1. त्रुटि अपघटन रणनीति: त्रुटि को पूर्वाग्रह और विचरण दोनों भागों में अपघटित करें, प्रत्येक को सटीक रूप से अनुमानित करें
  2. एंकर बिंदु विश्लेषण: आंतरिक लूप अपडेट के व्यवहार को एंकर बिंदु के संबंध में विश्लेषण करके, महत्वपूर्ण पूर्व अनुमान स्थापित करें
  3. एकीकृत ढांचा: मानक SVRG और नियमितकृत SVRG को संभालने के लिए एकीकृत सैद्धांतिक ढांचा प्रदान करें

प्रायोगिक सेटअप

डेटासेट

Regutools पैकेज में तीन मानक व्युत्क्रम समस्याओं का उपयोग करें:

  • s-phillips: हल्की रोग समस्या (mildly ill-posed)
  • s-gravity: गंभीर रोग समस्या (severely ill-posed)
  • s-shaw: गंभीर रोग समस्या (severely ill-posed)

सभी समस्याओं को n=m=1000n = m = 1000 के परिमित-आयामी रैखिक प्रणाली में विवेकित किया गया है।

प्रायोगिक पैरामीटर

  • सटीक समाधान पीढ़ी: x=(AA)νxe1(AA)νxex_\dagger = \|(A_\dagger^*A_\dagger)^\nu x_e\|_{\ell^\infty}^{-1}(A_\dagger^*A_\dagger)^\nu x_e
  • शोर सेटिंग: yiδ=y,i+ϵyξiy^\delta_i = y_{\dagger,i} + \epsilon\|y_\dagger\|_{\ell^\infty}\xi_i, ξiN(0,1)\xi_i \sim \mathcal{N}(0,1)
  • चरण आकार: Landweber विधि के लिए c0=A2c_0 = \|A_\dagger\|^{-2}, (r)SVRG के लिए c0=O(c)c_0 = O(c), जहां c=L1c = L^{-1}
  • आवृत्ति: M=2nM = 2n
  • अधिकतम पुनरावृत्ति: 10510^5 राउंड

तुलना विधियां

  • Landweber विधि (LM): शास्त्रीय पुनरावृत्तिमूलक नियमितकरण विधि, विसंगति सिद्धांत का उपयोग करके रोकें
  • मानक SVRG: इष्टतम त्रुटि बिंदु का उपयोग करके रोकें
  • नियमितकृत SVRG (rSVRG): सिद्धांत-निर्देशित रोक मानदंड का उपयोग करें

प्रायोगिक परिणाम

मुख्य सैद्धांतिक परिणाम (प्रमेय 2.1)

मान्यता 2.1 के तहत, k,n,δk,n,\delta से स्वतंत्र एक स्थिरांक cc^* मौजूद है जैसे कि:

अपेक्षित अभिसरण दर:

\delta^{2\nu/(1+2\nu)}, & a > 0 \\ n^{-1/2}\sqrt{k}\delta, & a = 0 \end{cases}$$ **समान अभिसरण दर**: $$\|e_k^\delta\| \leq \sqrt{n}c^*k^{-1/2+\max(1/2-\nu,0)} + c^*\begin{cases} \delta^{2\nu/(1+2\nu)}, & a > 0 \\ n^{-1/2}\sqrt{k}\delta, & a = 0 \end{cases}$$ ### इष्टतमता परिणाम (परिणाम 2.1) - **rSVRG**: प्रारंभिक रोक के बिना इष्टतम दर $O(\delta^{2\nu/(1+2\nu)})$ प्राप्त कर सकता है - **SVRG**: पूर्व रोक $k(\delta) = O(\delta^{-2/(1+2\nu)})$ के तहत $\nu \in (0,1/2]$ के लिए इष्टतम प्राप्त करता है ### संख्यात्मक प्रायोगिक परिणाम प्रायोगिक परिणाम विभिन्न नियमितता पैरामीटर $\nu$ और शोर स्तर $\epsilon$ के तहत दिखाते हैं: 1. **rSVRG लाभ**: सभी परीक्षण मामलों में Landweber विधि के समान परिशुद्धता प्राप्त कर सकता है, लेकिन पुनरावृत्ति संख्या में उल्लेखनीय रूप से कम है 2. **SVRG प्रदर्शन**: कम नियमितता स्थितियों में अच्छा प्रदर्शन करता है, लेकिन उच्च नियमितता समाधान के लिए छोटे चरण आकार की आवश्यकता होती है 3. **अभिसरण व्यवहार**: उच्च शोर स्तर को कम पुनरावृत्ति संख्या की आवश्यकता होती है, सैद्धांतिक अपेक्षा के अनुरूप 4. **प्लेटफॉर्म प्रभाव**: rSVRG की अंतिम त्रुटि आमतौर पर अन्य दोनों विधियों से कम होती है विशिष्ट संख्यात्मक परिणाम तालिका 1-3 में दिए गए हैं, उदाहरण के लिए s-phillips समस्या के लिए: - जब $\nu=0, \epsilon=1e-3$ हो, तो rSVRG $1.93e-2$ की सापेक्ष त्रुटि प्राप्त करता है, केवल 102.825 पुनरावृत्तियों की आवश्यकता है - इसके विपरीत, Landweber विधि को समान परिशुद्धता प्राप्त करने के लिए 758 पुनरावृत्तियों की आवश्यकता है ## संबंधित कार्य ### स्टोकेस्टिक अनुकूलन विधियां - **SGD वर्ग विधियां**: स्टोकेस्टिक प्रवणता अवतरण और व्युत्क्रम समस्याओं में इसके रूपांतर - **विचरण कमी तकनीकें**: SVRG, SAGA आदि विचरण कमी विधियों का विकास ### व्युत्क्रम समस्या सिद्धांत - **नियमितकरण सिद्धांत**: Tikhonov नियमितकरण, पुनरावृत्तिमूलक नियमितकरण विधियां - **स्रोत शर्त**: समाधान की चिकनाई को दर्शाने वाली मानक मान्यताएं - **इष्टतम अभिसरण दर**: शोर सेटिंग में minimax इष्टतमता ### इस पेपर का योगदान स्थान Jin et al. (2022) और Jin & Chen (2025) के कार्य की तुलना में: - अधिक शिथिल शर्तें: SVRG अभिसरण के लिए अधिक व्यावहारिक आवश्यकताएं - अधिक संपूर्ण विश्लेषण: अपेक्षित और समान अभिसरण दर दोनों प्रदान करता है - अधिक व्यावहारिक विधि: rSVRG को प्रारंभिक रोक नियम की आवश्यकता नहीं है ## निष्कर्ष और चर्चा ### मुख्य निष्कर्ष 1. **सैद्धांतिक पूर्णता**: रैखिक व्युत्क्रम समस्याओं को हल करने के लिए SVRG और rSVRG का संपूर्ण सैद्धांतिक ढांचा स्थापित किया 2. **इष्टतमता**: दोनों विधियां उपयुक्त शर्तों के तहत minimax इष्टतम अभिसरण दर प्राप्त कर सकती हैं 3. **व्यावहारिकता**: rSVRG में आंतरिक नियमितकरण है, व्यावहारिक अनुप्रयोग के लिए अधिक उपयुक्त है 4. **शर्त सुधार**: मौजूदा कार्य की तुलना में अभिसरण शर्तों में उल्लेखनीय छूट ### सीमाएं 1. **शोर स्तर निर्भरता**: विधि को संचालक $A$ निर्माण और रोक मानदंड चयन के लिए ज्ञात शोर स्तर $\delta$ की आवश्यकता है 2. **पैरामीटर चयन**: व्यावहारिक अनुप्रयोग में पैरामीटर $a,b$ का चयन अनुमानी तकनीकों की आवश्यकता है 3. **रैखिक सीमा**: वर्तमान विश्लेषण केवल रैखिक व्युत्क्रम समस्याओं पर लागू होता है 4. **कम्प्यूटेशनल जटिलता**: प्रत्येक बाहरी लूप को संपूर्ण प्रवणता की गणना की आवश्यकता है, कुछ मामलों में महंगा हो सकता है ### भविष्य की दिशाएं 1. **स्व-अनुकूली विधियां**: ज्ञात शोर स्तर पर निर्भर नहीं करने वाले स्व-अनुकूली संस्करण विकसित करें 2. **गैर-रैखिक विस्तार**: सिद्धांत को गैर-रैखिक व्युत्क्रम समस्याओं तक विस्तारित करें 3. **व्यावहारिक अनुप्रयोग**: विशिष्ट इमेजिंग और संकेत प्रसंस्करण समस्याओं में विधि को सत्यापित करें 4. **कम्प्यूटेशनल अनुकूलन**: कम्प्यूटेशनल जटिलता को कम करने की रणनीतियों का अनुसंधान करें ## गहन मूल्यांकन ### शक्तियां 1. **सैद्धांतिक कठोरता**: गणितीय विश्लेषण गहन और विस्तृत है, प्रमाण तकनीकें उन्नत हैं 2. **परिणाम पूर्णता**: अपेक्षित और समान अभिसरण दर दोनों प्रदान करता है, सैद्धांतिक रिक्त स्थान को भरता है 3. **विधि व्यावहारिकता**: rSVRG की प्रारंभिक रोक-मुक्त विशेषता इसे व्यावहारिक अनुप्रयोग के लिए अधिक उपयुक्त बनाती है 4. **शर्त सुधार**: मौजूदा कार्य की तुलना में अभिसरण शर्तों में उल्लेखनीय छूट 5. **पर्याप्त प्रयोग**: संख्यात्मक प्रयोग सैद्धांतिक भविष्यवाणियों को सत्यापित करते हैं, विधि के लाभ प्रदर्शित करते हैं ### कमियां 1. **उच्च तकनीकी दहलीज**: प्रमाण प्रक्रिया अत्यंत जटिल है, समझना और सत्यापन करना कठिन है 2. **पैरामीटर संवेदनशीलता**: विधि प्रदर्शन पैरामीटर चयन के प्रति काफी संवेदनशील है 3. **अनुप्रयोग प्रतिबंध**: ज्ञात शोर स्तर की आवश्यकता व्यावहारिक अनुप्रयोग की सीमा करती है 4. **कम्प्यूटेशनल लागत**: संपूर्ण प्रवणता गणना स्टोकेस्टिक विधि के लाभों को रद्द कर सकती है ### प्रभाव 1. **सैद्धांतिक योगदान**: व्युत्क्रम समस्याओं में स्टोकेस्टिक अनुकूलन के अनुप्रयोग के लिए ठोस सैद्धांतिक आधार प्रदान करता है 2. **विधि मार्गदर्शन**: बड़े पैमाने की व्युत्क्रम समस्या समाधान के लिए नया प्रभावी मार्ग प्रदान करता है 3. **अनुसंधान प्रवर्तन**: स्टोकेस्टिक नियमितकरण विधियों पर अधिक अनुसंधान को प्रेरित कर सकता है 4. **व्यावहारिक मूल्य**: चिकित्सा इमेजिंग, भू-भौतिकीय अन्वेषण आदि क्षेत्रों में संभावित अनुप्रयोग ### लागू परिदृश्य 1. **बड़े पैमाने की रैखिक व्युत्क्रम समस्याएं**: विशेष रूप से विशाल डेटा मात्रा वाली इमेजिंग समस्याएं 2. **ज्ञात पूर्व जानकारी**: उपयुक्त अनुमानित संचालक निर्माण कर सकने वाली स्थितियां 3. **अनुमानित शोर स्तर**: डेटा शोर स्तर को उचित रूप से अनुमानित कर सकने वाले अनुप्रयोग 4. **पर्याप्त कम्प्यूटेशनल संसाधन**: संपूर्ण प्रवणता गणना लागत को सहन कर सकने वाले वातावरण ## संदर्भ पेपर 62 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं: - स्टोकेस्टिक अनुकूलन शास्त्रीय साहित्य: Johnson & Zhang (2013), Bottou et al. (2018) - व्युत्क्रम समस्या सिद्धांत: Engl et al. (1996), Herman et al. (1978) - संबंधित अभिसरण विश्लेषण: Jin et al. (2022), Jin & Chen (2025) - अनुप्रयोग पृष्ठभूमि: Hansen (2007), Kereta et al. (2021) --- यह पेपर सैद्धांतिक गहराई और व्यावहारिकता के बीच अच्छा संतुलन प्राप्त करता है, बड़े पैमाने की रैखिक व्युत्क्रम समस्याओं के समाधान के लिए महत्वपूर्ण सैद्धांतिक मार्गदर्शन और व्यावहारिक विधि प्रदान करता है। कुछ सीमाओं के बावजूद, इसका योगदान इस क्षेत्र के विकास को आगे बढ़ाने के लिए महत्वपूर्ण है।