Backward stochastic differential equation (BSDE)-based deep learning methods provide an alternative to Physics-Informed Neural Networks (PINNs) for solving high-dimensional partial differential equations (PDEs), offering potential algorithmic advantages in settings such as stochastic optimal control, where the PDEs of interest are tied to an underlying dynamical system. However, standard BSDE-based solvers have empirically been shown to underperform relative to PINNs in the literature. In this paper, we identify the root cause of this performance gap as a discretization bias introduced by the standard Euler-Maruyama (EM) integration scheme applied to one-step self-consistency BSDE losses, which shifts the optimization landscape off target. We find that this bias cannot be satisfactorily addressed through finer step-sizes or multi-step self-consistency losses. To properly handle this issue, we propose a Stratonovich-based BSDE formulation, which we implement with stochastic Heun integration. We show that our proposed approach completely eliminates the bias issues faced by EM integration. Furthermore, our empirical results show that our Heun-based BSDE method consistently outperforms EM-based variants and achieves competitive results with PINNs across multiple high-dimensional benchmarks. Our findings highlight the critical role of integration schemes in BSDE-based PDE solvers, an algorithmic detail that has received little attention thus far in the literature.
पेपर ID : 2505.01078शीर्षक : Integration Matters for Learning PDEs with Backwards SDEsलेखक : Sungje Park, Stephen Tu (University of Southern California)वर्गीकरण : cs.LG, cs.SY, eess.SY, math.OC, stat.MLप्रकाशन समय : 5 मई 2025 को प्रारंभिक ड्राफ्ट, 13 नवंबर 2025 को संशोधितपेपर लिंक : https://arxiv.org/abs/2505.01078 यह पेपर पश्चगामी यादृच्छिक अवकल समीकरणों (BSDE) पर आधारित गहन शिक्षण विधियों का उपयोग करके उच्च-आयामी आंशिक अवकल समीकरणों (PDE) को हल करने का अध्ययन करता है। यद्यपि BSDE विधि यादृच्छिक इष्टतम नियंत्रण जैसे परिदृश्यों में एल्गोरिथमिक लाभ प्रदान करती है, लेकिन इसका अनुभवजन्य प्रदर्शन भौतिकी-सूचित तंत्रिका नेटवर्क (PINNs) से हमेशा कम रहा है। लेखकों ने प्रदर्शन अंतराल के मूल कारण की पहचान की: मानक Euler-Maruyama (EM) एकीकरण योजना एकल-चरण आत्म-सुसंगत BSDE हानि में विवेकीकरण पूर्वाग्रह का परिचय देती है, जिसे बेहतर चरण आकार या बहु-चरण आत्म-सुसंगत हानि के माध्यम से संतोषजनक रूप से समाधान नहीं किया जा सकता। इसके लिए, लेखकों ने Stratonovich-आधारित BSDE सूत्र प्रस्तावित किया है और यादृच्छिक Heun एकीकरण का उपयोग करके इसे लागू किया है, जो EM एकीकरण के पूर्वाग्रह समस्या को पूरी तरह से समाप्त करता है। प्रायोगिक परिणाम दिखाते हैं कि Heun-BSDE विधि कई उच्च-आयामी बेंचमार्क में EM वेरिएंट से लगातार बेहतर है और PINNs के साथ प्रतिस्पर्धी परिणाम प्राप्त करती है।
आंशिक अवकल समीकरणों (PDE) का संख्यात्मक समाधान वैज्ञानिक और इंजीनियरिंग मॉडलिंग की नींव है, लेकिन पारंपरिक संख्यात्मक विधियां आयाम के श्राप का सामना करती हैं, जो उच्च-आयामी PDE में कम्प्यूटेशनल रूप से अव्यावहारिक हैं। हाल के वर्षों में, गहन शिक्षण विधियां दो मुख्य विकल्प प्रदान करती हैं:
भौतिकी-सूचित तंत्रिका नेटवर्क (PINNs) : यादृच्छिक रूप से नमूना किए गए कॉलोकेशन बिंदुओं पर PDE अवशेष को सीधे कम करनाBSDE विधि : PDE को अग्रगामी-पश्चगामी यादृच्छिक अवकल समीकरणों में पुनर्निर्माण करना, यादृच्छिक प्रक्रियाओं का अनुकरण करके भविष्यवाणी और टर्मिनल स्थिति के बीच अंतर को कम करनायद्यपि BSDE विधि निम्नलिखित परिदृश्यों में लाभ प्रदान करती है:
अंतर्निहित गतिशीलता प्रणाली वाली उच्च-आयामी समस्याएं (जैसे यादृच्छिक इष्टतम नियंत्रण) ऐसी समस्याएं जहां PDE समीकरण को स्पष्ट रूप से प्राप्त नहीं किया जा सकता लेकिन अनुकरण के माध्यम से पहुंचा जा सकता है (मॉडल-मुक्त इष्टतम नियंत्रण) लेकिन मौजूदा अनुसंधान (जैसे Nüsken & Richter 2023) ने पाया है कि BSDE विधि बेंचमार्क परीक्षणों में PINNs से काफी कमजोर है। यह साहित्य समस्या को कम करने के लिए इंटरपोलेशन हानि प्रस्तावित करता है, लेकिन दो महत्वपूर्ण खामियां हैं:
प्रदर्शन अंतराल के मूल कारण को स्पष्ट नहीं किया गया है ट्यून करने के लिए आवश्यक हाइपरपैरामीटर (समय सीमा लंबाई) का परिचय देता है, जो प्रशिक्षण जटिलता बढ़ाता है यह पेपर प्रदर्शन अंतराल के मुख्य स्रोत की पहचान करता है: यादृच्छिक एकीकरण योजना का चयन । मानक EM योजना एकल-चरण BSDE हानि में अविनाशी विवेकीकरण पूर्वाग्रह का परिचय देती है, जो PDE अवशेष पद के समान क्रम का है, जिसे चरण आकार को कम करके समाधान नहीं किया जा सकता।
सैद्धांतिक विश्लेषण : एकल-चरण आत्म-सुसंगत BSDE हानि पर लागू EM और Heun यादृच्छिक एकीकरण योजनाओं का पहली बार व्यवस्थित विश्लेषणEM योजना PDE अवशेष के समान क्रम का गैर-लुप्त पूर्वाग्रह पद प्रस्तुत करती है (प्रमेय 4.2) Heun योजना इस पूर्वाग्रह समस्या को पूरी तरह से समाप्त करती है (प्रमेय 4.4) विधि नवाचार : Stratonovich-BSDE सूत्र को यादृच्छिक Heun एकीकरण के साथ प्रस्तावित करनाअग्रगामी और पश्चगामी SDE को Stratonovich SDE के रूप में व्याख्या करना (Itô SDE के बजाय) संख्यात्मक एकीकरण के लिए यादृच्छिक Heun विधि का उपयोग करना, एकल-चरण हानि में पूर्वाग्रह को समाप्त करना बहु-चरण हानि विश्लेषण : बहु-चरण आत्म-सुसंगत हानि के व्यापार-बंद का गहन विश्लेषण (अनुभाग 5)विभिन्न समय सीमा लंबाई k के तहत EM विधि के प्रदर्शन व्यापार-बंद को प्रकट करना Heun विधि एकल-चरण और बहु-चरण दोनों मामलों में सुसंगतता बनाए रखती है अनुभवजन्य सत्यापन : कई उच्च-आयामी बेंचमार्क (HJB, BSB, BZ समीकरण, 100 आयाम तक) पर सत्यापनHeun-BSDE लगातार EM-BSDE से बेहतर है PINNs के साथ प्रतिस्पर्धी प्रदर्शन प्राप्त करता है, प्रदर्शन समानता को पुनः प्राप्त करता है एल्गोरिथम कार्यान्वयन : कुशल बैच सबसैंपलिंग एल्गोरिथम प्रदान करता है, जो कम्प्यूटेशनल ओवरहेड को काफी कम करता हैनिम्नलिखित गैर-रैखिक सीमा मान PDE पर विचार करें:
R [ u ] ( x , t ) : = ∂ t u ( x , t ) + 1 2 tr ( H ( x , t ) ⋅ ∇ 2 u ( x , t ) ) + ⟨ f ( x , t ) , ∇ u ( x , t ) ⟩ − h [ u ] ( x , t ) = 0 R[u](x,t) := \partial_t u(x,t) + \frac{1}{2}\text{tr}(H(x,t)\cdot\nabla^2 u(x,t)) + \langle f(x,t), \nabla u(x,t)\rangle - h[u](x,t) = 0 R [ u ] ( x , t ) := ∂ t u ( x , t ) + 2 1 tr ( H ( x , t ) ⋅ ∇ 2 u ( x , t )) + ⟨ f ( x , t ) , ∇ u ( x , t )⟩ − h [ u ] ( x , t ) = 0
जहां:
x ∈ Ω ⊆ R d x \in \Omega \subseteq \mathbb{R}^d x ∈ Ω ⊆ R d , t ∈ [ 0 , T ] t \in [0,T] t ∈ [ 0 , T ] सीमा स्थिति: u ( x , T ) = ϕ ( x ) u(x,T) = \phi(x) u ( x , T ) = ϕ ( x ) H ( x , t ) = g ( x , t ) g ( x , t ) T H(x,t) = g(x,t)g(x,t)^T H ( x , t ) = g ( x , t ) g ( x , t ) T सकारात्मक निश्चित मैट्रिक्स हैPINNs विधि :
L PINNs ( θ ) = E ( x , t ) ∼ μ [ ( R [ u θ ] ( x , t ) ) 2 ] L_{\text{PINNs}}(\theta) = \mathbb{E}_{(x,t)\sim\mu}[(R[u_\theta](x,t))^2] L PINNs ( θ ) = E ( x , t ) ∼ μ [( R [ u θ ] ( x , t ) ) 2 ]
BSDE विधि : अग्रगामी SDE पर आधारित
d X t = f ( X t , t ) d t + g ( X t , t ) d B t dX_t = f(X_t,t)dt + g(X_t,t)dB_t d X t = f ( X t , t ) d t + g ( X t , t ) d B t
और पश्चगामी SDE
d Y t = h ( X t , t , Y t , Z t ) d t + Z t T g ( X t , t ) d B t dY_t = h(X_t,t,Y_t,Z_t)dt + Z_t^T g(X_t,t)dB_t d Y t = h ( X t , t , Y t , Z t ) d t + Z t T g ( X t , t ) d B t
H-समय सीमा आत्म-सुसंगत BSDE हानि:
L BSDE , H ( θ ) : = E x 0 , B t [ 1 N H 2 ∑ n = 0 N − 1 ( u θ ( X t n + 1 , t n + 1 ) − u θ ( X t n , t n ) − S θ ( t n , t n + 1 ) ) 2 ] L_{\text{BSDE},H}(\theta) := \mathbb{E}_{x_0,B_t}\left[\frac{1}{NH^2}\sum_{n=0}^{N-1}\left(u_\theta(X_{t_{n+1}},t_{n+1}) - u_\theta(X_{t_n},t_n) - S_\theta(t_n,t_{n+1})\right)^2\right] L BSDE , H ( θ ) := E x 0 , B t [ N H 2 1 ∑ n = 0 N − 1 ( u θ ( X t n + 1 , t n + 1 ) − u θ ( X t n , t n ) − S θ ( t n , t n + 1 ) ) 2 ]
EM विवेकीकरण :
X ^ n + 1 = X ^ n + τ f ( X ^ n , t n ) + τ g ( X ^ n , t n ) w n \hat{X}_{n+1} = \hat{X}_n + \tau f(\hat{X}_n,t_n) + \sqrt{\tau}g(\hat{X}_n,t_n)w_n X ^ n + 1 = X ^ n + τ f ( X ^ n , t n ) + τ g ( X ^ n , t n ) w n Y ^ n + 1 θ = Y ^ n θ + τ h θ ( X ^ n , t n ) + τ ∇ u θ ( X ^ n , t n ) T g ( X ^ n , t n ) w n \hat{Y}^\theta_{n+1} = \hat{Y}^\theta_n + \tau h_\theta(\hat{X}_n,t_n) + \sqrt{\tau}\nabla u_\theta(\hat{X}_n,t_n)^T g(\hat{X}_n,t_n)w_n Y ^ n + 1 θ = Y ^ n θ + τ h θ ( X ^ n , t n ) + τ ∇ u θ ( X ^ n , t n ) T g ( X ^ n , t n ) w n
मुख्य प्रमेय 4.1 (बिंदुवार EM हानि):
निश्चित बिंदु ( x , t ) (x,t) ( x , t ) के लिए, बिंदुवार EM हानि संतुष्ट करती है:
τ − 2 ⋅ ℓ EM , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + 1 2 tr [ ( H ( x , t ) ⋅ ∇ 2 u θ ( x , t ) ) 2 ] + O ( τ 1 / 2 ) \tau^{-2}\cdot\ell_{\text{EM},\tau}(\theta,x,t) = (R[u_\theta](x,t))^2 + \frac{1}{2}\text{tr}[(H(x,t)\cdot\nabla^2 u_\theta(x,t))^2] + O(\tau^{1/2}) τ − 2 ⋅ ℓ EM , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + 2 1 tr [( H ( x , t ) ⋅ ∇ 2 u θ ( x , t ) ) 2 ] + O ( τ 1/2 )
मुख्य प्रमेय 4.2 (पूर्ण EM-BSDE हानि):
L EM , τ ( θ ) = 1 T ∫ 0 T E [ ( R [ u θ ] ( X t , t ) ) 2 + 1 2 tr [ ( H ( X t , t ) ⋅ ∇ 2 u θ ( X t , t ) ) 2 ] ] d t + O ( τ 1 / 2 ) L_{\text{EM},\tau}(\theta) = \frac{1}{T}\int_0^T \mathbb{E}\left[(R[u_\theta](X_t,t))^2 + \frac{1}{2}\text{tr}[(H(X_t,t)\cdot\nabla^2 u_\theta(X_t,t))^2]\right]dt + O(\tau^{1/2}) L EM , τ ( θ ) = T 1 ∫ 0 T E [ ( R [ u θ ] ( X t , t ) ) 2 + 2 1 tr [( H ( X t , t ) ⋅ ∇ 2 u θ ( X t , t ) ) 2 ] ] d t + O ( τ 1/2 )
मुख्य अंतर्दृष्टि : पूर्वाग्रह पद 1 2 tr [ ( H ⋅ ∇ 2 u θ ) 2 ] \frac{1}{2}\text{tr}[(H\cdot\nabla^2 u_\theta)^2] 2 1 tr [( H ⋅ ∇ 2 u θ ) 2 ] PDE अवशेष पद के समान क्रम का है, जिसे चरण आकार τ \tau τ को कम करके समाप्त नहीं किया जा सकता।
Stratonovich अग्रगामी SDE :
d X t ∘ = f ( X t ∘ , t ) d t + g ( X t ∘ , t ) ∘ d B t dX_t^\circ = f(X_t^\circ,t)dt + g(X_t^\circ,t)\circ dB_t d X t ∘ = f ( X t ∘ , t ) d t + g ( X t ∘ , t ) ∘ d B t
संशोधित पश्चगामी SDE :
Stratonovich श्रृंखला नियम के अनुसार,
d u ( X t ∘ , t ) = h ∘ [ u ] ( X t ∘ , t ) d t + ∇ u ( X t ∘ , t ) T g ( X t ∘ , t ) ∘ d B t du(X_t^\circ,t) = h^\circ[u](X_t^\circ,t)dt + \nabla u(X_t^\circ,t)^T g(X_t^\circ,t)\circ dB_t d u ( X t ∘ , t ) = h ∘ [ u ] ( X t ∘ , t ) d t + ∇ u ( X t ∘ , t ) T g ( X t ∘ , t ) ∘ d B t
जहां
h ∘ [ u ] ( x , t ) : = h [ u ] ( x , t ) − 1 2 tr ( H ( x , t ) ∇ 2 u ( x , t ) ) h^\circ[u](x,t) := h[u](x,t) - \frac{1}{2}\text{tr}(H(x,t)\nabla^2 u(x,t)) h ∘ [ u ] ( x , t ) := h [ u ] ( x , t ) − 2 1 tr ( H ( x , t ) ∇ 2 u ( x , t ))
यादृच्छिक Heun विवेकीकरण :
Z ˉ n + 1 θ = Z ^ n θ + τ F θ ( Z ^ n θ , t n ) + τ G θ ( Z ^ n θ , t n ) w n \bar{Z}^\theta_{n+1} = \hat{Z}^\theta_n + \tau F_\theta(\hat{Z}^\theta_n,t_n) + \sqrt{\tau}G_\theta(\hat{Z}^\theta_n,t_n)w_n Z ˉ n + 1 θ = Z ^ n θ + τ F θ ( Z ^ n θ , t n ) + τ G θ ( Z ^ n θ , t n ) w n Z ^ n + 1 θ = Z ^ n θ + τ 2 ( F θ ( Z ^ n θ , t n ) + F θ ( Z ˉ n + 1 θ , t n + 1 ) ) + τ 2 ( G θ ( Z ^ n θ , t n ) + G θ ( Z ˉ n + 1 θ , t n + 1 ) ) w n \hat{Z}^\theta_{n+1} = \hat{Z}^\theta_n + \frac{\tau}{2}(F_\theta(\hat{Z}^\theta_n,t_n) + F_\theta(\bar{Z}^\theta_{n+1},t_{n+1})) + \frac{\sqrt{\tau}}{2}(G_\theta(\hat{Z}^\theta_n,t_n) + G_\theta(\bar{Z}^\theta_{n+1},t_{n+1}))w_n Z ^ n + 1 θ = Z ^ n θ + 2 τ ( F θ ( Z ^ n θ , t n ) + F θ ( Z ˉ n + 1 θ , t n + 1 )) + 2 τ ( G θ ( Z ^ n θ , t n ) + G θ ( Z ˉ n + 1 θ , t n + 1 )) w n
जहां Z t θ = ( X t , Y t θ ) Z^\theta_t = (X_t, Y_t^\theta) Z t θ = ( X t , Y t θ ) संवर्धित प्रक्रिया है।
मुख्य प्रमेय 4.3 (बिंदुवार Heun हानि):
τ − 2 ⋅ ℓ Heun , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + O ( τ 1 / 2 ) \tau^{-2}\cdot\ell_{\text{Heun},\tau}(\theta,x,t) = (R[u_\theta](x,t))^2 + O(\tau^{1/2}) τ − 2 ⋅ ℓ Heun , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + O ( τ 1/2 )
मुख्य प्रमेय 4.4 (पूर्ण Heun-BSDE हानि):
L Heun , τ ( θ ) = 1 T ∫ 0 T E ( R [ u θ ] ( X t ∘ , t ) ) 2 d t + O ( τ 1 / 2 ) L_{\text{Heun},\tau}(\theta) = \frac{1}{T}\int_0^T \mathbb{E}(R[u_\theta](X_t^\circ,t))^2 dt + O(\tau^{1/2}) L Heun , τ ( θ ) = T 1 ∫ 0 T E ( R [ u θ ] ( X t ∘ , t ) ) 2 d t + O ( τ 1/2 )
सफलता का परिणाम : Heun विधि EM विधि में पूर्वाग्रह पद को पूरी तरह से समाप्त करती है, जिससे एकल-चरण हानि का प्रमुख पद केवल PDE अवशेष वर्ग है।
समस्या निदान : पहली बार BSDE प्रदर्शन अंतराल को हानि फ़ंक्शन डिज़ाइन के बजाय एकीकरण योजना के रूप में पहचानासैद्धांतिक सफलता : EM और Heun विधियों के विवेकीकरण पूर्वाग्रह को मापने के लिए कठोर गणितीय प्रमाण प्रदान करता हैविधि डिज़ाइन : Stratonovich व्याख्या का चतुराई से उपयोग करके Hessian-संबंधित पूर्वाग्रह पद को समाप्त करनाव्यावहारिकता : Heun विधि हालांकि अधिक कम्प्यूटेशनल रूप से महंगी है, लेकिन बैच प्रोसेसिंग और सबसैंपलिंग के माध्यम से कुशल प्रशिक्षण को लागू करता हैk-चरण हानि के लिए (1 < k ≤ N 1 < k \leq N 1 < k ≤ N ):
प्रस्ताव E.3 : SDE स्तर पर,
L BSDE , T ( θ ) ≤ L BSDE , τ ( θ ) + O ( τ 1 / 2 ) L_{\text{BSDE},T}(\theta) \leq L_{\text{BSDE},\tau}(\theta) + O(\tau^{1/2}) L BSDE , T ( θ ) ≤ L BSDE , τ ( θ ) + O ( τ 1/2 )
प्रस्ताव E.4 : पूर्ण समय सीमा EM हानि
L EM N ( θ ) = L BSDE , T ( θ ) + O ( τ 1 / 2 ) L_{\text{EM}}^N(\theta) = L_{\text{BSDE},T}(\theta) + O(\tau^{1/2}) L EM N ( θ ) = L BSDE , T ( θ ) + O ( τ 1/2 )
प्रस्ताव E.5 : एकल-चरण EM हानि
L EM , τ ( θ ) = L BSDE , τ ( θ ) + Bias ( θ ) + O ( τ 1 / 2 ) L_{\text{EM},\tau}(\theta) = L_{\text{BSDE},\tau}(\theta) + \text{Bias}(\theta) + O(\tau^{1/2}) L EM , τ ( θ ) = L BSDE , τ ( θ ) + Bias ( θ ) + O ( τ 1/2 )
मुख्य अंतर्दृष्टि :
पूर्ण समय सीमा हानि L EM N L_{\text{EM}}^N L EM N पूर्वाग्रह को समाप्त करती है, लेकिन इसका अनुमानित SDE हानि L BSDE , T L_{\text{BSDE},T} L BSDE , T मजबूत हानि L BSDE , τ L_{\text{BSDE},\tau} L BSDE , τ द्वारा प्रभुत्व है एकल-चरण हानि L EM , τ L_{\text{EM},\tau} L EM , τ हालांकि मजबूत हानि का अनुमान लगाती है, लेकिन अविनाशी पूर्वाग्रह का परिचय देती है मध्यवर्ती बहु-चरण हानि इस व्यापार-बंद को संतुलित करने का प्रयास करती है, जो इंटरपोलेशन हानि विधि का सार है प्रस्ताव E.8-E.10 : Heun विधि के लिए,
L Heun N ( θ ) ≤ L Heun , τ ( θ ) + O ( τ 1 / 2 ) L_{\text{Heun}}^N(\theta) \leq L_{\text{Heun},\tau}(\theta) + O(\tau^{1/2}) L Heun N ( θ ) ≤ L Heun , τ ( θ ) + O ( τ 1/2 )
मुख्य निष्कर्ष : Heun सेटिंग में, एकल-चरण और पूर्ण समय सीमा हानि SDE और विवेकीकरण स्तर पर समान संबंध बनाए रखती है, जिससे समय सीमा k चुनने की आवश्यकता समाप्त हो जाती है।
1. Hamilton-Jacobi-Bellman (HJB) समीकरण (100 आयाम):
∂ t u = − Tr [ ∇ 2 u ] + ∥ ∇ u ∥ 2 \partial_t u = -\text{Tr}[\nabla^2 u] + \|\nabla u\|^2 ∂ t u = − Tr [ ∇ 2 u ] + ∥∇ u ∥ 2
टर्मिनल स्थिति: u ( x , T ) = ln ( 0.5 ( 1 + ∥ x ∥ 2 ) ) u(x,T) = \ln(0.5(1+\|x\|^2)) u ( x , T ) = ln ( 0.5 ( 1 + ∥ x ∥ 2 ))
2. Black-Scholes-Barenblatt (BSB) समीकरण (100 आयाम):
∂ t u = − 1 2 Tr [ σ 2 diag ( x 2 ) ∇ 2 u ] + r ( u − ∇ u T x ) \partial_t u = -\frac{1}{2}\text{Tr}[\sigma^2\text{diag}(x^2)\nabla^2 u] + r(u - \nabla u^T x) ∂ t u = − 2 1 Tr [ σ 2 diag ( x 2 ) ∇ 2 u ] + r ( u − ∇ u T x )
टर्मिनल स्थिति: u ( x , T ) = ∥ x ∥ 2 u(x,T) = \|x\|^2 u ( x , T ) = ∥ x ∥ 2
3. Bender & Zhang (BZ) पूर्ण युग्मित FBSDE (10 आयाम और 100 आयाम):
अग्रगामी प्रक्रिया पश्चगामी प्रक्रिया पर निर्भर करती है, अधिक जटिल युग्मित परिदृश्य का परीक्षण करता है
4. पेंडुलम स्विंग इष्टतम नियंत्रण समस्या :
गैर-रैखिक नियंत्रण समस्याओं में आवेदन प्रदर्शित करता है
सापेक्ष L2 त्रुटि (RL2) :
RL2 : = ∑ i = 0 N ( u ref ( X t i , t i ) − u pred ( X t i , t i ) ) 2 ∑ i = 0 N u ref 2 ( X t i , t i ) \text{RL2} := \sqrt{\frac{\sum_{i=0}^N (u_{\text{ref}}(X_{t_i},t_i) - u_{\text{pred}}(X_{t_i},t_i))^2}{\sum_{i=0}^N u_{\text{ref}}^2(X_{t_i},t_i)}} RL2 := ∑ i = 0 N u ref 2 ( X t i , t i ) ∑ i = 0 N ( u ref ( X t i , t i ) − u pred ( X t i , t i ) ) 2
5 अग्रगामी SDE प्रक्षेपवक्र के साथ मूल्यांकन किया गया, विश्लेषणात्मक समाधान के साथ तुलना की गई।
PINNs : मानक PINNs हानि, कॉलोकेशन बिंदु अनुकूलित अग्रगामी SDE प्रक्षेपवक्र के सामान्य वितरण से नमूना किए गएFS-PINNs : अग्रगामी SDE का सीधे उपयोग करके कॉलोकेशन बिंदु नमूना करने वाली PINNs विविधताEM-BSDE : मानक EM एकीकरण की आत्म-सुसंगत हानिEM-BSDE (NR) : बिना रीसेट वेरिएंट, BSDE प्रसार का उपयोग करके Y t Y_t Y t सीधे सेट करने के बजाय u θ ( X t , t ) u_\theta(X_t,t) u θ ( X t , t ) Heun-BSDE (यह पेपर) : Stratonovich-आधारित Heun एकीकरण विधिनेटवर्क आर्किटेक्चर : 8 परत, प्रति परत 64 न्यूरॉन, Swish सक्रियण फ़ंक्शनफीचर इंजीनियरिंग : 256-आयामी Fourier एम्बेडिंग, विषम परत स्किप कनेक्शनप्रशिक्षण रणनीति : Adam अनुकूलक, बहु-चरण सीखने की दर अनुसूची (10 − 3 → 10 − 4 → 10 − 5 10^{-3} \to 10^{-4} \to 10^{-5} 1 0 − 3 → 1 0 − 4 → 1 0 − 5 )बैच आकार : 64 प्रक्षेपवक्र, सबसैंपल बैच 1024प्रशिक्षण पुनरावृत्ति : 100kसटीकता : float64 (float32 कुछ मामलों में संख्यात्मक रूप से अस्थिर है, तालिका 3 देखें)हार्डवेयर : एकल NVIDIA A100 GPU100-आयामी HJB समस्या :
विधि RL2 त्रुटि (बैच एल्गोरिथम) PINNs 0.1362 ± 0.0276 FS-PINNs 0.1828 ± 0.0774 EM-BSDE 0.3831 ± 0.0084 EM-BSDE (NR) 0.5214 ± 0.0452 Heun-BSDE 0.0573 ± 0.0106
100-आयामी BSB समस्या :
विधि RL2 त्रुटि (बैच एल्गोरिथम) PINNs 3.0488 ± 1.5625 FS-PINNs 0.0851 ± 0.0027 EM-BSDE 0.3668 ± 0.0244 EM-BSDE (NR) 0.1855 ± 0.0078 Heun-BSDE 0.0472 ± 0.0076
10-आयामी BZ समस्या :
विधि RL2 त्रुटि (बैच एल्गोरिथम) PINNs 3.8495 ± 0.1562 FS-PINNs 0.0270 ± 0.0017 EM-BSDE 0.1933 ± 0.0022 EM-BSDE (NR) 0.1309 ± 0.0311 Heun-BSDE 0.0236 ± 0.0031
मुख्य निष्कर्ष :
Heun-BSDE लगभग सभी मामलों में EM-BSDE वेरिएंट से बेहतर है Heun-BSDE FS-PINNs के साथ प्रदर्शन में तुलनीय है, BSDE और PINNs के प्रदर्शन समानता को पुनः प्राप्त करता है मानक PINNs खराब प्रदर्शन करते हैं, नमूना वितरण के महत्व को उजागर करता है 10-आयामी BSB समस्या पर विभिन्न चरण आकार τ ∈ { 0.04 , 0.02 , 0.01 , 0.005 } \tau \in \{0.04, 0.02, 0.01, 0.005\} τ ∈ { 0.04 , 0.02 , 0.01 , 0.005 } का परीक्षण:
EM-BSDE विधि का सुधार अत्यंत सीमित है (∼ 10 − 2 \sim 10^{-2} ∼ 1 0 − 2 से ∼ 8 × 10 − 3 \sim 8\times10^{-3} ∼ 8 × 1 0 − 3 तक) Heun-BSDE लगातार सुधार करता है (∼ 2 × 10 − 3 \sim 2\times10^{-3} ∼ 2 × 1 0 − 3 से ∼ 10 − 3 \sim 10^{-3} ∼ 1 0 − 3 तक) सिद्धांत सत्यापन : EM का पूर्वाग्रह पद PDE अवशेष के समान क्रम का है, चरण आकार को कम करके समाप्त नहीं किया जा सकता10-आयामी BSB पर विभिन्न जंप लंबाई k ∈ { 1 , 2 , … , 50 } k \in \{1,2,\ldots,50\} k ∈ { 1 , 2 , … , 50 } का परीक्षण:
EM-BSDE व्यवहार :
k = 1 k=1 k = 1 पर RL2 ∼ 10 − 2 \sim 10^{-2} ∼ 1 0 − 2 (पूर्वाग्रह से प्रभावित)k k k बढ़ने पर ∼ 10 \sim 10 ∼ 10 तक प्रदर्शन ∼ 3 × 10 − 3 \sim 3\times10^{-3} ∼ 3 × 1 0 − 3 तक सुधरता है (पूर्वाग्रह कम करना)k k k आगे बढ़ने पर प्रदर्शन गिरता है (हानि गुणवत्ता में कमी)इष्टतम k ∗ ≈ 10 k^* \approx 10 k ∗ ≈ 10 मौजूद है (व्यापार-बंद बिंदु) Heun-BSDE व्यवहार :
k = 1 k=1 k = 1 पर सर्वोत्तम प्रदर्शन ∼ 10 − 3 \sim 10^{-3} ∼ 1 0 − 3 तक पहुंचता हैk k k बढ़ने पर प्रदर्शन एकरूपता से गिरता हैसिद्धांत सत्यापन : कोई पूर्वाग्रह समस्या नहीं, एकल-चरण इष्टतम हैकम्प्यूटेशनल ओवरहेड (PINNs के सापेक्ष):
विधि पूर्ण एल्गोरिथम बैच एल्गोरिथम FS-PINNs 2.64× 1.14× EM-BSDE 2.83× 0.34× Heun-BSDE 36.37× 2.03×
रनटाइम सामान्यीकृत प्रदर्शन (चित्र 4, 100-आयामी HJB):
EM-BSDE तेजी से ∼ 10 − 2 \sim 10^{-2} ∼ 1 0 − 2 तक अभिसरित होता है लेकिन आगे सुधार नहीं कर सकता Heun-BSDE और FS-PINNs समान रनटाइम में समान ∼ 10 − 3 \sim 10^{-3} ∼ 1 0 − 3 सटीकता तक पहुंचते हैं ओवरहेड स्रोत :
Heun को लगभग 2 गुना अग्रगामी पास की आवश्यकता है (भविष्यवाणी चरण + सुधार चरण) Heun और PINNs को Hessian ∇ 2 u \nabla^2 u ∇ 2 u की गणना की आवश्यकता है, जबकि EM-BSDE कुछ PDE के लिए इससे बच सकता है HJB समस्या पर आयाम d ∈ { 2 , 10 , 50 , 100 , 200 , 500 } d \in \{2,10,50,100,200,500\} d ∈ { 2 , 10 , 50 , 100 , 200 , 500 } का परीक्षण:
सभी प्रक्षेपवक्र विधियां (FS-PINNs, EM-BSDE, Heun-BSDE) अच्छी विस्तारशीलता प्रदर्शित करती हैं EM-BSDE सभी आयामों में लगातार पिछड़ता है Heun-BSDE और FS-PINNs समान प्रदर्शन बनाए रखते हैं मेट्रिक PINNs FS-PINNs EM-BSDE Heun-BSDE संचयी लागत 53.17 46.59 46.42 46.43 PDE त्रुटि 2.77 3.38 78.94 18.6
Heun-BSDE गैर-रैखिक नियंत्रण समस्या में कम PDE त्रुटि प्रदर्शित करता है, हालांकि संचयी लागत समान है।
फ्लोटिंग-पॉइंट सटीकता प्रभाव (तालिका 3):
100-आयामी BSB में, Heun-BSDE float32 पर RL2=0.4587, float64 पर 0.0535 तक गिरता है (10 गुना सुधार) EM-BSDE सटीकता के प्रति कम संवेदनशील है Heun एकीकरण संख्यात्मक स्थिरता के लिए उच्च आवश्यकता दर्शाता है Raissi आदि (2017-2019) ने PINNs ढांचा प्रस्तावित किया अभी भी अनुकूलन चुनौतियां मौजूद हैं (Krishnapriyan आदि 2021, Wang आदि 2022) नमूना रणनीति प्रदर्शन को महत्वपूर्ण रूप से प्रभावित करती है (Nabian आदि 2021, Daw आदि 2023) मूल BSDE (E आदि 2017, Han आदि 2018): प्रत्येक समय चरण पर Y t Y_t Y t और Z t Z_t Z t की भविष्यवाणी के लिए स्वतंत्र नेटवर्क सीखनाआत्म-सुसंगत BSDE (Raissi 2024, Nüsken & Richter 2023): एकल नेटवर्क पैरामीटर सभी स्पेस-टाइम को पैरामीटराइज करता है, आत्म-सुसंगत हानि का उपयोग करता हैयह पेपर संबंध : आत्म-सुसंगत विधि पर केंद्रित, पहली बार एकीकरण योजना प्रभाव का व्यवस्थित अध्ययनChassagneux आदि (2022) Runge-Kutta विवेकीकरण का अध्ययन करते हैं, लेकिन केवल मूल BSDE हानि के लिए यह पेपर पहली बार आत्म-सुसंगत हानि में एकीकरण योजना समस्या को प्रकट करता है यह पेपर Nüsken & Richter (2023) से मुख्य अंतर:
वे: इंटरपोलेशन हानि प्रस्तावित करते हैं (समय सीमा हाइपरपैरामीटर ट्यून करने की आवश्यकता) यह पेपर: मूल कारण की पहचान करता है (एकीकरण योजना), हाइपरपैरामीटर ट्यूनिंग के बिना समाधान प्रदान करता है मूल कारण पहचान : BSDE और PINNs के बीच प्रदर्शन अंतराल एकल-चरण आत्म-सुसंगत हानि में EM एकीकरण के विवेकीकरण पूर्वाग्रह से उत्पन्न होता हैसैद्धांतिक योगदान : कठोरता से साबित करता है कि EM अविनाशी पूर्वाग्रह का परिचय देता है, Heun इसे पूरी तरह से समाप्त करता हैविधि नवाचार : Stratonovich-BSDE + Heun एकीकरण BSDE और PINNs के बीच प्रदर्शन समानता को पुनः प्राप्त करता हैअनुभवजन्य सत्यापन : कई उच्च-आयामी बेंचमार्क पर सैद्धांतिक भविष्यवाणी को सत्यापित करता हैव्यावहारिक मार्गदर्शन : BSDE समाधान के लिए एकीकरण योजना चयन महत्वपूर्ण है1. कम्प्यूटेशनल ओवरहेड :
Heun-BSDE EM-BSDE से लगभग 6 गुना धीमा है (बैच एल्गोरिथम) Hessian गणना की आवश्यकता है (कुछ PDE के लिए) फ्लोटिंग-पॉइंट सटीकता के प्रति अधिक संवेदनशील है (float64 की आवश्यकता) 2. प्रदर्शन सापेक्षता :
हालांकि PINNs के साथ समानता को पुनः प्राप्त करता है, लेकिन परिमाण क्रम में लाभ नहीं दिखाता है वर्तमान लाभ मुख्य रूप से मॉडल-मुक्त परिदृश्य में है 3. सैद्धांतिक विश्लेषण सीमा :
केवल एकल-चरण (k = 1 k=1 k = 1 ) और पूर्ण समय सीमा (k = N k=N k = N ) मामलों का विश्लेषण करता है मध्यवर्ती बहु-चरण मामले केवल अनुभवजन्य अध्ययन किए गए हैं पूर्ण युग्मित FBSDE के सैद्धांतिक विश्लेषण को शामिल नहीं करता है 4. प्रयोज्यता परिदृश्य :
उच्च-आयामी BZ समस्या (100 आयाम) में सभी विधियां विफल होती हैं अति-उच्च-आयामी पूर्ण युग्मित प्रणालियों के लिए आगे के अनुसंधान की आवश्यकता है 1. कम्प्यूटेशनल दक्षता सुधार :
Hutchinson ट्रेस अनुमान Hessian गणना को कम करता है प्रतिवर्ती Heun विधि संख्यात्मक स्थिरता में सुधार करता है अनुकूली समय चरण रणनीति 2. विधि विस्तार :
नियंत्रण चर तकनीक (Takahashi आदि 2022) ऑपरेटर विभाजन सेटिंग (Beck आदि 2021) पूर्ण गैर-रैखिक PDE (Pham आदि 2021) 3. सैद्धांतिक गहनता :
बहु-चरण हानि का पूर्ण सैद्धांतिक विश्लेषण पूर्ण युग्मित FBSDE का अभिसरण विश्लेषण अन्य उच्च-क्रम एकीकरण योजनाओं के साथ तुलना 4. अनुप्रयोग विस्तार :
मॉडल-मुक्त यादृच्छिक इष्टतम नियंत्रण उच्च-आयामी वित्तीय व्युत्पन्न मूल्य निर्धारण जटिल भौतिक प्रणाली मॉडलिंग 1. सैद्धांतिक योगदान गहरा :
पहली बार BSDE प्रदर्शन समस्या के मूल कारण की व्यवस्थित पहचान कठोर गणितीय प्रमाण प्रदान करता है (प्रमेय 4.1-4.4, प्रस्ताव E.1-E.10) सिद्धांत और अनुभव उच्च स्तर पर सुसंगत हैं (चित्र 1, 3, 5) 2. विधि डिज़ाइन चतुर :
Stratonovich व्याख्या Hessian पूर्वाग्रह पद को सुंदरता से समाप्त करती है Heun एकीकरण स्वाभाविक रूप से Stratonovich समाधान में अभिसरित होता है सिद्धांत-संचालित विधि डिज़ाइन का उदाहरण 3. प्रायोगिक डिज़ाइन व्यापक :
कई बेंचमार्क (HJB, BSB, BZ, पेंडुलम नियंत्रण) कई आयाम (2 आयाम से 500 आयाम) कई वेरिएंट (पूर्ण/बैच एल्गोरिथम, float32/64) पर्याप्त विलोपन प्रयोग (चित्र 3, 5, 6) 4. व्यावहारिक मूल्य उच्च :
कुशल बैच एल्गोरिथम प्रदान करता है (एल्गोरिथम 1) ओपन-सोर्स कोड पुनरुत्पादनीयता सक्षम करता है BSDE समाधान डिज़ाइन के लिए सीधा मार्गदर्शन 5. लेखन स्पष्ट :
तार्किक रूप से कठोर, समस्या निदान से समाधान तक विस्तृत गणितीय व्युत्पत्ति (परिशिष्ट D-F) सहज ग्राफ़ (चित्र 1, 3, 5 विशेष रूप से प्रेरक) 1. कम्प्यूटेशनल ओवरहेड महत्वपूर्ण :
6 गुना गति हानि व्यावहारिक अनुप्रयोग को सीमित कर सकती है त्वरण तकनीकों को पर्याप्त रूप से खोजा नहीं गया है (जैसे Hutchinson अनुमान) EM विधि के साथ दक्षता-सटीकता व्यापार-बंद को गहराई से चर्चा की आवश्यकता है 2. संख्यात्मक स्थिरता समस्या :
फ्लोटिंग-पॉइंट सटीकता के प्रति संवेदनशील (तालिका 3) संख्यात्मक रूप से स्थिर कार्यान्वयन विवरण प्रदान नहीं किए गए हैं प्रतिवर्ती Heun जैसे वैकल्पिक विकल्प प्रायोगिक रूप से सत्यापित नहीं किए गए हैं 3. सैद्धांतिक विश्लेषण अधूरा :
बहु-चरण हानि में सैद्धांतिक लक्षण वर्णन की कमी पूर्ण युग्मित FBSDE सैद्धांतिक ढांचे में शामिल नहीं है उच्च-क्रम एकीकरण योजनाएं (जैसे Milstein) चर्चा नहीं की गई हैं 4. प्रायोगिक सीमाएं :
100-आयामी BZ समस्या विफल, कारण गहराई से विश्लेषण नहीं किया गया अन्य उच्च-क्रम विधियों (जैसे Milstein) के साथ तुलना की कमी वास्तविक अनुप्रयोग मामले कम हैं (केवल पेंडुलम नियंत्रण) 5. PINNs के साथ तुलना :
PINNs से परे महत्वपूर्ण लाभ प्रदर्शित नहीं करता है मॉडल-मुक्त लाभ अपर्याप्त रूप से अनुभवजन्य रूप से प्रदर्शित किए गए हैं (केवल परिशिष्ट C सैद्धांतिक चर्चा) PINNs पर नमूना वितरण प्रभाव गहराई से अनुसंधान नहीं किया गया है 1. शैक्षणिक योगदान :
BSDE समाधान एकीकरण योजना अनुसंधान में अंतराल भरता है बाद की उच्च-क्रम विधि अनुसंधान के लिए आधार स्थापित करता है अन्य वैज्ञानिक कम्प्यूटिंग क्षेत्रों में एकीकरण योजना अनुसंधान को प्रेरित कर सकता है 2. व्यावहारिक मूल्य :
BSDE विधि की आवश्यकता वाले अनुप्रयोगों (मॉडल-मुक्त नियंत्रण) के लिए सीधा मूल्य BSDE समाधान कार्यान्वयनकर्ताओं के लिए स्पष्ट मार्गदर्शन प्रदान करता है ओपन-सोर्स कोड व्यापक अपनाने को बढ़ावा देता है 3. सीमाएं :
कम्प्यूटेशनल ओवरहेड बड़े पैमाने पर अनुप्रयोग को सीमित कर सकता है व्यापक अपनाने के लिए आगे इंजीनियरिंग अनुकूलन की आवश्यकता है वर्तमान चरण में अधिक "समानता पुनः प्राप्त" है बजाय "अतिक्रमण" सबसे उपयुक्त :
मॉडल-मुक्त यादृच्छिक इष्टतम नियंत्रण : गतिशीलता समीकरण स्पष्ट रूप से प्राप्त नहीं किए जा सकते, केवल अनुकरण किया जा सकता हैउच्च-आयामी वित्तीय समस्याएं : अंतर्निहित यादृच्छिक प्रक्रिया मौजूद है, उच्च सटीकता समाधान की आवश्यकता हैअनुसंधान प्रोटोटाइप : BSDE विधि क्षमता की खोज करने वाले शैक्षणिक अनुसंधानकम उपयुक्त :
कम्प्यूटेशनल संसाधन सीमित परिदृश्य : 6 गुना ओवरहेड स्वीकार्य नहीं हो सकता हैज्ञात PDE समीकरण और कोई अंतर्निहित गतिशीलता नहीं : PINNs अधिक सीधे हो सकते हैंअति-उच्च-आयामी पूर्ण युग्मित प्रणाली (>100 आयाम): सभी विधियां चुनौतियों का सामना करती हैंध्यान देने योग्य :
float64 सटीकता की आवश्यकता है नेटवर्क आर्किटेक्चर और प्रशिक्षण रणनीति को सावधानीपूर्वक ट्यून करने की आवश्यकता है नमूना वितरण चयन अभी भी महत्वपूर्ण है (FS-PINNs बनाम PINNs) Raissi आदि (2017-2019) : PINNs विधि आधारशिला कार्यE, Han, Jentzen (2017) : मूल गहन BSDE विधिNüsken & Richter (2023) : इंटरपोलेशन हानि विधि, यह पेपर सीधे प्रतिक्रिया देता हैKloeden & Platen (1992) : यादृच्छिक अवकल समीकरण संख्यात्मक समाधान शास्त्रीय पाठ्यपुस्तकChassagneux आदि (2022) : BSDE का Runge-Kutta विवेकीकरणसमग्र मूल्यांकन : यह सिद्धांत और अनुभव के संयोजन वाला उच्च गुणवत्ता का पेपर है, जो BSDE विधि की मुख्य बाधा की पहचान करता है और समाधान करता है। सैद्धांतिक विश्लेषण कठोर है, प्रायोगिक डिज़ाइन व्यापक है, और क्षेत्र में महत्वपूर्ण योगदान है। मुख्य कमियां कम्प्यूटेशनल ओवरहेड और संख्यात्मक स्थिरता समस्याएं हैं जिन्हें आगे इंजीनियरिंग अनुकूलन की आवश्यकता है। पेपर BSDE समाधान डिज़ाइन के लिए स्पष्ट पद्धति संबंधी मार्गदर्शन प्रदान करता है, और मॉडल-मुक्त नियंत्रण जैसे विशिष्ट अनुप्रयोग परिदृश्यों में व्यावहारिक प्रभाव डालने की अपेक्षा की जाती है।