Backward stochastic differential equation (BSDE)-based deep learning methods provide an alternative to Physics-Informed Neural Networks (PINNs) for solving high-dimensional partial differential equations (PDEs), offering potential algorithmic advantages in settings such as stochastic optimal control, where the PDEs of interest are tied to an underlying dynamical system. However, standard BSDE-based solvers have empirically been shown to underperform relative to PINNs in the literature. In this paper, we identify the root cause of this performance gap as a discretization bias introduced by the standard Euler-Maruyama (EM) integration scheme applied to one-step self-consistency BSDE losses, which shifts the optimization landscape off target. We find that this bias cannot be satisfactorily addressed through finer step-sizes or multi-step self-consistency losses. To properly handle this issue, we propose a Stratonovich-based BSDE formulation, which we implement with stochastic Heun integration. We show that our proposed approach completely eliminates the bias issues faced by EM integration. Furthermore, our empirical results show that our Heun-based BSDE method consistently outperforms EM-based variants and achieves competitive results with PINNs across multiple high-dimensional benchmarks. Our findings highlight the critical role of integration schemes in BSDE-based PDE solvers, an algorithmic detail that has received little attention thus far in the literature.
معرّف الورقة : 2505.01078العنوان : Integration Matters for Learning PDEs with Backwards SDEsالمؤلفون : Sungje Park, Stephen Tu (جامعة جنوب كاليفورنيا)التصنيفات : cs.LG, cs.SY, eess.SY, math.OC, stat.MLتاريخ النشر : المسودة الأولية 5 مايو 2025، المراجعة 13 نوفمبر 2025رابط الورقة : https://arxiv.org/abs/2505.01078 تدرس هذه الورقة طرق التعلم العميق القائمة على معادلات ستوكاستية عكسية (BSDE) لحل مسائل المعادلات التفاضلية الجزئية (PDE) عالية الأبعاد. على الرغم من أن طريقة BSDE توفر مزايا خوارزمية في سيناريوهات مثل التحكم العشوائي الأمثل، إلا أن الأداء التجريبي كان دائماً أقل من الشبكات العصبية المدركة للفيزياء (PINNs). يحدد المؤلفون السبب الجذري لفجوة الأداء: صيغة Euler-Maruyama (EM) القياسية تُدخل انحيازاً في التقطيع في دالة الخسارة BSDE ذات الخطوة الواحدة المتسقة ذاتياً، وهذا الانحياز لا يمكن حله بشكل مرضٍ من خلال خطوات أدق أو دوال خسارة متعددة الخطوات. لهذا الغرض، يقترح المؤلفون صيغة BSDE قائمة على Stratonovich، مع تنفيذ باستخدام تكامل Heun العشوائي، مما يلغي تماماً مشكلة الانحياز في تكامل EM. تُظهر النتائج التجريبية أن طريقة Heun-BSDE تتفوق باستمرار على متغيرات EM في معايير عالية الأبعاد متعددة، وتحقق نتائج تنافسية مع PINNs.
الحل العددي للمعادلات التفاضلية الجزئية (PDE) هو أساس النمذجة العلمية والهندسية، لكن الطرق العددية التقليدية تواجه لعنة الأبعاد، مما يجعل الحساب غير ممكن في المعادلات التفاضلية الجزئية عالية الأبعاد. في الآونة الأخيرة، توفر طرق التعلم العميق بديلين رئيسيين:
الشبكات العصبية المدركة للفيزياء (PINNs) : تقليل بقايا PDE مباشرة على نقاط التكوين المأخوذة عشوائياًطريقة BSDE : إعادة صياغة PDE كمعادلات ستوكاستية أمامية-عكسية، وتقليل الفرق بين التنبؤ والشروط الطرفية من خلال محاكاة العمليات العشوائيةعلى الرغم من أن طريقة BSDE توفر مزايا في:
المسائل عالية الأبعاد حيث يوجد نظام ديناميكي أساسي (مثل التحكم العشوائي الأمثل) المسائل التي يمكن الوصول إليها من خلال المحاكاة لكن لا يمكن الحصول على معادلة PDE بشكل صريح (التحكم الأمثل الخالي من النموذج) إلا أن الأبحاث الموجودة (مثل Nüsken & Richter 2023) وجدت أن طريقة BSDE أضعف بشكل كبير من PINNs في الاختبارات المعيارية. اقترحت هذه الأدبيات دالة خسارة الاستيفاء لتخفيف المشكلة، لكن هناك عيبان حاسمان:
لم توضح السبب الجذري لفجوة الأداء تُدخل معاملات فائقة تحتاج إلى ضبط (طول نطاق الوقت)، مما يزيد من تعقيد التدريب تحدد هذه الورقة المصدر الرئيسي لفجوة الأداء: اختيار صيغة التكامل العشوائي . تُدخل صيغة EM القياسية انحيازاً في التقطيع غير قابل للإزالة في دالة الخسارة BSDE ذات الخطوة الواحدة، وهذا الانحياز بنفس ترتيب حد بقايا PDE، ولا يمكن حله من خلال تقليل حجم الخطوة.
التحليل النظري : أول تحليل منهجي لانحياز التقطيع لصيغ التكامل العشوائي EM و Heun المطبقة على دالة الخسارة BSDE ذات الخطوة الواحدة المتسقة ذاتياًإثبات أن صيغة EM تُدخل حداً انحيازياً غير متلاشٍ بنفس ترتيب بقايا PDE (النظرية 4.2) إثبات أن صيغة Heun تلغي تماماً هذه المشكلة (النظرية 4.4) الابتكار المنهجي : اقتراح صيغة Stratonovich-BSDE مع تكامل Heun العشوائيتفسير المعادلات الستوكاستية الأمامية والعكسية كمعادلات Stratonovich (وليس معادلات Itô) استخدام طريقة Heun العشوائية للتكامل العددي، مما يلغي الانحياز في الخسارة ذات الخطوة الواحدة تحليل الخسارة متعددة الخطوات : تحليل عميق للمقايضات في الخسارة المتسقة ذاتياً متعددة الخطوات (القسم 5)الكشف عن مقايضات الأداء لطريقة EM عند أطوال نطاق زمني مختلفة k إثبات أن طريقة Heun تحافظ على الاتساق في حالات الخطوة الواحدة والخطوات المتعددة التحقق التجريبي : التحقق على معايير عالية الأبعاد متعددة (معادلات HJB و BSB و BZ، بأبعاد تصل إلى 100)تفوق Heun-BSDE باستمرار على EM-BSDE تحقيق أداء تنافسي مع PINNs، واستعادة التكافؤ في الأداء التنفيذ الخوارزمي : توفير خوارزمية أخذ عينات فرعية فعالة للمعالجة الدفعية، مما يقلل بشكل كبير من التكلفة الحسابيةضع في الاعتبار المعادلة التفاضلية الجزئية غير الخطية للقيم الحدية التالية:
R [ u ] ( x , t ) : = ∂ t u ( x , t ) + 1 2 tr ( H ( x , t ) ⋅ ∇ 2 u ( x , t ) ) + ⟨ f ( x , t ) , ∇ u ( x , t ) ⟩ − h [ u ] ( x , t ) = 0 R[u](x,t) := \partial_t u(x,t) + \frac{1}{2}\text{tr}(H(x,t)\cdot\nabla^2 u(x,t)) + \langle f(x,t), \nabla u(x,t)\rangle - h[u](x,t) = 0 R [ u ] ( x , t ) := ∂ t u ( x , t ) + 2 1 tr ( H ( x , t ) ⋅ ∇ 2 u ( x , t )) + ⟨ f ( x , t ) , ∇ u ( x , t )⟩ − h [ u ] ( x , t ) = 0
حيث:
x ∈ Ω ⊆ R d x \in \Omega \subseteq \mathbb{R}^d x ∈ Ω ⊆ R d ، t ∈ [ 0 , T ] t \in [0,T] t ∈ [ 0 , T ] الشروط الحدية: u ( x , T ) = ϕ ( x ) u(x,T) = \phi(x) u ( x , T ) = ϕ ( x ) H ( x , t ) = g ( x , t ) g ( x , t ) T H(x,t) = g(x,t)g(x,t)^T H ( x , t ) = g ( x , t ) g ( x , t ) T مصفوفة محددة موجبةطريقة PINNs :
L PINNs ( θ ) = E ( x , t ) ∼ μ [ ( R [ u θ ] ( x , t ) ) 2 ] L_{\text{PINNs}}(\theta) = \mathbb{E}_{(x,t)\sim\mu}[(R[u_\theta](x,t))^2] L PINNs ( θ ) = E ( x , t ) ∼ μ [( R [ u θ ] ( x , t ) ) 2 ]
طريقة BSDE : بناءً على المعادلة الستوكاستية الأمامية
d X t = f ( X t , t ) d t + g ( X t , t ) d B t dX_t = f(X_t,t)dt + g(X_t,t)dB_t d X t = f ( X t , t ) d t + g ( X t , t ) d B t
والمعادلة الستوكاستية العكسية
d Y t = h ( X t , t , Y t , Z t ) d t + Z t T g ( X t , t ) d B t dY_t = h(X_t,t,Y_t,Z_t)dt + Z_t^T g(X_t,t)dB_t d Y t = h ( X t , t , Y t , Z t ) d t + Z t T g ( X t , t ) d B t
دالة خسارة BSDE المتسقة ذاتياً على نطاق زمني H:
L BSDE , H ( θ ) : = E x 0 , B t [ 1 N H 2 ∑ n = 0 N − 1 ( u θ ( X t n + 1 , t n + 1 ) − u θ ( X t n , t n ) − S θ ( t n , t n + 1 ) ) 2 ] L_{\text{BSDE},H}(\theta) := \mathbb{E}_{x_0,B_t}\left[\frac{1}{NH^2}\sum_{n=0}^{N-1}\left(u_\theta(X_{t_{n+1}},t_{n+1}) - u_\theta(X_{t_n},t_n) - S_\theta(t_n,t_{n+1})\right)^2\right] L BSDE , H ( θ ) := E x 0 , B t [ N H 2 1 ∑ n = 0 N − 1 ( u θ ( X t n + 1 , t n + 1 ) − u θ ( X t n , t n ) − S θ ( t n , t n + 1 ) ) 2 ]
التقطيع EM :
X ^ n + 1 = X ^ n + τ f ( X ^ n , t n ) + τ g ( X ^ n , t n ) w n \hat{X}_{n+1} = \hat{X}_n + \tau f(\hat{X}_n,t_n) + \sqrt{\tau}g(\hat{X}_n,t_n)w_n X ^ n + 1 = X ^ n + τ f ( X ^ n , t n ) + τ g ( X ^ n , t n ) w n Y ^ n + 1 θ = Y ^ n θ + τ h θ ( X ^ n , t n ) + τ ∇ u θ ( X ^ n , t n ) T g ( X ^ n , t n ) w n \hat{Y}^\theta_{n+1} = \hat{Y}^\theta_n + \tau h_\theta(\hat{X}_n,t_n) + \sqrt{\tau}\nabla u_\theta(\hat{X}_n,t_n)^T g(\hat{X}_n,t_n)w_n Y ^ n + 1 θ = Y ^ n θ + τ h θ ( X ^ n , t n ) + τ ∇ u θ ( X ^ n , t n ) T g ( X ^ n , t n ) w n
النظرية الرئيسية 4.1 (خسارة EM النقطية):
لنقطة ثابتة ( x , t ) (x,t) ( x , t ) ، تحقق خسارة EM النقطية:
τ − 2 ⋅ ℓ EM , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + 1 2 tr [ ( H ( x , t ) ⋅ ∇ 2 u θ ( x , t ) ) 2 ] + O ( τ 1 / 2 ) \tau^{-2}\cdot\ell_{\text{EM},\tau}(\theta,x,t) = (R[u_\theta](x,t))^2 + \frac{1}{2}\text{tr}[(H(x,t)\cdot\nabla^2 u_\theta(x,t))^2] + O(\tau^{1/2}) τ − 2 ⋅ ℓ EM , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + 2 1 tr [( H ( x , t ) ⋅ ∇ 2 u θ ( x , t ) ) 2 ] + O ( τ 1/2 )
النظرية الرئيسية 4.2 (خسارة EM-BSDE الكاملة):
L EM , τ ( θ ) = 1 T ∫ 0 T E [ ( R [ u θ ] ( X t , t ) ) 2 + 1 2 tr [ ( H ( X t , t ) ⋅ ∇ 2 u θ ( X t , t ) ) 2 ] ] d t + O ( τ 1 / 2 ) L_{\text{EM},\tau}(\theta) = \frac{1}{T}\int_0^T \mathbb{E}\left[(R[u_\theta](X_t,t))^2 + \frac{1}{2}\text{tr}[(H(X_t,t)\cdot\nabla^2 u_\theta(X_t,t))^2]\right]dt + O(\tau^{1/2}) L EM , τ ( θ ) = T 1 ∫ 0 T E [ ( R [ u θ ] ( X t , t ) ) 2 + 2 1 tr [( H ( X t , t ) ⋅ ∇ 2 u θ ( X t , t ) ) 2 ] ] d t + O ( τ 1/2 )
الرؤية الرئيسية : حد الانحياز 1 2 tr [ ( H ⋅ ∇ 2 u θ ) 2 ] \frac{1}{2}\text{tr}[(H\cdot\nabla^2 u_\theta)^2] 2 1 tr [( H ⋅ ∇ 2 u θ ) 2 ] بنفس ترتيب حد بقايا PDE، ولا يمكن إزالته من خلال تقليل حجم الخطوة τ \tau τ .
المعادلة الستوكاستية الأمامية Stratonovich :
d X t ∘ = f ( X t ∘ , t ) d t + g ( X t ∘ , t ) ∘ d B t dX_t^\circ = f(X_t^\circ,t)dt + g(X_t^\circ,t)\circ dB_t d X t ∘ = f ( X t ∘ , t ) d t + g ( X t ∘ , t ) ∘ d B t
المعادلة الستوكاستية العكسية المعدلة :
وفقاً لقاعدة السلسلة Stratonovich،
d u ( X t ∘ , t ) = h ∘ [ u ] ( X t ∘ , t ) d t + ∇ u ( X t ∘ , t ) T g ( X t ∘ , t ) ∘ d B t du(X_t^\circ,t) = h^\circ[u](X_t^\circ,t)dt + \nabla u(X_t^\circ,t)^T g(X_t^\circ,t)\circ dB_t d u ( X t ∘ , t ) = h ∘ [ u ] ( X t ∘ , t ) d t + ∇ u ( X t ∘ , t ) T g ( X t ∘ , t ) ∘ d B t
حيث
h ∘ [ u ] ( x , t ) : = h [ u ] ( x , t ) − 1 2 tr ( H ( x , t ) ∇ 2 u ( x , t ) ) h^\circ[u](x,t) := h[u](x,t) - \frac{1}{2}\text{tr}(H(x,t)\nabla^2 u(x,t)) h ∘ [ u ] ( x , t ) := h [ u ] ( x , t ) − 2 1 tr ( H ( x , t ) ∇ 2 u ( x , t ))
تقطيع Heun العشوائي :
Z ˉ n + 1 θ = Z ^ n θ + τ F θ ( Z ^ n θ , t n ) + τ G θ ( Z ^ n θ , t n ) w n \bar{Z}^\theta_{n+1} = \hat{Z}^\theta_n + \tau F_\theta(\hat{Z}^\theta_n,t_n) + \sqrt{\tau}G_\theta(\hat{Z}^\theta_n,t_n)w_n Z ˉ n + 1 θ = Z ^ n θ + τ F θ ( Z ^ n θ , t n ) + τ G θ ( Z ^ n θ , t n ) w n Z ^ n + 1 θ = Z ^ n θ + τ 2 ( F θ ( Z ^ n θ , t n ) + F θ ( Z ˉ n + 1 θ , t n + 1 ) ) + τ 2 ( G θ ( Z ^ n θ , t n ) + G θ ( Z ˉ n + 1 θ , t n + 1 ) ) w n \hat{Z}^\theta_{n+1} = \hat{Z}^\theta_n + \frac{\tau}{2}(F_\theta(\hat{Z}^\theta_n,t_n) + F_\theta(\bar{Z}^\theta_{n+1},t_{n+1})) + \frac{\sqrt{\tau}}{2}(G_\theta(\hat{Z}^\theta_n,t_n) + G_\theta(\bar{Z}^\theta_{n+1},t_{n+1}))w_n Z ^ n + 1 θ = Z ^ n θ + 2 τ ( F θ ( Z ^ n θ , t n ) + F θ ( Z ˉ n + 1 θ , t n + 1 )) + 2 τ ( G θ ( Z ^ n θ , t n ) + G θ ( Z ˉ n + 1 θ , t n + 1 )) w n
حيث Z t θ = ( X t , Y t θ ) Z^\theta_t = (X_t, Y_t^\theta) Z t θ = ( X t , Y t θ ) هي العملية المعززة.
النظرية الرئيسية 4.3 (خسارة Heun النقطية):
τ − 2 ⋅ ℓ Heun , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + O ( τ 1 / 2 ) \tau^{-2}\cdot\ell_{\text{Heun},\tau}(\theta,x,t) = (R[u_\theta](x,t))^2 + O(\tau^{1/2}) τ − 2 ⋅ ℓ Heun , τ ( θ , x , t ) = ( R [ u θ ] ( x , t ) ) 2 + O ( τ 1/2 )
النظرية الرئيسية 4.4 (خسارة Heun-BSDE الكاملة):
L Heun , τ ( θ ) = 1 T ∫ 0 T E ( R [ u θ ] ( X t ∘ , t ) ) 2 d t + O ( τ 1 / 2 ) L_{\text{Heun},\tau}(\theta) = \frac{1}{T}\int_0^T \mathbb{E}(R[u_\theta](X_t^\circ,t))^2 dt + O(\tau^{1/2}) L Heun , τ ( θ ) = T 1 ∫ 0 T E ( R [ u θ ] ( X t ∘ , t ) ) 2 d t + O ( τ 1/2 )
النتيجة الاختراقية : تلغي طريقة Heun تماماً حد الانحياز الموجود في طريقة EM، مما يجعل الحد الرئيسي للخسارة ذات الخطوة الواحدة مجرد مربع بقايا PDE.
تشخيص المشكلة : أول تحديد لمصدر فجوة الأداء في BSDE من صيغة التكامل وليس من تصميم دالة الخسارةالاختراق النظري : توفير إثبات رياضي صارم، وتحديد كمي لانحياز التقطيع لطرق EM و Heunتصميم الطريقة : الاستفادة الماهرة من تفسير Stratonovich لإزالة حد الانحياز المتعلق بـ Hessianالجدوى العملية : على الرغم من أن طريقة Heun تتطلب حساباً أكثر، إلا أنها تحقق تدريباً فعالاً من خلال المعالجة الدفعية وأخذ العينات الفرعيةللخسارة ذات k خطوة (1 < k ≤ N 1 < k \leq N 1 < k ≤ N ):
القضية E.3 : على مستوى SDE،
L BSDE , T ( θ ) ≤ L BSDE , τ ( θ ) + O ( τ 1 / 2 ) L_{\text{BSDE},T}(\theta) \leq L_{\text{BSDE},\tau}(\theta) + O(\tau^{1/2}) L BSDE , T ( θ ) ≤ L BSDE , τ ( θ ) + O ( τ 1/2 )
القضية E.4 : خسارة EM على النطاق الزمني الكامل
L EM N ( θ ) = L BSDE , T ( θ ) + O ( τ 1 / 2 ) L_{\text{EM}}^N(\theta) = L_{\text{BSDE},T}(\theta) + O(\tau^{1/2}) L EM N ( θ ) = L BSDE , T ( θ ) + O ( τ 1/2 )
القضية E.5 : خسارة EM ذات الخطوة الواحدة
L EM , τ ( θ ) = L BSDE , τ ( θ ) + Bias ( θ ) + O ( τ 1 / 2 ) L_{\text{EM},\tau}(\theta) = L_{\text{BSDE},\tau}(\theta) + \text{Bias}(\theta) + O(\tau^{1/2}) L EM , τ ( θ ) = L BSDE , τ ( θ ) + Bias ( θ ) + O ( τ 1/2 )
الرؤية الرئيسية :
تلغي خسارة النطاق الزمني الكامل L EM N L_{\text{EM}}^N L EM N الانحياز، لكن خسارة SDE التقريبية L BSDE , T L_{\text{BSDE},T} L BSDE , T تهيمن عليها خسارة أقوى L BSDE , τ L_{\text{BSDE},\tau} L BSDE , τ تقترب خسارة الخطوة الواحدة L EM , τ L_{\text{EM},\tau} L EM , τ من خسارة أقوى، لكنها تُدخل انحيازاً غير قابل للإزالة تحاول الخسارة متعددة الخطوات الوسيطة موازنة هذه المقايضة، وهذا هو جوهر طريقة الخسارة الاستيفائية القضايا E.8-E.10 : لطريقة Heun،
L Heun N ( θ ) ≤ L Heun , τ ( θ ) + O ( τ 1 / 2 ) L_{\text{Heun}}^N(\theta) \leq L_{\text{Heun},\tau}(\theta) + O(\tau^{1/2}) L Heun N ( θ ) ≤ L Heun , τ ( θ ) + O ( τ 1/2 )
الخلاصة الرئيسية : في إعداد Heun، تحافظ خسارة الخطوة الواحدة والنطاق الزمني الكامل على نفس العلاقة على مستوى SDE والتقطيع، مما يلغي الحاجة لاختيار نطاق زمني k.
1. معادلة Hamilton-Jacobi-Bellman (HJB) (100 بُعد):
∂ t u = − Tr [ ∇ 2 u ] + ∥ ∇ u ∥ 2 \partial_t u = -\text{Tr}[\nabla^2 u] + \|\nabla u\|^2 ∂ t u = − Tr [ ∇ 2 u ] + ∥∇ u ∥ 2
الشرط الطرفي: u ( x , T ) = ln ( 0.5 ( 1 + ∥ x ∥ 2 ) ) u(x,T) = \ln(0.5(1+\|x\|^2)) u ( x , T ) = ln ( 0.5 ( 1 + ∥ x ∥ 2 ))
2. معادلة Black-Scholes-Barenblatt (BSB) (100 بُعد):
∂ t u = − 1 2 Tr [ σ 2 diag ( x 2 ) ∇ 2 u ] + r ( u − ∇ u T x ) \partial_t u = -\frac{1}{2}\text{Tr}[\sigma^2\text{diag}(x^2)\nabla^2 u] + r(u - \nabla u^T x) ∂ t u = − 2 1 Tr [ σ 2 diag ( x 2 ) ∇ 2 u ] + r ( u − ∇ u T x )
الشرط الطرفي: u ( x , T ) = ∥ x ∥ 2 u(x,T) = \|x\|^2 u ( x , T ) = ∥ x ∥ 2
3. نظام Bender & Zhang (BZ) المقترن بالكامل (10 و 100 بُعد):
تعتمد العملية الأمامية على العملية العكسية، واختبار سيناريوهات الاقتران الأكثر تعقيداً
4. مشكلة التحكم الأمثل في تأرجح البندول :
عرض التطبيق في مسائل التحكم غير الخطي
خطأ L2 النسبي (RL2) :
RL2 : = ∑ i = 0 N ( u ref ( X t i , t i ) − u pred ( X t i , t i ) ) 2 ∑ i = 0 N u ref 2 ( X t i , t i ) \text{RL2} := \sqrt{\frac{\sum_{i=0}^N (u_{\text{ref}}(X_{t_i},t_i) - u_{\text{pred}}(X_{t_i},t_i))^2}{\sum_{i=0}^N u_{\text{ref}}^2(X_{t_i},t_i)}} RL2 := ∑ i = 0 N u ref 2 ( X t i , t i ) ∑ i = 0 N ( u ref ( X t i , t i ) − u pred ( X t i , t i ) ) 2
يتم التقييم على 5 مسارات SDE أمامية، مقارنة مع الحل التحليلي.
PINNs : خسارة PINNs القياسية، مع نقاط التكوين المأخوذة من توزيع طبيعي يناسب مسارات SDE الأماميةFS-PINNs : متغير PINNs يستخدم أخذ عينات SDE أمامي مباشر لنقاط التكوينEM-BSDE : خسارة متسقة ذاتياً بتكامل EM قياسيEM-BSDE (NR) : متغير بدون إعادة تعيين، يستخدم نشر BSDE لـ Y t Y_t Y t بدلاً من التعيين المباشر إلى u θ ( X t , t ) u_\theta(X_t,t) u θ ( X t , t ) Heun-BSDE (هذه الورقة): طريقة تكامل Heun القائمة على Stratonovichمعمارية الشبكة : 8 طبقات، 64 خلية عصبية لكل طبقة، دالة تفعيل Swishالهندسة الميزة : تضمين Fourier بـ 256 بُعد، اتصالات تخطي في الطبقات الفرديةاستراتيجية التدريب : محسّن Adam، جدول معدل تعلم متعدد الخطوات (10 − 3 → 10 − 4 → 10 − 5 10^{-3} \to 10^{-4} \to 10^{-5} 1 0 − 3 → 1 0 − 4 → 1 0 − 5 )حجم الدفعة : 64 مساراً، دفعات فرعية بـ 1024تكرارات التدريب : 100kالدقة : float64 (float32 غير مستقر عددياً في بعض الحالات، انظر الجدول 3)الأجهزة : بطاقة NVIDIA A100 GPU واحدةمشكلة HJB بـ 100 بُعد :
الطريقة خطأ RL2 (خوارزمية المعالجة الدفعية) PINNs 0.1362 ± 0.0276 FS-PINNs 0.1828 ± 0.0774 EM-BSDE 0.3831 ± 0.0084 EM-BSDE (NR) 0.5214 ± 0.0452 Heun-BSDE 0.0573 ± 0.0106
مشكلة BSB بـ 100 بُعد :
الطريقة خطأ RL2 (خوارزمية المعالجة الدفعية) PINNs 3.0488 ± 1.5625 FS-PINNs 0.0851 ± 0.0027 EM-BSDE 0.3668 ± 0.0244 EM-BSDE (NR) 0.1855 ± 0.0078 Heun-BSDE 0.0472 ± 0.0076
مشكلة BZ بـ 10 أبعاد :
الطريقة خطأ RL2 (خوارزمية المعالجة الدفعية) PINNs 3.8495 ± 0.1562 FS-PINNs 0.0270 ± 0.0017 EM-BSDE 0.1933 ± 0.0022 EM-BSDE (NR) 0.1309 ± 0.0311 Heun-BSDE 0.0236 ± 0.0031
الاكتشافات الرئيسية :
يتفوق Heun-BSDE على متغيرات EM-BSDE في جميع الحالات تقريباً أداء Heun-BSDE مماثلة لـ FS-PINNs، مما يستعيد التكافؤ بين BSDE و PINNs يُظهر PINNs القياسي أداءً ضعيفة، مما يبرز أهمية توزيع الأخذ بالعينات اختبار أحجام خطوات مختلفة τ ∈ { 0.04 , 0.02 , 0.01 , 0.005 } \tau \in \{0.04, 0.02, 0.01, 0.005\} τ ∈ { 0.04 , 0.02 , 0.01 , 0.005 } على مشكلة BSB بـ 10 أبعاد:
التحسن في طريقة EM-BSDE محدود جداً (من ∼ 10 − 2 \sim 10^{-2} ∼ 1 0 − 2 إلى ∼ 8 × 10 − 3 \sim 8\times10^{-3} ∼ 8 × 1 0 − 3 ) يستمر Heun-BSDE في التحسن (من ∼ 2 × 10 − 3 \sim 2\times10^{-3} ∼ 2 × 1 0 − 3 إلى ∼ 10 − 3 \sim 10^{-3} ∼ 1 0 − 3 ) التحقق من النظرية : حد الانحياز في EM بنفس ترتيب بقايا PDE، لا يمكن إزالته بتقليل حجم الخطوةاختبار أطوال قفزة مختلفة k ∈ { 1 , 2 , … , 50 } k \in \{1,2,\ldots,50\} k ∈ { 1 , 2 , … , 50 } على BSB بـ 10 أبعاد:
سلوك EM-BSDE :
عند k = 1 k=1 k = 1 RL2 ∼ 10 − 2 \sim 10^{-2} ∼ 1 0 − 2 (متأثر بالانحياز) مع زيادة k k k إلى ∼ 10 \sim 10 ∼ 10 يتحسن الأداء إلى ∼ 3 × 10 − 3 \sim 3\times10^{-3} ∼ 3 × 1 0 − 3 (تخفيف الانحياز) مع استمرار زيادة k k k يتدهور الأداء (انخفاض جودة الخسارة) يوجد k ∗ ≈ 10 k^* \approx 10 k ∗ ≈ 10 أمثل (نقطة التوازن) سلوك Heun-BSDE :
عند k = 1 k=1 k = 1 يصل إلى أفضل أداء ∼ 10 − 3 \sim 10^{-3} ∼ 1 0 − 3 مع زيادة k k k يتدهور الأداء بشكل رتيب التحقق من النظرية : بدون مشكلة انحياز، الخطوة الواحدة هي الأمثلالتكلفة الحسابية (نسبة إلى PINNs):
الطريقة الخوارزمية الكاملة خوارزمية المعالجة الدفعية FS-PINNs 2.64× 1.14× EM-BSDE 2.83× 0.34× Heun-BSDE 36.37× 2.03×
الأداء المعايرة بوقت التشغيل (الشكل 4، HJB بـ 100 بُعد):
يتقارب EM-BSDE بسرعة إلى ∼ 10 − 2 \sim 10^{-2} ∼ 1 0 − 2 لكن لا يمكنه التحسن أكثر يصل Heun-BSDE و FS-PINNs إلى دقة مماثلة ∼ 10 − 3 \sim 10^{-3} ∼ 1 0 − 3 في نفس وقت التشغيل مصادر التكلفة :
يتطلب Heun حوالي ضعف التمريرات الأمامية (خطوة التنبؤ + خطوة التصحيح) يتطلب Heun و PINNs حساب Hessian ∇ 2 u \nabla^2 u ∇ 2 u ، بينما قد يتجنبها EM-BSDE لبعض المعادلات اختبار الأبعاد d ∈ { 2 , 10 , 50 , 100 , 200 , 500 } d \in \{2,10,50,100,200,500\} d ∈ { 2 , 10 , 50 , 100 , 200 , 500 } على مشكلة HJB:
تُظهر جميع طرق المسار (FS-PINNs و EM-BSDE و Heun-BSDE) قابلية توسع جيدة يتخلف EM-BSDE باستمرار في جميع الأبعاد يحافظ Heun-BSDE و FS-PINNs على أداء متقاربة المؤشر PINNs FS-PINNs EM-BSDE Heun-BSDE التكلفة المتراكمة 53.17 46.59 46.42 46.43 خطأ PDE 2.77 3.38 78.94 18.6
يُظهر Heun-BSDE خطأ PDE أقل في مشكلة التحكم غير الخطي، على الرغم من أن التكلفة المتراكمة متقاربة.
تأثير دقة الفاصلة العائمة (الجدول 3):
في BSB بـ 100 بُعد، يبلغ RL2 لـ Heun-BSDE 0.4587 في float32، وينخفض إلى 0.0535 في float64 (تحسن 10 مرات) طريقة EM-BSDE أقل حساسية للدقة يشير إلى أن تكامل Heun له متطلبات أعلى للاستقرار العددي اقترح Raissi وآخرون (2017-2019) إطار عمل PINNs لا تزال تواجه تحديات التحسين (Krishnapriyan وآخرون 2021، Wang وآخرون 2022) لاستراتيجيات الأخذ بالعينات تأثير كبير على الأداء (Nabian وآخرون 2021، Daw وآخرون 2023) BSDE الأصلية (E وآخرون 2017، Han وآخرون 2018): تعلم شبكة مستقلة لكل خطوة زمنية للتنبؤ بـ Y t Y_t Y t و Z t Z_t Z t BSDE المتسقة ذاتياً (Raissi 2024، Nüsken & Richter 2023): شبكة واحدة معاملات جميع الزمكان، باستخدام خسارة متسقة ذاتياًعلاقة هذه الورقة : التركيز على الطرق المتسقة ذاتياً، أول دراسة منهجية لتأثير صيغة التكاملدرس Chassagneux وآخرون (2022) تقطيع Runge-Kutta، لكن فقط لخسارة BSDE الأصلية هذه الورقة أول من يكشف مشكلة صيغة التكامل في الخسارة المتسقة ذاتياً الاختلافات الرئيسية بين هذه الورقة و Nüsken & Richter (2023):
هم: اقترحوا خسارة الاستيفاء (تحتاج إلى ضبط معامل فائق لنطاق الوقت) هذه الورقة: تحديد السبب الجذري (صيغة التكامل)، توفير حل بدون ضبط معامل فائق تحديد السبب الجذري : فجوة الأداء بين BSDE و PINNs تنبع من انحياز التقطيع في تكامل EM في الخسارة المتسقة ذاتياً ذات الخطوة الواحدةالمساهمة النظرية : إثبات صارم بأن EM يُدخل انحيازاً غير قابل للإزالة، و Heun يلغيه تماماًالابتكار المنهجي : Stratonovich-BSDE + تكامل Heun يستعيد التكافؤ بين أداء BSDE و PINNsالتحقق التجريبي : التحقق من التنبؤات النظرية على معايير عالية الأبعاد متعددةالإرشادات العملية : اختيار صيغة التكامل حاسم لحلول BSDE1. التكلفة الحسابية :
Heun-BSDE أبطأ بحوالي 6 مرات من EM-BSDE (خوارزمية المعالجة الدفعية) يتطلب حساب Hessian (لبعض المعادلات) أكثر حساسية لدقة الفاصلة العائمة (يتطلب float64) 2. الأداء النسبية :
على الرغم من استعادة التكافؤ مع PINNs، لا تُظهر ميزة بحجم الرتبة الميزة الحالية بشكل أساسي في سيناريوهات خالية من النموذج 3. نطاق التحليل النظري :
تحليل فقط لحالات الخطوة الواحدة (k = 1 k=1 k = 1 ) والنطاق الزمني الكامل (k = N k=N k = N ) دراسة تجريبية فقط للحالات الوسيطة متعددة الخطوات لم تغطِ تحليل أنظمة FBSDE المقترنة بالكامل 4. نطاق التطبيق :
فشل جميع الطرق في مشكلة BZ بـ 100 بُعد تحتاج إلى مزيد من البحث للأنظمة المقترنة بالكامل فائقة الأبعاد 1. تحسينات الكفاءة الحسابية :
تقدير أثر Hutchinson لتقليل حسابات Hessian طرق Heun قابلة للعكس لتحسين الاستقرار العددي استراتيجيات حجم الخطوة التكيفية 2. توسيع الطريقة :
تقنيات متغيرات التحكم (Takahashi وآخرون 2022) إعدادات تقسيم المشغلات (Beck وآخرون 2021) معادلات PDE غير الخطية بالكامل (Pham وآخرون 2021) 3. تعميق النظرية :
تحليل نظري كامل للخسارة متعددة الخطوات تحليل التقارب لأنظمة FBSDE المقترنة بالكامل المقارنة مع صيغ التكامل عالية الرتبة الأخرى 4. توسيع التطبيقات :
التحكم العشوائي الأمثل الخالي من النموذج تسعير المشتقات المالية عالية الأبعاد نمذجة الأنظمة الفيزيائية المعقدة 1. مساهمة نظرية عميقة :
أول تحديد منهجي للسبب الجذري لمشكلة أداء BSDE توفير إثبات رياضي صارم (النظريات 4.1-4.4، القضايا E.1-E.10) توافق عالي بين النظرية والتجارب (الأشكال 1، 3، 5) 2. تصميم الطريقة ماهر :
تفسير Stratonovich يلغي حد الانحياز المتعلق بـ Hessian بأناقة يتقارب تكامل Heun بشكل طبيعي إلى حل Stratonovich نموذج لتصميم الطريقة المدفوع بالنظرية 3. تصميم التجارب شامل :
معايير متعددة (HJB و BSB و BZ والتحكم بالبندول) أبعاد متعددة (من 2 إلى 500 بُعد) متغيرات متعددة (خوارزميات كاملة/دفعية، float32/64) تجارب استئصالية كافية (الأشكال 3، 5، 6) 4. قيمة عملية عالية :
توفير خوارزمية أخذ عينات فرعية فعالة للمعالجة الدفعية (الخوارزمية 1) الكود مفتوح المصدر قابل للتكرار إرشادات مباشرة لتصميم حلول BSDE 5. الكتابة واضحة :
منطق صارم، من تشخيص المشكلة إلى الحل اشتقاقات رياضية مفصلة (الملاحق D-F) رسوم بيانية بديهية (الأشكال 1، 3، 5 مقنعة بشكل خاص) 1. التكلفة الحسابية كبيرة :
فقدان السرعة 6 مرات قد يحد من التطبيقات العملية لم يتم استكشاف تقنيات التسريع بشكل كافٍ (مثل تقدير Hutchinson) تحتاج مناقشة أعمق للمقايضة بين الكفاءة والدقة مع طريقة EM 2. مشاكل الاستقرار العددي :
حساسة لدقة الفاصلة العائمة (الجدول 3) لم تُقدم تفاصيل التنفيذ المستقر عددياً لم يتم التحقق التجريبي من الطرق البديلة مثل Heun القابل للعكس 3. التحليل النظري غير كامل :
افتقار إلى الوصف النظري للخسارة متعددة الخطوات لم تُدرج أنظمة FBSDE المقترنة بالكامل في الإطار النظري لم تُناقش صيغ التكامل عالية الرتبة (مثل Milstein) 4. قيود التجارب :
فشل جميع الطرق في مشكلة BZ بـ 100 بُعد، لم يتم تحليل السبب بعمق نقص المقارنة مع طرق عالية الرتبة أخرى (مثل Milstein) حالات تطبيق عملي قليلة (فقط التحكم بالبندول) 5. المقارنة مع PINNs :
لم تُظهر ميزة واضحة تتجاوز PINNs لم يتم عرض الميزة الخالية من النموذج بشكل كافٍ تجريبياً (فقط نقاش نظري في الملحق C) لم يتم دراسة تأثير توزيع الأخذ بالعينات على PINNs بعمق 1. المساهمة الأكاديمية :
ملء الفراغ في أبحاث صيغ التكامل لحلول BSDE وضع أساس لأبحاث الطرق عالية الرتبة اللاحقة قد تلهم أبحاث صيغ التكامل في مجالات الحوسبة العلمية الأخرى 2. القيمة العملية :
قيمة مباشرة للتطبيقات التي تتطلب طريقة BSDE (التحكم الخالي من النموذج) إرشادات واضحة لمنفذي حلول BSDE الكود مفتوح المصدر يعزز القابلية للتكرار 3. القيود :
قد تحد التكلفة الحسابية من التطبيق الواسع تحتاج إلى مزيد من التحسينات الهندسية قبل الاعتماد الواسع المرحلة الحالية أكثر "استعادة التكافؤ" من "تجاوز" الأنسب :
التحكم العشوائي الأمثل الخالي من النموذج : لا يمكن الحصول على معادلة الديناميكا بشكل صريح، فقط المحاكاةمسائل مالية عالية الأبعاد : وجود عملية عشوائية أساسية، تحتاج إلى دقة عاليةالنماذج الأولية البحثية : استكشاف إمكانات طريقة BSDE في الأبحاث الأكاديميةغير مناسب :
سيناريوهات موارد حسابية محدودة : قد تكون التكلفة 6 مرات غير مقبولةمعادلة PDE معروفة بدون ديناميكا أساسية : قد تكون PINNs أكثر مباشرةأنظمة مقترنة بالكامل فائقة الأبعاد (>100 بُعد): جميع الطرق تواجه تحدياتنقاط يجب الانتباه لها :
يتطلب دقة float64 يتطلب ضبط دقيق لمعمارية الشبكة واستراتيجية التدريب اختيار توزيع الأخذ بالعينات لا يزال مهماً (FS-PINNs مقابل PINNs) Raissi وآخرون (2017-2019) : الأعمال الأساسية لطريقة PINNsE, Han, Jentzen (2017) : طريقة BSDE العميقة الأصليةNüsken & Richter (2023) : طريقة خسارة الاستيفاء، العمل الذي تستجيب له هذه الورقة مباشرةKloeden & Platen (1992) : كتاب مرجعي كلاسيكي للحل العددي للمعادلات الستوكاستيةChassagneux وآخرون (2022) : تقطيع Runge-Kutta لـ BSDEالتقييم الشامل : هذه ورقة عالية الجودة تجمع بين النظرية والتجارب، تحدد وتحل الاختناق الرئيسي في طريقة BSDE. التحليل النظري صارم، تصميم التجارب شامل، والمساهمة مهمة للمجال. أوجه القصور الرئيسية تتعلق بالتكلفة الحسابية ومشاكل الاستقرار العددي التي تحتاج إلى مزيد من التحسينات الهندسية. توفر الورقة إرشادات منهجية واضحة لتصميم حلول BSDE، ومن المتوقع أن تحقق تأثيراً عملياً في سيناريوهات تطبيقات محددة مثل التحكم الخالي من النموذج.