2025-11-21T18:34:22.859424

Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching

Mei, Wei, Yong

This paper is concerned with stochastic linear quadratic (LQ, for short) optimal control problems in an infinite horizon with conditional mean-field term in a switching regime environment. The orthogonal decomposition introduced in [21] has been adopted. Desired algebraic Riccati equations (AREs, for short) and a system of backward stochastic differential equations (BSDEs, for short) in infinite time horizon with the coefficients depending on the Markov chain have been derived. The determination of closed-loop optimal strategy follows from the solvability of ARE and BSDE. Moreover, the solvability of BSDEs leads to a characterization of open-loop solvability of the optimal control problem.

academic

التحكم الأمثل الخطي-التربيعي لمعادلات التفاضل العشوائي متوسط المجال في الأفق اللانهائي مع التبديل النظامي

المعلومات الأساسية

معرّف الورقة: 2501.00981
العنوان: Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching
المؤلفون: Hongwei Mei (جامعة تكساس للتكنولوجيا)، Qingmeng Wei (جامعة نورثيست نورمال)، Jiongmin Yong (جامعة وسط فلوريدا)
التصنيف: math.OC (التحسين والتحكم)
تاريخ النشر: 3 يناير 2025
رابط الورقة: https://arxiv.org/abs/2501.00981

الملخص

تدرس هذه الورقة مسألة التحكم الأمثل العشوائي الخطي-التربيعي (LQ) في الأفق اللانهائي مع شروط متوسط المجال في بيئة ماركوفية التبديل. تعتمد الورقة على طريقة التحليل المتعامد المقدمة في المرجع 21، وتشتق معادلات ريكاتي الجبرية المتوقعة (AREs) ونظام معادلات تفاضلية عشوائية عكسية (BSDEs) في الأفق اللانهائي مع معاملات تعتمد على سلسلة ماركوف. يعتمد تحديد استراتيجية التحكم الأمثل ذات الحلقة المغلقة على قابلية حل ARE و BSDE. بالإضافة إلى ذلك، توفر قابلية حل BSDEs توصيفاً لقابلية حل مسألة التحكم الأمثل ذات الحلقة المفتوحة.

السياق البحثي والدافع

تعريف المسألة

تركز المسألة الأساسية للدراسة على مسألة التحكم الأمثل العشوائي الخطي-التربيعي في الأفق اللانهائي مع شروط متوسط المجال في بيئة ماركوفية التبديل. بشكل محدد:

معادلة الحالة: النظر في معادلة تفاضلية عشوائية خطية مُتحكم بها ذات متوسط مجال بحجم n

dX(t) = [A(α(t))X(t) + Ā(α(t))E^α_t[X(t)] + B(α(t))u(t) + B̄(α(t))E^α_t[u(t)] + b(t)]dt
       + [C(α(t))X(t) + C̄(α(t))E^α_t[X(t)] + D(α(t))u(t) + D̄(α(t))E^α_t[u(t)] + σ(t)]dW(t)

دالة الهدف:

J_∞(s,ι,ξ;u(·)) = E∫_s^∞ f(t,α(t),X(t),E^α_t[X(t)],u(t),E^α_t[u(t)])dt

أهمية البحث

الأهمية النظرية: توسيع نظرية التحكم LQ الكلاسيكية إلى الحالة المركبة من متوسط المجال والتبديل الماركوفي
التطبيقات العملية: تطبيقات واسعة في المالية والهندسة والعلوم الاجتماعية، مثل تحسين المحفظة والتحكم في الشبكات
التحديات التقنية: يؤدي الجمع بين الأفق اللانهائي وشروط متوسط المجال والتبديل الماركوفي إلى صعوبات تقنية كبيرة

قيود الطرق الموجودة

قيود الأفق المحدود: تقتصر معظم الأعمال الموجودة على حالة الأفق المحدود
غياب التبديل الماركوفي: نادراً ما تتعامل الأعمال مع شروط متوسط المجال والتبديل الماركوفي معاً
شروط الاستقرار: غالباً ما تكون شروط الاستقرار الموجودة صارمة جداً وغير قابلة للتطبيق على حالة التبديل الماركوفي

المساهمات الأساسية

إنشاء نظرية استقرار جديدة: تعريف الاستقرار الأسي L²، القابلية للتكامل L²، والتبديد في بيئة ماركوفية التبديل، وإثبات تكافؤها
اشتقاق معادلات ريكاتي الجبرية: الحصول على نظام ARE يعتمد على حالة سلسلة ماركوف من خلال طريقة الإكمال، وإثبات وجود وتفرد الحل المستقر
إنشاء نظرية BSDE في الأفق اللانهائي: إثبات الصحة الرياضية لنظام BSDE في الأفق اللانهائي مع شروط التبديل الماركوفي
توصيف كامل للقابلية للحل: توفير توصيف كامل لقابلية الحل ذات الحلقة المغلقة والحلقة المفتوحة

شرح الطريقة

تعريف المهمة

بالنظر إلى الشروط الابتدائية (s,ι,ξ) ∈ D، البحث عن التحكم الأمثل ū(·) ∈ U_ad[s,∞) بحيث:

J_∞(s,ι,ξ;ū(·)) = inf_{u(·)∈U_ad[s,∞)} J_∞(s,ι,ξ;u(·))

البنية الأساسية للطريقة

1. تقنية التحليل المتعامد

استخدام طريقة التحليل المتعامد من المرجع 21 لتحليل المسألة الأصلية إلى مسائل على فضاءين جزئيين متعامدين:

مؤثرات الإسقاط: Π₂v(·) = E^α_tv(t)، Π₁ = I - Π₂

معادلات الحالة بعد التحليل:

dX₁(t) = {A₁(α(t))X₁(t) + B₁(α(t))u₁(t) + b₁(t)}dt + {...}dW(t)
dX₂(t) = {A₂(α(t))X₂(t) + B₂(α(t))u₂(t) + b₂(t)}dt

2. تحليل الاستقرار

تعريف ثلاثة مفاهيم استقرار متكافئة:

التعريف 3.1: يُقال أن النظام A,Ā,C,C̄ مستقر أسياً من الدرجة L² إذا كانت هناك ثوابت K,δ > 0 بحيث:

E|X⁰(t;s,ξ,ι)|² ≤ Ke^{-δ(t-s)}E|ξ|², ∀t ≥ s

القضية 3.3: الشروط التالية متكافئة:

الاستقرار الأسي من الدرجة L²
القابلية للتكامل من الدرجة L²
التبديد
نظام عدم المساواة Lyapunov (3.7) له حل موجب محدد

3. معادلة ريكاتي الجبرية

اشتقاق نظام ARE من خلال طريقة الإكمال:

Λ[Pₖ(·)](ι) + Pₖ(ι)Aₖ(ι) + Aₖ(ι)ᵀPₖ(ι) + Cₖ(ι)ᵀP₁(ι)Cₖ(ι) + Qₖ(ι)
- [Pₖ(ι)Bₖ(ι) + Cₖ(ι)ᵀP₁(ι)Dₖ(ι) + Sₖ(ι)ᵀ][Rₖ(ι) + Dₖ(ι)ᵀP₁(ι)Dₖ(ι)]⁻¹
  ·[Bₖ(ι)ᵀPₖ(ι) + Dₖ(ι)ᵀP₁(ι)Cₖ(ι) + Sₖ(ι)] = 0

4. نظام BSDE في الأفق اللانهائي

إنشاء نظرية الصحة الرياضية لنظام BSDE التالي:

dY₁ = -[(A₁^{Θ₁})ᵀY₁ + (C₁^{Θ₁})ᵀΠ₁[Z] + P₁b₁ + (C₁^{Θ₁})ᵀP₁σ₁ + q₁ + Θ₁ᵀr₁]dt + ZdW + Z₁ᴹdM
dY₂ = -[(A₂^{Θ₂})ᵀY₂ + (C₂^{Θ₂})ᵀΠ₂[Z] + P₂b₂ + (C₂^{Θ₂})ᵀP₁σ₂ + q₂ + Θ₂ᵀr₂]dt + Z₂ᴹdM

نقاط الابتكار التقني

نظرية القياس الماركوفي: إدخال مقاييس مارتينجيل سلسلة ماركوف {Mᵢⱼ(·)|ι,j ∈ M}، مما يوفر أدوات للتعامل مع شروط التبديل
شروط التثبيت الجديدة: إثبات أن قابلية التثبيت L² للنظام A,Ā,C,C̄;B,B̄,D,D̄ ليست مكافئة لقابلية التثبيت للنظام على كل حالة ثابتة ι ∈ M
طريقة جديدة لـ BSDE في الأفق اللانهائي: نظراً لأن شروط الاستقرار أضعف، لا يمكن تطبيق النتائج الموجودة مباشرة، لذا تم تطوير تقنيات إثبات جديدة

إعداد التجارب

التحقق النظري

هذا العمل نظري بشكل أساسي، ويتم التحقق من النتائج النظرية بالطرق التالية:

الإثبات البناء: بناء حل ARE من خلال عملية الحد من مسائل الأفق المحدود
التحقق الثنائي: التحقق من صحة حل BSDE من خلال العلاقات الثنائية
بناء الأمثلة المضادة: توضيح ضرورة النتائج النظرية من خلال الأمثلة 3.4 و 3.8

الافتراضات الرئيسية

(A1): محدودية المعاملات
(A2): قابلية التكامل للحدود غير المتجانسة
(A3): شروط التحديد الموجب لمصفوفات الأوزان
(A4): شروط القابلية للتثبيت

النتائج النظرية الرئيسية

النظرية 5.1 (النتيجة الرئيسية)

تحت الافتراضات (A1)-(A4):

قابلية حل ARE: يوجد حل فريد P₁,P₂: M → Sⁿ₊₊ بحيث (Θ₁(·),Θ₂(·)) ∈ SA,Ā,C,C̄;B,B̄,D,D̄
الصحة الرياضية لـ BSDE: نظام BSDE (5.2) له حل متكيف فريد
التحكم الأمثل: استراتيجية التحكم الأمثل ذات الحلقة المغلقة هي:
```
ūₖ = ΘₖXₖ - (Rₖ + Dₖᵀ P₁Dₖ)⁻¹(Bₖᵀ Yₖ + Dₖᵀ Πₖ[Z] + Dₖᵀ P₁σₖ + rₖ)
```

النظرية 5.2 (قابلية حل ARE)

من خلال عملية الحد من مسائل الأفق المحدود، يتم إثبات وجود وتفرد الحل المستقر لـ ARE.

النظرية 5.3 (الصحة الرياضية لـ BSDE)

لأي (φ₁(·),φ₂(·)) ∈ L²_{F^α}(0,∞;Rⁿ)⊥ × L²_{F^α}(0,∞;Rⁿ)، نظام BSDE له حل فريد.

النظرية 6.1 (توصيف قابلية الحل ذات الحلقة المفتوحة)

الزوج الأمثل (X̄(·),ū(·)) مكافئ لحل نظام FBSDE مع شرط ثابت.

الأعمال ذات الصلة

التطور التاريخي

نظرية LQ الكلاسيكية: Bellman-Glicksberg-Gross (1960)، Kalman (1960)، Letov (1960)
نظرية LQ العشوائية: Kushner (الستينيات)، Wonham (الستينيات)
نظرية LQ غير المحددة: Chen-Li-Zhou (1998)، Sun-Yong (2014-2018)
نظرية LQ متوسط المجال: Yong (2013)، Huang-Li-Yong (2015)

مساهمة هذه الورقة مقارنة بالأعمال ذات الصلة

مقارنة بـ 21: التوسع إلى حالة الأفق اللانهائي
مقارنة بالنظرية الكلاسيكية: إدخال شروط متوسط المجال والتبديل الماركوفي
مقارنة بنظرية متوسط المجال ذات الأفق المحدود: معالجة التحديات التقنية للأفق اللانهائي

الخلاصة والنقاش

الاستنتاجات الرئيسية

إنشاء إطار نظري كامل لمسألة LQ متوسط المجال مع التبديل الماركوفي
توفير شروط ضرورية وكافية لقابلية الحل ذات الحلقة المغلقة والمفتوحة
تطوير طريقة جديدة للتعامل مع BSDE التبديل في الأفق اللانهائي

القيود

افتراض التحديد الموجب: يتطلب حالياً أن تكون مصفوفات الأوزان موجبة محددة، ويعترف المؤلفون بأنهم سيخففون هذا الافتراض في الأعمال اللاحقة
فضاء الحالة المحدود: سلسلة ماركوف مقيدة بفضاء حالة محدود
البنية الخطية: النظر فقط في الأنظمة الخطية

الاتجاهات المستقبلية

تخفيف شروط التحديد الموجب، دراسة الحالة غير المحددة
التوسع إلى الحالات ذات الأبعاد اللانهائية
النظر في عمليات الانتشار مع القفزات

التقييم المتعمق

المميزات

الاكتمال النظري: توفير سلسلة نظرية كاملة من الاستقرار إلى التحكم الأمثل
الابتكار التقني: تطوير تقنيات جديدة للتعامل مع التبديل الماركوفي، خاصة نظرية BSDE في الأفق اللانهائي
الدقة: الإثبات تفصيلي وصارم، والمعالجة التقنية منتظمة
القيمة العملية: توفير أساس نظري للتطبيقات العملية

أوجه القصور

نقص التحقق التطبيقي: كعمل نظري بحت، يفتقر إلى التجارب الرقمية والتحقق من التطبيقات العملية
قيود الافتراضات: يحد افتراض التحديد الموجب من نطاق التطبيقات
التعقيد الحسابي: لم يتم مناقشة طرق الحل الرقمي لـ ARE و BSDE

التأثير

المساهمة الأكاديمية: ملء الفراغ في نظرية LQ متوسط المجال مع التبديل الماركوفي
الأبحاث اللاحقة: توفير أدوات نظرية مهمة للمجالات ذات الصلة
الإمكانات التطبيقية: آفاق تطبيق مهمة في الرياضيات المالية والتحكم العشوائي

السيناريوهات المناسبة

الهندسة المالية: تحسين المحفظة، إدارة المخاطر
التحكم الهندسي: أنظمة التحكم في الشبكات، أنظمة الوكلاء المتعددين
العلوم الاجتماعية: الديناميكيات السكانية، النماذج الاقتصادية

المراجع

تستشهد الورقة بـ 41 مرجعاً ذا صلة، تغطي المسار الرئيسي لتطور نظرية التحكم LQ، خاصة:

30 كتاب Sun & Yong عن نظرية LQ العشوائية
21 عمل Mei-Wei-Yong السابق حول مسألة LQ متوسط المجال ذات الأفق المحدود
5 عمل Chen-Li-Zhou الرائد حول مسألة LQ غير المحددة

التقييم الشامل: هذه ورقة نظرية عالية الجودة قدمت مساهمات مهمة في نظرية التحكم العشوائي متوسط المجال مع التبديل الماركوفي. تتميز الورقة بمعالجة تقنية صارمة ونتائج نظرية كاملة، مما يضع أساساً متيناً لمزيد من التطور في هذا المجال. على الرغم من افتقارها للتحقق الرقمي، فإن قيمتها النظرية وإمكانياتها التطبيقية تجعلها تقدماً مهماً في المجال.