2025-11-21T18:34:22.859424

Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching

Mei, Wei, Yong
This paper is concerned with stochastic linear quadratic (LQ, for short) optimal control problems in an infinite horizon with conditional mean-field term in a switching regime environment. The orthogonal decomposition introduced in [21] has been adopted. Desired algebraic Riccati equations (AREs, for short) and a system of backward stochastic differential equations (BSDEs, for short) in infinite time horizon with the coefficients depending on the Markov chain have been derived. The determination of closed-loop optimal strategy follows from the solvability of ARE and BSDE. Moreover, the solvability of BSDEs leads to a characterization of open-loop solvability of the optimal control problem.
academic

मीन-फील्ड स्टोकेस्टिक डिफरेंशियल इक्वेशन्स के लिए लीनियर-क्वाड्रेटिक ऑप्टिमल कंट्रोल: इनफिनिट-होराइजन में रेजीम स्विचिंग के साथ

मूल जानकारी

  • पेपर ID: 2501.00981
  • शीर्षक: Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching
  • लेखक: Hongwei Mei (टेक्सास टेक विश्वविद्यालय), Qingmeng Wei (नॉर्थईस्ट नॉर्मल विश्वविद्यालय), Jiongmin Yong (सेंट्रल फ्लोरिडा विश्वविद्यालय)
  • वर्गीकरण: math.OC (अनुकूलन और नियंत्रण)
  • प्रकाशन समय: 3 जनवरी 2025
  • पेपर लिंक: https://arxiv.org/abs/2501.00981

सारांश

यह पेपर मार्कोव स्विचिंग वातावरण में सशर्त मीन-फील्ड पदों के साथ अनंत समय-क्षितिज स्टोकेस्टिक लीनियर क्वाड्रेटिक (LQ) इष्टतम नियंत्रण समस्या का अध्ययन करता है। पेपर साहित्य 21 में प्रस्तुत ऑर्थोगोनल अपघटन विधि का उपयोग करता है, अपेक्षित बीजीय रिक्काटी समीकरण (ARE) और अनंत समय-क्षितिज में मार्कोव श्रृंखला पर निर्भर गुणांक वाले पश्चगामी स्टोकेस्टिक अवकल समीकरण (BSDE) की एक प्रणाली प्राप्त करता है। बंद-लूप इष्टतम रणनीति का निर्धारण ARE और BSDE की समाधेयता पर निर्भर करता है। इसके अतिरिक्त, BSDE की समाधेयता इष्टतम नियंत्रण समस्या की खुली-लूप समाधेयता के लिए एक विशेषीकरण प्रदान करती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

इस पेपर में अध्ययन की जाने वाली मूल समस्या मार्कोव स्विचिंग वातावरण में, मीन-फील्ड पदों के साथ अनंत समय-क्षितिज स्टोकेस्टिक लीनियर क्वाड्रेटिक इष्टतम नियंत्रण समस्या है। विशेष रूप से:

  1. स्थिति समीकरण: n-आयामी नियंत्रित मीन-फील्ड स्टोकेस्टिक अवकल समीकरण पर विचार करें
    dX(t) = [A(α(t))X(t) + Ā(α(t))E^α_t[X(t)] + B(α(t))u(t) + B̄(α(t))E^α_t[u(t)] + b(t)]dt
           + [C(α(t))X(t) + C̄(α(t))E^α_t[X(t)] + D(α(t))u(t) + D̄(α(t))E^α_t[u(t)] + σ(t)]dW(t)
    
  2. उद्देश्य फलन:
    J_∞(s,ι,ξ;u(·)) = E∫_s^∞ f(t,α(t),X(t),E^α_t[X(t)],u(t),E^α_t[u(t)])dt
    

अनुसंधान का महत्व

  1. सैद्धांतिक महत्व: शास्त्रीय LQ नियंत्रण सिद्धांत को मीन-फील्ड और मार्कोव स्विचिंग के संयुक्त मामले तक विस्तारित करता है
  2. व्यावहारिक अनुप्रयोग: वित्त, इंजीनियरिंग और सामाजिक विज्ञान में व्यापक अनुप्रयोग, जैसे पोर्टफोलियो अनुकूलन, नेटवर्क नियंत्रण आदि
  3. तकनीकी चुनौतियाँ: अनंत समय-क्षितिज, मीन-फील्ड पद और मार्कोव स्विचिंग का संयोजन महत्वपूर्ण तकनीकी कठिनाइयाँ लाता है

मौजूदा विधियों की सीमाएँ

  1. सीमित समय-क्षितिज प्रतिबंध: अधिकांश मौजूदा कार्य सीमित समय-क्षितिज मामले तक सीमित हैं
  2. मार्कोव स्विचिंग की कमी: बहुत कम कार्य मीन-फील्ड पद और मार्कोव स्विचिंग दोनों को एक साथ संभालते हैं
  3. स्थिरता शर्तें: मौजूदा स्थिरता शर्तें अक्सर बहुत कठोर होती हैं, मार्कोव स्विचिंग मामले के लिए उपयुक्त नहीं होती हैं

मुख्य योगदान

  1. नया स्थिरता सिद्धांत स्थापित किया: मार्कोव स्विचिंग वातावरण में L²-घातीय स्थिरता, L²-समाकलनीयता और विसरण को परिभाषित किया, और उनकी समतुल्यता प्रमाणित की
  2. बीजीय रिक्काटी समीकरण प्राप्त किए: पूर्ण विधि के माध्यम से मार्कोव श्रृंखला स्थिति पर निर्भर ARE प्रणाली प्राप्त की, और इसके स्थिरीकरण समाधान की अस्तित्व और अद्वितीयता प्रमाणित की
  3. अनंत समय-क्षितिज BSDE सिद्धांत स्थापित किया: मार्कोव स्विचिंग पद वाली अनंत समय-क्षितिज BSDE प्रणाली की सुस्थापितता प्रमाणित की
  4. समाधेयता का संपूर्ण विशेषीकरण: बंद-लूप समाधेयता और खुली-लूप समाधेयता का संपूर्ण विशेषीकरण दिया

विधि विवरण

कार्य परिभाषा

प्रारंभिक शर्त (s,ι,ξ) ∈ D दी गई है, इष्टतम नियंत्रण ū(·) ∈ U_ad[s,∞) खोजें जो निम्नलिखित को संतुष्ट करे:

J_∞(s,ι,ξ;ū(·)) = inf_{u(·)∈U_ad[s,∞)} J_∞(s,ι,ξ;u(·))

मुख्य विधि आर्किटेक्चर

1. ऑर्थोगोनल अपघटन तकनीक

साहित्य 21 की ऑर्थोगोनल अपघटन विधि का उपयोग करते हुए, मूल समस्या को दो ऑर्थोगोनल उप-स्थानों पर समस्याओं में विभाजित करें:

  • प्रक्षेपण संचालक: Π₂v(·) = E^α_tv(t), Π₁ = I - Π₂
  • अपघटित स्थिति समीकरण:
    dX₁(t) = {A₁(α(t))X₁(t) + B₁(α(t))u₁(t) + b₁(t)}dt + {...}dW(t)
    dX₂(t) = {A₂(α(t))X₂(t) + B₂(α(t))u₂(t) + b₂(t)}dt
    

2. स्थिरता विश्लेषण

तीन समतुल्य स्थिरता अवधारणाओं को परिभाषित किया:

परिभाषा 3.1: प्रणाली A,Ā,C,C̄ को L²-घातीय स्थिर कहा जाता है, यदि स्थिरांक K,δ > 0 मौजूद हों जैसे:

E|X⁰(t;s,ξ,ι)|² ≤ Ke^{-δ(t-s)}E|ξ|², ∀t ≥ s

प्रस्ताव 3.3: निम्नलिखित शर्तें समतुल्य हैं:

  • L²-घातीय स्थिरता
  • L²-समाकलनीयता
  • विसरण
  • लायपुनोव असमानता प्रणाली (3.7) का सकारात्मक निश्चित समाधान

3. बीजीय रिक्काटी समीकरण

पूर्ण विधि के माध्यम से ARE प्रणाली प्राप्त की:

Λ[Pₖ(·)](ι) + Pₖ(ι)Aₖ(ι) + Aₖ(ι)ᵀPₖ(ι) + Cₖ(ι)ᵀP₁(ι)Cₖ(ι) + Qₖ(ι)
- [Pₖ(ι)Bₖ(ι) + Cₖ(ι)ᵀP₁(ι)Dₖ(ι) + Sₖ(ι)ᵀ][Rₖ(ι) + Dₖ(ι)ᵀP₁(ι)Dₖ(ι)]⁻¹
  ·[Bₖ(ι)ᵀPₖ(ι) + Dₖ(ι)ᵀP₁(ι)Cₖ(ι) + Sₖ(ι)] = 0

4. अनंत समय-क्षितिज BSDE प्रणाली

निम्नलिखित BSDE प्रणाली की सुस्थापितता का सिद्धांत स्थापित किया:

dY₁ = -[(A₁^{Θ₁})ᵀY₁ + (C₁^{Θ₁})ᵀΠ₁[Z] + P₁b₁ + (C₁^{Θ₁})ᵀP₁σ₁ + q₁ + Θ₁ᵀr₁]dt + ZdW + Z₁ᴹdM
dY₂ = -[(A₂^{Θ₂})ᵀY₂ + (C₂^{Θ₂})ᵀΠ₂[Z] + P₂b₂ + (C₂^{Θ₂})ᵀP₁σ₂ + q₂ + Θ₂ᵀr₂]dt + Z₂ᴹdM

तकनीकी नवाचार बिंदु

  1. मार्कोव माप सिद्धांत: मार्कोव श्रृंखला के मार्टिंगेल माप {Mᵢⱼ(·)|ι,j ∈ M} को प्रस्तुत किया, स्विचिंग पदों को संभालने के लिए उपकरण प्रदान किया
  2. नई स्थिरीकरण शर्तें: प्रमाणित किया कि प्रणाली A,Ā,C,C̄;B,B̄,D,D̄ की L²-स्थिरीकरण क्षमता प्रत्येक निश्चित स्थिति ι ∈ M पर प्रणाली की स्थिरीकरण क्षमता के समतुल्य नहीं है
  3. अनंत समय-क्षितिज BSDE नई विधि: चूंकि स्थिरता शर्तें कमजोर हैं, मौजूदा परिणामों को सीधे लागू नहीं किया जा सकता, नई प्रमाण तकनीकें विकसित की गईं

प्रायोगिक सेटअप

सैद्धांतिक सत्यापन

यह पेपर मुख्य रूप से सैद्धांतिक कार्य है, निम्नलिखित तरीकों से सैद्धांतिक परिणामों को सत्यापित करता है:

  1. रचनात्मक प्रमाण: सीमित समय-क्षितिज समस्या की सीमा प्रक्रिया के माध्यम से ARE के समाधान का निर्माण
  2. द्वैत सत्यापन: द्वैत संबंध के माध्यम से BSDE समाधान की सही्ता को सत्यापित करना
  3. प्रतिउदाहरण निर्माण: उदाहरण 3.4 और 3.8 के माध्यम से सैद्धांतिक परिणामों की आवश्यकता को दर्शाना

मुख्य मान्यताएँ

  • (A1): गुणांकों की सीमितता
  • (A2): गैर-सजातीय पदों की समाकलनीयता
  • (A3): भार मैट्रिक्स की सकारात्मक निश्चितता शर्तें
  • (A4): स्थिरीकरण क्षमता शर्तें

मुख्य सैद्धांतिक परिणाम

प्रमेय 5.1 (मुख्य परिणाम)

मान्यताओं (A1)-(A4) के अंतर्गत:

  1. ARE समाधेयता: अद्वितीय समाधान P₁,P₂: M → Sⁿ₊₊ मौजूद है जो (Θ₁(·),Θ₂(·)) ∈ SA,Ā,C,C̄;B,B̄,D,D̄ को संतुष्ट करता है
  2. BSDE सुस्थापितता: BSDE प्रणाली (5.2) का अद्वितीय अनुकूलित समाधान मौजूद है
  3. इष्टतम नियंत्रण: बंद-लूप इष्टतम रणनीति निम्नलिखित है:
    ūₖ = ΘₖXₖ - (Rₖ + Dₖᵀ P₁Dₖ)⁻¹(Bₖᵀ Yₖ + Dₖᵀ Πₖ[Z] + Dₖᵀ P₁σₖ + rₖ)
    

प्रमेय 5.2 (ARE समाधेयता)

सीमित समय-क्षितिज समस्या की सीमा प्रक्रिया के माध्यम से, ARE के स्थिरीकरण समाधान की अस्तित्व और अद्वितीयता प्रमाणित की।

प्रमेय 5.3 (BSDE सुस्थापितता)

किसी भी (φ₁(·),φ₂(·)) ∈ L²_{F^α}(0,∞;Rⁿ)⊥ × L²_{F^α}(0,∞;Rⁿ) के लिए, BSDE प्रणाली का अद्वितीय समाधान मौजूद है।

प्रमेय 6.1 (खुली-लूप समाधेयता विशेषीकरण)

इष्टतम युग्म (X̄(·),ū(·)) FBSDE प्रणाली और स्थिर शर्त के समाधान के समतुल्य है।

संबंधित कार्य

ऐतिहासिक विकास

  1. शास्त्रीय LQ सिद्धांत: Bellman-Glicksberg-Gross (1960), Kalman (1960), Letov (1960)
  2. स्टोकेस्टिक LQ सिद्धांत: Kushner (1960s), Wonham (1960s)
  3. अनिश्चित LQ सिद्धांत: Chen-Li-Zhou (1998), Sun-Yong (2014-2018)
  4. मीन-फील्ड LQ सिद्धांत: Yong (2013), Huang-Li-Yong (2015)

संबंधित कार्य की तुलना में इस पेपर का योगदान

  1. 21 की तुलना में: अनंत समय-क्षितिज मामले तक विस्तारित
  2. शास्त्रीय सिद्धांत की तुलना में: मीन-फील्ड पद और मार्कोव स्विचिंग प्रस्तुत करता है
  3. सीमित समय-क्षितिज मीन-फील्ड सिद्धांत की तुलना में: अनंत समय-क्षितिज की तकनीकी चुनौतियों को संभालता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. मार्कोव स्विचिंग मीन-फील्ड LQ समस्या का संपूर्ण सैद्धांतिक ढांचा स्थापित किया
  2. बंद-लूप और खुली-लूप समाधेयता के लिए आवश्यक और पर्याप्त शर्तें दीं
  3. अनंत समय-क्षितिज स्विचिंग BSDE को संभालने के लिए नई विधि विकसित की

सीमाएँ

  1. सकारात्मक निश्चितता मान्यता: वर्तमान में भार मैट्रिक्स की सकारात्मक निश्चितता की आवश्यकता है, लेखक स्वीकार करते हैं कि बाद के कार्य में इस मान्यता को शिथिल करेंगे
  2. सीमित स्थिति स्थान: मार्कोव श्रृंखला सीमित स्थिति स्थान तक सीमित है
  3. लीनियर संरचना: केवल लीनियर प्रणालियों पर विचार करता है

भविष्य की दिशाएँ

  1. सकारात्मक निश्चितता शर्त को शिथिल करना, अनिश्चित मामले का अध्ययन करना
  2. अनंत-आयामी मामले तक विस्तारित करना
  3. कूद विसरण प्रक्रियाओं पर विचार करना

गहन मूल्यांकन

लाभ

  1. सैद्धांतिक पूर्णता: स्थिरता से इष्टतम नियंत्रण तक संपूर्ण सैद्धांतिक श्रृंखला प्रदान करता है
  2. तकनीकी नवाचार: मार्कोव स्विचिंग को संभालने के लिए नई तकनीकें विकसित करता है, विशेषकर अनंत समय-क्षितिज BSDE सिद्धांत
  3. कठोरता: प्रमाण विस्तृत और कठोर हैं, तकनीकी प्रक्रिया मानक है
  4. व्यावहारिक मूल्य: व्यावहारिक अनुप्रयोगों के लिए सैद्धांतिक आधार प्रदान करता है

कमियाँ

  1. अनुप्रयोग सत्यापन की कमी: शुद्ध सैद्धांतिक कार्य के रूप में, संख्यात्मक प्रयोग और व्यावहारिक अनुप्रयोग सत्यापन की कमी है
  2. मान्यता सीमाएँ: सकारात्मक निश्चितता मान्यता अनुप्रयोग की सीमा को सीमित करती है
  3. कम्प्यूटेशनल जटिलता: ARE और BSDE के संख्यात्मक समाधान विधि पर चर्चा नहीं की गई है

प्रभाव

  1. शैक्षणिक योगदान: मार्कोव स्विचिंग मीन-फील्ड LQ सिद्धांत में अंतराल को भरता है
  2. बाद के अनुसंधान: संबंधित क्षेत्रों के लिए महत्वपूर्ण सैद्धांतिक उपकरण प्रदान करता है
  3. अनुप्रयोग क्षमता: वित्तीय गणित, स्टोकेस्टिक नियंत्रण आदि क्षेत्रों में महत्वपूर्ण अनुप्रयोग संभावना है

लागू परिदृश्य

  1. वित्तीय इंजीनियरिंग: पोर्टफोलियो अनुकूलन, जोखिम प्रबंधन
  2. इंजीनियरिंग नियंत्रण: नेटवर्क नियंत्रण प्रणाली, बहु-एजेंट प्रणाली
  3. सामाजिक विज्ञान: जनसंख्या गतिशीलता, आर्थिक मॉडल

संदर्भ

पेपर 41 संबंधित संदर्भों का हवाला देता है, जो LQ नियंत्रण सिद्धांत के मुख्य विकास पथ को कवर करते हैं, विशेषकर:

  • 30 Sun & Yong का स्टोकेस्टिक LQ सिद्धांत मोनोग्राफ
  • 21 Mei-Wei-Yong का सीमित समय-क्षितिज मीन-फील्ड LQ समस्या पर पूर्व कार्य
  • 5 Chen-Li-Zhou का अनिश्चित LQ समस्या पर अग्रणी कार्य

समग्र मूल्यांकन: यह मार्कोव स्विचिंग मीन-फील्ड स्टोकेस्टिक नियंत्रण सिद्धांत में एक उच्च गुणवत्ता वाला सैद्धांतिक पेपर है जो महत्वपूर्ण योगदान देता है। पेपर तकनीकी प्रक्रिया कठोर है, सैद्धांतिक परिणाम संपूर्ण हैं, और इस क्षेत्र के आगे विकास के लिए एक ठोस आधार प्रदान करते हैं। हालांकि संख्यात्मक सत्यापन की कमी है, लेकिन इसका सैद्धांतिक मूल्य और अनुप्रयोग क्षमता इसे इस क्षेत्र में एक महत्वपूर्ण प्रगति बनाती है।