Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching
Mei, Wei, Yong
This paper is concerned with stochastic linear quadratic (LQ, for short) optimal control problems in an infinite horizon with conditional mean-field term in a switching regime environment. The orthogonal decomposition introduced in [21] has been adopted. Desired algebraic Riccati equations (AREs, for short) and a system of backward stochastic differential equations (BSDEs, for short) in infinite time horizon with the coefficients depending on the Markov chain have been derived. The determination of closed-loop optimal strategy follows from the solvability of ARE and BSDE. Moreover, the solvability of BSDEs leads to a characterization of open-loop solvability of the optimal control problem.
academic
मीन-फील्ड स्टोकेस्टिक डिफरेंशियल इक्वेशन्स के लिए लीनियर-क्वाड्रेटिक ऑप्टिमल कंट्रोल: इनफिनिट-होराइजन में रेजीम स्विचिंग के साथ
यह पेपर मार्कोव स्विचिंग वातावरण में सशर्त मीन-फील्ड पदों के साथ अनंत समय-क्षितिज स्टोकेस्टिक लीनियर क्वाड्रेटिक (LQ) इष्टतम नियंत्रण समस्या का अध्ययन करता है। पेपर साहित्य 21 में प्रस्तुत ऑर्थोगोनल अपघटन विधि का उपयोग करता है, अपेक्षित बीजीय रिक्काटी समीकरण (ARE) और अनंत समय-क्षितिज में मार्कोव श्रृंखला पर निर्भर गुणांक वाले पश्चगामी स्टोकेस्टिक अवकल समीकरण (BSDE) की एक प्रणाली प्राप्त करता है। बंद-लूप इष्टतम रणनीति का निर्धारण ARE और BSDE की समाधेयता पर निर्भर करता है। इसके अतिरिक्त, BSDE की समाधेयता इष्टतम नियंत्रण समस्या की खुली-लूप समाधेयता के लिए एक विशेषीकरण प्रदान करती है।
इस पेपर में अध्ययन की जाने वाली मूल समस्या मार्कोव स्विचिंग वातावरण में, मीन-फील्ड पदों के साथ अनंत समय-क्षितिज स्टोकेस्टिक लीनियर क्वाड्रेटिक इष्टतम नियंत्रण समस्या है। विशेष रूप से:
स्थिति समीकरण: n-आयामी नियंत्रित मीन-फील्ड स्टोकेस्टिक अवकल समीकरण पर विचार करें
नया स्थिरता सिद्धांत स्थापित किया: मार्कोव स्विचिंग वातावरण में L²-घातीय स्थिरता, L²-समाकलनीयता और विसरण को परिभाषित किया, और उनकी समतुल्यता प्रमाणित की
बीजीय रिक्काटी समीकरण प्राप्त किए: पूर्ण विधि के माध्यम से मार्कोव श्रृंखला स्थिति पर निर्भर ARE प्रणाली प्राप्त की, और इसके स्थिरीकरण समाधान की अस्तित्व और अद्वितीयता प्रमाणित की
अनंत समय-क्षितिज BSDE सिद्धांत स्थापित किया: मार्कोव स्विचिंग पद वाली अनंत समय-क्षितिज BSDE प्रणाली की सुस्थापितता प्रमाणित की
समाधेयता का संपूर्ण विशेषीकरण: बंद-लूप समाधेयता और खुली-लूप समाधेयता का संपूर्ण विशेषीकरण दिया
मार्कोव माप सिद्धांत: मार्कोव श्रृंखला के मार्टिंगेल माप {Mᵢⱼ(·)|ι,j ∈ M} को प्रस्तुत किया, स्विचिंग पदों को संभालने के लिए उपकरण प्रदान किया
नई स्थिरीकरण शर्तें: प्रमाणित किया कि प्रणाली A,Ā,C,C̄;B,B̄,D,D̄ की L²-स्थिरीकरण क्षमता प्रत्येक निश्चित स्थिति ι ∈ M पर प्रणाली की स्थिरीकरण क्षमता के समतुल्य नहीं है
अनंत समय-क्षितिज BSDE नई विधि: चूंकि स्थिरता शर्तें कमजोर हैं, मौजूदा परिणामों को सीधे लागू नहीं किया जा सकता, नई प्रमाण तकनीकें विकसित की गईं
सकारात्मक निश्चितता मान्यता: वर्तमान में भार मैट्रिक्स की सकारात्मक निश्चितता की आवश्यकता है, लेखक स्वीकार करते हैं कि बाद के कार्य में इस मान्यता को शिथिल करेंगे
सीमित स्थिति स्थान: मार्कोव श्रृंखला सीमित स्थिति स्थान तक सीमित है
लीनियर संरचना: केवल लीनियर प्रणालियों पर विचार करता है
पेपर 41 संबंधित संदर्भों का हवाला देता है, जो LQ नियंत्रण सिद्धांत के मुख्य विकास पथ को कवर करते हैं, विशेषकर:
30 Sun & Yong का स्टोकेस्टिक LQ सिद्धांत मोनोग्राफ
21 Mei-Wei-Yong का सीमित समय-क्षितिज मीन-फील्ड LQ समस्या पर पूर्व कार्य
5 Chen-Li-Zhou का अनिश्चित LQ समस्या पर अग्रणी कार्य
समग्र मूल्यांकन: यह मार्कोव स्विचिंग मीन-फील्ड स्टोकेस्टिक नियंत्रण सिद्धांत में एक उच्च गुणवत्ता वाला सैद्धांतिक पेपर है जो महत्वपूर्ण योगदान देता है। पेपर तकनीकी प्रक्रिया कठोर है, सैद्धांतिक परिणाम संपूर्ण हैं, और इस क्षेत्र के आगे विकास के लिए एक ठोस आधार प्रदान करते हैं। हालांकि संख्यात्मक सत्यापन की कमी है, लेकिन इसका सैद्धांतिक मूल्य और अनुप्रयोग क्षमता इसे इस क्षेत्र में एक महत्वपूर्ण प्रगति बनाती है।