2025-11-21T18:34:22.859424

Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching

Mei, Wei, Yong
This paper is concerned with stochastic linear quadratic (LQ, for short) optimal control problems in an infinite horizon with conditional mean-field term in a switching regime environment. The orthogonal decomposition introduced in [21] has been adopted. Desired algebraic Riccati equations (AREs, for short) and a system of backward stochastic differential equations (BSDEs, for short) in infinite time horizon with the coefficients depending on the Markov chain have been derived. The determination of closed-loop optimal strategy follows from the solvability of ARE and BSDE. Moreover, the solvability of BSDEs leads to a characterization of open-loop solvability of the optimal control problem.
academic

মার্কভ সুইচিং সহ অসীম-দিগন্তে মিন-ফিল্ড স্টোকাস্টিক ডিফারেনশিয়াল সমীকরণের জন্য লিনিয়ার-কোয়াড্রাটিক সর্বোত্তম নিয়ন্ত্রণ

মৌলিক তথ্য

  • পেপার আইডি: 2501.00981
  • শিরোনাম: Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching
  • লেখক: Hongwei Mei (টেক্সাস টেক বিশ্ববিদ্যালয়), Qingmeng Wei (উত্তর-পূর্ব সাধারণ বিশ্ববিদ্যালয়), Jiongmin Yong (কেন্দ্রীয় ফ্লোরিডা বিশ্ববিদ্যালয়)
  • শ্রেণীবিভাগ: math.OC (অপ্টিমাইজেশন এবং নিয়ন্ত্রণ)
  • প্রকাশনার সময়: ২০২৫ সালের ৩ জানুয়ারি
  • পেপার লিঙ্ক: https://arxiv.org/abs/2501.00981

সারসংক্ষেপ

এই পেপারটি মার্কভ সুইচিং পরিবেশে শর্তসাপেক্ষ মিন-ফিল্ড পদ সহ অসীম সময়কাল স্টোকাস্টিক লিনিয়ার কোয়াড্রাটিক (LQ) সর্বোত্তম নিয়ন্ত্রণ সমস্যা অধ্যয়ন করে। পেপারটি সাহিত্য 21-এ প্রবর্তিত অর্থোগোনাল বিয়োজন পদ্ধতি ব্যবহার করে, প্রত্যাশিত বীজগণিত রিক্যাটি সমীকরণ (ARE) এবং অসীম সময়কালে মার্কভ শৃঙ্খলের উপর নির্ভরশীল সহগ সহ একটি পশ্চাদমুখী স্টোকাস্টিক ডিফারেনশিয়াল সমীকরণ (BSDE) সিস্টেম প্রাপ্ত করে। বন্ধ-লুপ সর্বোত্তম কৌশলের নির্ধারণ ARE এবং BSDE এর সমাধানযোগ্যতার উপর নির্ভর করে। অধিকন্তু, BSDE এর সমাধানযোগ্যতা সর্বোত্তম নিয়ন্ত্রণ সমস্যার খোলা-লুপ সমাধানযোগ্যতার জন্য একটি বৈশিষ্ট্য প্রদান করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

এই পেপারে অধ্যয়নকৃত মূল সমস্যা হল মার্কভ সুইচিং পরিবেশে মিন-ফিল্ড পদ সহ অসীম সময়কাল স্টোকাস্টিক লিনিয়ার কোয়াড্রাটিক সর্বোত্তম নিয়ন্ত্রণ সমস্যা। নির্দিষ্টভাবে:

  1. অবস্থা সমীকরণ: n-মাত্রিক নিয়ন্ত্রিত মিন-ফিল্ড স্টোকাস্টিক ডিফারেনশিয়াল সমীকরণ বিবেচনা করুন
    dX(t) = [A(α(t))X(t) + Ā(α(t))E^α_t[X(t)] + B(α(t))u(t) + B̄(α(t))E^α_t[u(t)] + b(t)]dt
           + [C(α(t))X(t) + C̄(α(t))E^α_t[X(t)] + D(α(t))u(t) + D̄(α(t))E^α_t[u(t)] + σ(t)]dW(t)
    
  2. উদ্দেশ্য ফাংশন:
    J_∞(s,ι,ξ;u(·)) = E∫_s^∞ f(t,α(t),X(t),E^α_t[X(t)],u(t),E^α_t[u(t)])dt
    

গবেষণার গুরুত্ব

  1. তাত্ত্বিক তাৎপর্য: ক্লাসিক্যাল LQ নিয়ন্ত্রণ তত্ত্বকে মিন-ফিল্ড এবং মার্কভ সুইচিং এর যৌগিক ক্ষেত্রে প্রসারিত করে
  2. ব্যবহারিক প্রয়োগ: আর্থিক, প্রকৌশল এবং সামাজিক বিজ্ঞানে ব্যাপক প্রয়োগ, যেমন পোর্টফোলিও অপ্টিমাইজেশন, নেটওয়ার্ক নিয়ন্ত্রণ ইত্যাদি
  3. প্রযুক্তিগত চ্যালেঞ্জ: অসীম সময়কাল, মিন-ফিল্ড পদ এবং মার্কভ সুইচিং এর সমন্বয় উল্লেখযোগ্য প্রযুক্তিগত অসুবিধা নিয়ে আসে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

  1. সীমিত সময়কাল সীমাবদ্ধতা: বেশিরভাগ বিদ্যমান কাজ সীমিত সময়কাল ক্ষেত্রে সীমাবদ্ধ
  2. মার্কভ সুইচিং অনুপস্থিত: মিন-ফিল্ড পদ এবং মার্কভ সুইচিং উভয়ই পরিচালনা করে এমন কাজ বিরল
  3. স্থিতিশীলতা শর্ত: বিদ্যমান স্থিতিশীলতা শর্তগুলি প্রায়শই অত্যন্ত কঠোর, মার্কভ সুইচিং ক্ষেত্রে প্রযোজ্য নয়

মূল অবদান

  1. নতুন স্থিতিশীলতা তত্ত্ব প্রতিষ্ঠা: মার্কভ সুইচিং পরিবেশে L²-সূচকীয় স্থিতিশীলতা, L²-সমন্বয়যোগ্যতা এবং বিচ্ছুরণযোগ্যতা সংজ্ঞায়িত করে এবং তাদের সমতুল্যতা প্রমাণ করে
  2. বীজগণিত রিক্যাটি সমীকরণ প্রাপ্ত: সম্পূর্ণ বর্গ পদ্ধতির মাধ্যমে মার্কভ শৃঙ্খল অবস্থার উপর নির্ভরশীল ARE সিস্টেম প্রাপ্ত করে এবং এর স্থিতিশীলকারী সমাধানের অস্তিত্ব এবং অনন্যতা প্রমাণ করে
  3. অসীম সময়কাল BSDE তত্ত্ব প্রতিষ্ঠা: মার্কভ সুইচিং পদ সহ অসীম সময়কাল BSDE সিস্টেমের সুসংজ্ঞাত প্রমাণ করে
  4. সম্পূর্ণ সমাধানযোগ্যতা বৈশিষ্ট্য: বন্ধ-লুপ সমাধানযোগ্যতা এবং খোলা-লুপ সমাধানযোগ্যতার সম্পূর্ণ বৈশিষ্ট্য প্রদান করে

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

প্রাথমিক শর্ত (s,ι,ξ) ∈ D দেওয়া, সর্বোত্তম নিয়ন্ত্রণ ū(·) ∈ U_ad[s,∞) খুঁজে বের করুন যা:

J_∞(s,ι,ξ;ū(·)) = inf_{u(·)∈U_ad[s,∞)} J_∞(s,ι,ξ;u(·))

মূল পদ্ধতি আর্কিটেকচার

1. অর্থোগোনাল বিয়োজন কৌশল

সাহিত্য 21 এর অর্থোগোনাল বিয়োজন পদ্ধতি ব্যবহার করে, মূল সমস্যাটি দুটি অর্থোগোনাল সাব-স্পেসে বিয়োজিত করুন:

  • প্রজেকশন অপারেটর: Π₂v(·) = E^α_tv(t), Π₁ = I - Π₂
  • বিয়োজিত অবস্থা সমীকরণ:
    dX₁(t) = {A₁(α(t))X₁(t) + B₁(α(t))u₁(t) + b₁(t)}dt + {...}dW(t)
    dX₂(t) = {A₂(α(t))X₂(t) + B₂(α(t))u₂(t) + b₂(t)}dt
    

2. স্থিতিশীলতা বিশ্লেষণ

তিন ধরনের সমতুল্য স্থিতিশীলতা ধারণা সংজ্ঞায়িত করা হয়েছে:

সংজ্ঞা 3.1: সিস্টেম A,Ā,C,C̄ L²-সূচকীয় স্থিতিশীল বলা হয়, যদি ধ্রুবক K,δ > 0 বিদ্যমান থাকে যেমন:

E|X⁰(t;s,ξ,ι)|² ≤ Ke^{-δ(t-s)}E|ξ|², ∀t ≥ s

প্রস্তাব 3.3: নিম্নলিখিত শর্তগুলি সমতুল্য:

  • L²-সূচকীয় স্থিতিশীলতা
  • L²-সমন্বয়যোগ্যতা
  • বিচ্ছুরণযোগ্যতা
  • লিয়াপুনভ অসমতা সিস্টেম (3.7) এর ইতিবাচক নির্দিষ্ট সমাধান রয়েছে

3. বীজগণিত রিক্যাটি সমীকরণ

সম্পূর্ণ বর্গ পদ্ধতির মাধ্যমে ARE সিস্টেম প্রাপ্ত করা হয়েছে:

Λ[Pₖ(·)](ι) + Pₖ(ι)Aₖ(ι) + Aₖ(ι)ᵀPₖ(ι) + Cₖ(ι)ᵀP₁(ι)Cₖ(ι) + Qₖ(ι)
- [Pₖ(ι)Bₖ(ι) + Cₖ(ι)ᵀP₁(ι)Dₖ(ι) + Sₖ(ι)ᵀ][Rₖ(ι) + Dₖ(ι)ᵀP₁(ι)Dₖ(ι)]⁻¹
  ·[Bₖ(ι)ᵀPₖ(ι) + Dₖ(ι)ᵀP₁(ι)Cₖ(ι) + Sₖ(ι)] = 0

4. অসীম সময়কাল BSDE সিস্টেম

নিম্নলিখিত BSDE সিস্টেমের সুসংজ্ঞাত তত্ত্ব প্রতিষ্ঠা করা হয়েছে:

dY₁ = -[(A₁^{Θ₁})ᵀY₁ + (C₁^{Θ₁})ᵀΠ₁[Z] + P₁b₁ + (C₁^{Θ₁})ᵀP₁σ₁ + q₁ + Θ₁ᵀr₁]dt + ZdW + Z₁ᴹdM
dY₂ = -[(A₂^{Θ₂})ᵀY₂ + (C₂^{Θ₂})ᵀΠ₂[Z] + P₂b₂ + (C₂^{Θ₂})ᵀP₁σ₂ + q₂ + Θ₂ᵀr₂]dt + Z₂ᴹdM

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. মার্কভ পরিমাপ তত্ত্ব: মার্কভ শৃঙ্খলের মার্টিনগেল পরিমাপ {Mᵢⱼ(·)|ι,j ∈ M} প্রবর্তন করে, সুইচিং পদ পরিচালনার জন্য সরঞ্জাম প্রদান করে
  2. নতুন স্থিতিশীলকারী শর্ত: প্রমাণ করে যে সিস্টেম A,Ā,C,C̄;B,B̄,D,D̄ এর L²-স্থিতিশীলযোগ্যতা প্রতিটি নির্দিষ্ট অবস্থা ι ∈ M এ সিস্টেমের স্থিতিশীলযোগ্যতার সমতুল্য নয়
  3. অসীম সময়কাল BSDE নতুন পদ্ধতি: স্থিতিশীলতা শর্ত দুর্বল হওয়ায়, বিদ্যমান ফলাফল সরাসরি প্রয়োগ করা যায় না, নতুন প্রমাণ কৌশল বিকশিত করা হয়েছে

পরীক্ষামূলক সেটআপ

তাত্ত্বিক যাচাইকরণ

এই পেপারটি প্রধানত একটি তাত্ত্বিক কাজ, নিম্নলিখিত উপায়ে তাত্ত্বিক ফলাফল যাচাই করে:

  1. গঠনমূলক প্রমাণ: সীমিত সময়কাল সমস্যার সীমা প্রক্রিয়ার মাধ্যমে ARE এর সমাধান গঠন করে
  2. দ্বৈত যাচাইকরণ: দ্বৈত সম্পর্কের মাধ্যমে BSDE সমাধানের সঠিকতা যাচাই করে
  3. প্রতিউদাহরণ গঠন: উদাহরণ 3.4 এবং 3.8 এর মাধ্যমে তাত্ত্বিক ফলাফলের প্রয়োজনীয়তা প্রদর্শন করে

মূল অনুমান

  • (A1): সহগ সীমাবদ্ধতা
  • (A2): অ-সমজাতীয় পদের সমন্বয়যোগ্যতা
  • (A3): ওজন ম্যাট্রিক্সের ইতিবাচক নির্দিষ্টতা শর্ত
  • (A4): স্থিতিশীলযোগ্যতা শর্ত

প্রধান তাত্ত্বিক ফলাফল

উপপাদ্য 5.1 (প্রধান ফলাফল)

অনুমান (A1)-(A4) এর অধীনে:

  1. ARE সমাধানযোগ্যতা: অনন্য সমাধান P₁,P₂: M → Sⁿ₊₊ বিদ্যমান যেমন (Θ₁(·),Θ₂(·)) ∈ SA,Ā,C,C̄;B,B̄,D,D̄
  2. BSDE সুসংজ্ঞাত: BSDE সিস্টেম (5.2) অনন্য অভিযোজিত সমাধান বিদ্যমান
  3. সর্বোত্তম নিয়ন্ত্রণ: বন্ধ-লুপ সর্বোত্তম কৌশল:
    ūₖ = ΘₖXₖ - (Rₖ + Dₖᵀ P₁Dₖ)⁻¹(Bₖᵀ Yₖ + Dₖᵀ Πₖ[Z] + Dₖᵀ P₁σₖ + rₖ)
    

উপপাদ্য 5.2 (ARE সমাধানযোগ্যতা)

সীমিত সময়কাল সমস্যার সীমা প্রক্রিয়ার মাধ্যমে, ARE এর স্থিতিশীলকারী সমাধানের অস্তিত্ব এবং অনন্যতা প্রমাণ করা হয়েছে।

উপপাদ্য 5.3 (BSDE সুসংজ্ঞাত)

যেকোনো (φ₁(·),φ₂(·)) ∈ L²_{F^α}(0,∞;Rⁿ)⊥ × L²_{F^α}(0,∞;Rⁿ) এর জন্য, BSDE সিস্টেম অনন্য সমাধান বিদ্যমান।

উপপাদ্য 6.1 (খোলা-লুপ সমাধানযোগ্যতা বৈশিষ্ট্য)

সর্বোত্তম যুগল (X̄(·),ū(·)) FBSDE সিস্টেম এবং স্ট্যাটিক শর্তের সমাধানের সমতুল্য।

সম্পর্কিত কাজ

ঐতিহাসিক বিকাশ

  1. ক্লাসিক্যাল LQ তত্ত্ব: Bellman-Glicksberg-Gross (1960), Kalman (1960), Letov (1960)
  2. স্টোকাস্টিক LQ তত্ত্ব: Kushner (1960s), Wonham (1960s)
  3. অনির্দিষ্ট LQ তত্ত্ব: Chen-Li-Zhou (1998), Sun-Yong (2014-2018)
  4. মিন-ফিল্ড LQ তত্ত্ব: Yong (2013), Huang-Li-Yong (2015)

এই পেপারের অবদান সম্পর্কিত কাজের তুলনায়

  1. 21 এর তুলনায়: অসীম সময়কাল ক্ষেত্রে প্রসারিত করে
  2. ক্লাসিক্যাল তত্ত্বের তুলনায়: মিন-ফিল্ড পদ এবং মার্কভ সুইচিং প্রবর্তন করে
  3. সীমিত সময়কাল মিন-ফিল্ড তত্ত্বের তুলনায়: অসীম সময়কালের প্রযুক্তিগত চ্যালেঞ্জ পরিচালনা করে

সিদ্ধান্ত এবং আলোচনা

প্রধান সিদ্ধান্ত

  1. মার্কভ সুইচিং মিন-ফিল্ড LQ সমস্যার সম্পূর্ণ তাত্ত্বিক কাঠামো প্রতিষ্ঠা করা হয়েছে
  2. বন্ধ-লুপ এবং খোলা-লুপ সমাধানযোগ্যতার প্রয়োজনীয় এবং পর্যাপ্ত শর্ত প্রদান করা হয়েছে
  3. অসীম সময়কাল সুইচিং BSDE পরিচালনার জন্য নতুন পদ্ধতি বিকশিত করা হয়েছে

সীমাবদ্ধতা

  1. ইতিবাচক নির্দিষ্টতা অনুমান: বর্তমানে ওজন ম্যাট্রিক্স ইতিবাচক নির্দিষ্ট প্রয়োজন, লেখকরা স্বীকার করেন যে পরবর্তী কাজে এই অনুমান শিথিল করবেন
  2. সীমিত অবস্থা স্থান: মার্কভ শৃঙ্খল সীমিত অবস্থা স্থানে সীমাবদ্ধ
  3. লিনিয়ার কাঠামো: শুধুমাত্র লিনিয়ার সিস্টেম বিবেচনা করে

ভবিষ্যত দিকনির্দেশনা

  1. ইতিবাচক নির্দিষ্টতা শর্ত শিথিল করে, অনির্দিষ্ট ক্ষেত্র অধ্যয়ন করুন
  2. অসীম-মাত্রিক ক্ষেত্রে প্রসারিত করুন
  3. লাফানো বিস্তার প্রক্রিয়া বিবেচনা করুন

গভীর মূল্যায়ন

সুবিধা

  1. তাত্ত্বিক সম্পূর্ণতা: স্থিতিশীলতা থেকে সর্বোত্তম নিয়ন্ত্রণ পর্যন্ত সম্পূর্ণ তাত্ত্বিক শৃঙ্খল প্রদান করে
  2. প্রযুক্তিগত উদ্ভাবন: মার্কভ সুইচিং পরিচালনার জন্য নতুন কৌশল বিকশিত করে, বিশেষত অসীম সময়কাল BSDE তত্ত্ব
  3. কঠোরতা: প্রমাণ বিস্তারিত এবং কঠোর, প্রযুক্তিগত পরিচালনা নিয়মিত
  4. ব্যবহারিক মূল্য: ব্যবহারিক প্রয়োগের জন্য তাত্ত্বিক ভিত্তি প্রদান করে

অপূর্ণতা

  1. প্রয়োগ যাচাইকরণ অভাব: বিশুদ্ধ তাত্ত্বিক কাজ হিসাবে, সংখ্যাগত পরীক্ষা এবং ব্যবহারিক প্রয়োগ যাচাইকরণ অভাব
  2. অনুমান সীমাবদ্ধতা: ইতিবাচক নির্দিষ্টতা অনুমান প্রয়োগের পরিধি সীমিত করে
  3. গণনা জটিলতা: ARE এবং BSDE এর সংখ্যাগত সমাধান পদ্ধতি আলোচনা করা হয়নি

প্রভাব

  1. একাডেমিক অবদান: মার্কভ সুইচিং মিন-ফিল্ড LQ তত্ত্বের শূন্যতা পূরণ করে
  2. পরবর্তী গবেষণা: সম্পর্কিত ক্ষেত্রের জন্য গুরুত্বপূর্ণ তাত্ত্বিক সরঞ্জাম প্রদান করে
  3. প্রয়োগ সম্ভাবনা: আর্থিক গণিত, স্টোকাস্টিক নিয়ন্ত্রণ ইত্যাদি ক্ষেত্রে গুরুত্বপূর্ণ প্রয়োগ সম্ভাবনা রয়েছে

প্রযোজ্য দৃশ্য

  1. আর্থিক প্রকৌশল: পোর্টফোলিও অপ্টিমাইজেশন, ঝুঁকি ব্যবস্থাপনা
  2. প্রকৌশল নিয়ন্ত্রণ: নেটওয়ার্ক নিয়ন্ত্রণ সিস্টেম, বহু-এজেন্ট সিস্টেম
  3. সামাজিক বিজ্ঞান: জনসংখ্যা গতিশীলতা, অর্থনৈতিক মডেল

সংদর্ভ

পেপারটি 41টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, যা LQ নিয়ন্ত্রণ তত্ত্বের প্রধান বিকাশ পথ অন্তর্ভুক্ত করে, বিশেষত:

  • 30 Sun & Yong এর স্টোকাস্টিক LQ তত্ত্ব মনোগ্রাফ
  • 21 Mei-Wei-Yong এর সীমিত সময়কাল মিন-ফিল্ড LQ সমস্যার পূর্ববর্তী কাজ
  • 5 Chen-Li-Zhou এর অনির্দিষ্ট LQ সমস্যার যুগান্তকারী কাজ

সামগ্রিক মূল্যায়ন: এটি মার্কভ সুইচিং মিন-ফিল্ড স্টোকাস্টিক নিয়ন্ত্রণ তত্ত্বে গুরুত্বপূর্ণ অবদান রাখে এমন একটি উচ্চ-মানের তাত্ত্বিক পেপার। পেপারটি কঠোর প্রযুক্তিগত পরিচালনা, সম্পূর্ণ তাত্ত্বিক ফলাফল এবং এই ক্ষেত্রের আরও বিকাশের জন্য একটি দৃঢ় ভিত্তি স্থাপন করে। সংখ্যাগত যাচাইকরণের অভাব সত্ত্বেও, এর তাত্ত্বিক মূল্য এবং প্রয়োগ সম্ভাবনা এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ অগ্রগতি করে তোলে।