2025-11-21T18:34:22.859424

Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching

Mei, Wei, Yong
This paper is concerned with stochastic linear quadratic (LQ, for short) optimal control problems in an infinite horizon with conditional mean-field term in a switching regime environment. The orthogonal decomposition introduced in [21] has been adopted. Desired algebraic Riccati equations (AREs, for short) and a system of backward stochastic differential equations (BSDEs, for short) in infinite time horizon with the coefficients depending on the Markov chain have been derived. The determination of closed-loop optimal strategy follows from the solvability of ARE and BSDE. Moreover, the solvability of BSDEs leads to a characterization of open-loop solvability of the optimal control problem.
academic

Contrôle Optimal Linéaire-Quadratique pour les Équations Différentielles Stochastiques de Champ Moyen en Horizon Infini avec Commutation de Régime

Informations Fondamentales

  • Identifiant de l'article: 2501.00981
  • Titre: Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching
  • Auteurs: Hongwei Mei (Texas Tech University), Qingmeng Wei (Northeast Normal University), Jiongmin Yong (University of Central Florida)
  • Classification: math.OC (Optimisation et Contrôle)
  • Date de publication: 3 janvier 2025
  • Lien de l'article: https://arxiv.org/abs/2501.00981

Résumé

Cet article étudie le problème de contrôle optimal stochastique linéaire-quadratique (LQ) en horizon infini avec termes de champ moyen conditionnel dans un environnement de commutation markovienne. L'article adopte la méthode de décomposition orthogonale introduite dans la référence 21 et dérive les équations algébriques de Riccati (ARE) attendues et un système d'équations différentielles stochastiques rétrogrades (BSDE) en horizon infini dont les coefficients dépendent de la chaîne de Markov. La détermination de la stratégie optimale en boucle fermée dépend de la résolubilité de l'ARE et de la BSDE. De plus, la résolubilité des BSDE fournit également une caractérisation de la résolubilité en boucle ouverte du problème de contrôle optimal.

Contexte et Motivation de la Recherche

Définition du Problème

Le problème fondamental étudié dans cet article est le problème de contrôle optimal stochastique linéaire-quadratique en horizon infini avec termes de champ moyen dans un environnement de commutation markovienne. Plus précisément:

  1. Équation d'état: Considérer l'équation différentielle stochastique de champ moyen contrôlée n-dimensionnelle
    dX(t) = [A(α(t))X(t) + Ā(α(t))E^α_t[X(t)] + B(α(t))u(t) + B̄(α(t))E^α_t[u(t)] + b(t)]dt
           + [C(α(t))X(t) + C̄(α(t))E^α_t[X(t)] + D(α(t))u(t) + D̄(α(t))E^α_t[u(t)] + σ(t)]dW(t)
    
  2. Fonction objectif:
    J_∞(s,ι,ξ;u(·)) = E∫_s^∞ f(t,α(t),X(t),E^α_t[X(t)],u(t),E^α_t[u(t)])dt
    

Importance de la Recherche

  1. Signification théorique: Extension de la théorie classique du contrôle LQ au cas composite de champ moyen et commutation markovienne
  2. Applications pratiques: Applications largement répandues en finance, ingénierie et sciences sociales, telles que l'optimisation de portefeuille, le contrôle de réseaux, etc.
  3. Défis techniques: La combinaison de l'horizon infini, des termes de champ moyen et de la commutation markovienne présente des difficultés techniques significatives

Limitations des Méthodes Existantes

  1. Restriction à l'horizon fini: La plupart des travaux existants se limitent au cas d'horizon fini
  2. Absence de commutation markovienne: Peu de travaux traitent simultanément les termes de champ moyen et la commutation markovienne
  3. Conditions de stabilité: Les conditions de stabilité existantes sont souvent trop strictes et inadaptées au cas de commutation markovienne

Contributions Principales

  1. Établissement d'une nouvelle théorie de stabilité: Définition de la stabilité L²-exponentielle, de l'intégrabilité L² et de la dissipativité dans un environnement de commutation markovienne, avec preuve de leur équivalence
  2. Dérivation des équations algébriques de Riccati: Obtention par la méthode de complétion d'un système ARE dépendant de l'état de la chaîne de Markov, avec preuve de l'existence et de l'unicité de la solution stabilisante
  3. Établissement de la théorie des BSDE en horizon infini: Preuve du caractère bien posé du système BSDE en horizon infini contenant des termes de commutation markovienne
  4. Caractérisation complète de la résolubilité: Fourniture d'une caractérisation complète de la résolubilité en boucle fermée et en boucle ouverte

Explication Détaillée de la Méthode

Définition de la Tâche

Étant donné les conditions initiales (s,ι,ξ) ∈ D, trouver le contrôle optimal ū(·) ∈ U_ad[s,∞) tel que:

J_∞(s,ι,ξ;ū(·)) = inf_{u(·)∈U_ad[s,∞)} J_∞(s,ι,ξ;u(·))

Architecture de la Méthode Principale

1. Technique de Décomposition Orthogonale

Adoption de la méthode de décomposition orthogonale de la référence 21, décomposant le problème original en problèmes sur deux sous-espaces orthogonaux:

  • Opérateurs de projection: Π₂v(·) = E^α_tv(t), Π₁ = I - Π₂
  • Équations d'état après décomposition:
    dX₁(t) = {A₁(α(t))X₁(t) + B₁(α(t))u₁(t) + b₁(t)}dt + {...}dW(t)
    dX₂(t) = {A₂(α(t))X₂(t) + B₂(α(t))u₂(t) + b₂(t)}dt
    

2. Analyse de Stabilité

Définition de trois concepts de stabilité équivalents:

Définition 3.1: Le système A,Ā,C,C̄ est dit L²-exponentiellement stable s'il existe des constantes K,δ > 0 telles que:

E|X⁰(t;s,ξ,ι)|² ≤ Ke^{-δ(t-s)}E|ξ|², ∀t ≥ s

Proposition 3.3: Les conditions suivantes sont équivalentes:

  • Stabilité L²-exponentielle
  • Intégrabilité L²
  • Dissipativité
  • L'inégalité de Lyapunov système (3.7) admet une solution définie positive

3. Équation Algébrique de Riccati

Dérivation par la méthode de complétion du système ARE:

Λ[Pₖ(·)](ι) + Pₖ(ι)Aₖ(ι) + Aₖ(ι)ᵀPₖ(ι) + Cₖ(ι)ᵀP₁(ι)Cₖ(ι) + Qₖ(ι)
- [Pₖ(ι)Bₖ(ι) + Cₖ(ι)ᵀP₁(ι)Dₖ(ι) + Sₖ(ι)ᵀ][Rₖ(ι) + Dₖ(ι)ᵀP₁(ι)Dₖ(ι)]⁻¹
  ·[Bₖ(ι)ᵀPₖ(ι) + Dₖ(ι)ᵀP₁(ι)Cₖ(ι) + Sₖ(ι)] = 0

4. Système BSDE en Horizon Infini

Établissement de la théorie du caractère bien posé du système BSDE suivant:

dY₁ = -[(A₁^{Θ₁})ᵀY₁ + (C₁^{Θ₁})ᵀΠ₁[Z] + P₁b₁ + (C₁^{Θ₁})ᵀP₁σ₁ + q₁ + Θ₁ᵀr₁]dt + ZdW + Z₁ᴹdM
dY₂ = -[(A₂^{Θ₂})ᵀY₂ + (C₂^{Θ₂})ᵀΠ₂[Z] + P₂b₂ + (C₂^{Θ₂})ᵀP₁σ₂ + q₂ + Θ₂ᵀr₂]dt + Z₂ᴹdM

Points d'Innovation Technique

  1. Théorie des mesures markoviennes: Introduction des mesures de martingale de la chaîne de Markov {Mᵢⱼ(·)|ι,j ∈ M}, fournissant des outils pour traiter les termes de commutation
  2. Nouvelles conditions de stabilisation: Preuve que la L²-stabilisabilité du système A,Ā,C,C̄;B,B̄,D,D̄ n'est pas équivalente à la stabilisabilité du système sur chaque état fixe ι ∈ M
  3. Nouvelle méthode pour BSDE en horizon infini: Développement de nouvelles techniques de preuve, car les conditions de stabilité étant plus faibles, les résultats existants ne peuvent pas être directement appliqués

Configuration Expérimentale

Vérification Théorique

Cet article est principalement un travail théorique, vérifiant les résultats théoriques par:

  1. Preuves constructives: Construction de la solution ARE par le processus limite des problèmes en horizon fini
  2. Vérification duale: Vérification de la correction de la solution BSDE par les relations duales
  3. Construction de contre-exemples: Illustration de la nécessité des résultats théoriques par les Exemples 3.4 et 3.8

Hypothèses Clés

  • (A1): Bornitude des coefficients
  • (A2): Intégrabilité des termes non-homogènes
  • (A3): Conditions de positivité des matrices de poids
  • (A4): Conditions de stabilisabilité

Résultats Théoriques Principaux

Théorème 5.1 (Résultat Principal)

Sous les hypothèses (A1)-(A4):

  1. Résolubilité de l'ARE: Il existe une unique solution P₁,P₂: M → Sⁿ₊₊ telle que (Θ₁(·),Θ₂(·)) ∈ SA,Ā,C,C̄;B,B̄,D,D̄
  2. Caractère bien posé de la BSDE: Le système BSDE (5.2) admet une unique solution adaptée
  3. Contrôle optimal: La stratégie optimale en boucle fermée est:
    ūₖ = ΘₖXₖ - (Rₖ + Dₖᵀ P₁Dₖ)⁻¹(Bₖᵀ Yₖ + Dₖᵀ Πₖ[Z] + Dₖᵀ P₁σₖ + rₖ)
    

Théorème 5.2 (Résolubilité de l'ARE)

Par le processus limite des problèmes en horizon fini, preuve de l'existence et de l'unicité de la solution stabilisante de l'ARE.

Théorème 5.3 (Caractère bien posé de la BSDE)

Pour tout (φ₁(·),φ₂(·)) ∈ L²_{F^α}(0,∞;Rⁿ)⊥ × L²_{F^α}(0,∞;Rⁿ), le système BSDE admet une unique solution.

Théorème 6.1 (Caractérisation de la Résolubilité en Boucle Ouverte)

La paire optimale (X̄(·),ū(·)) est équivalente à la solution du système FBSDE plus les conditions statiques.

Travaux Connexes

Développement Historique

  1. Théorie LQ classique: Bellman-Glicksberg-Gross (1960), Kalman (1960), Letov (1960)
  2. Théorie LQ stochastique: Kushner (années 1960), Wonham (années 1960)
  3. Théorie LQ indéfinie: Chen-Li-Zhou (1998), Sun-Yong (2014-2018)
  4. Théorie LQ de champ moyen: Yong (2013), Huang-Li-Yong (2015)

Contribution de cet Article par Rapport aux Travaux Connexes

  1. Par rapport à 21: Extension au cas d'horizon infini
  2. Par rapport à la théorie classique: Introduction de termes de champ moyen et de commutation markovienne
  3. Par rapport à la théorie de champ moyen en horizon fini: Traitement des défis techniques de l'horizon infini

Conclusion et Discussion

Conclusions Principales

  1. Établissement d'un cadre théorique complet pour le problème LQ de champ moyen avec commutation markovienne
  2. Fourniture de conditions nécessaires et suffisantes pour la résolubilité en boucle fermée et en boucle ouverte
  3. Développement de nouvelles méthodes pour traiter les BSDE de commutation en horizon infini

Limitations

  1. Hypothèse de positivité: Actuellement, les matrices de poids doivent être définies positives; les auteurs reconnaissent qu'ils relâcheront cette hypothèse dans les travaux futurs
  2. Espace d'état fini: La chaîne de Markov est limitée à un espace d'état fini
  3. Structure linéaire: Seuls les systèmes linéaires sont considérés

Directions Futures

  1. Relâchement des conditions de positivité, étude du cas indéfini
  2. Extension au cas de dimension infinie
  3. Considération des processus de diffusion avec sauts

Évaluation Approfondie

Points Forts

  1. Complétude théorique: Fourniture d'une chaîne théorique complète allant de la stabilité au contrôle optimal
  2. Innovation technique: Développement de nouvelles techniques pour traiter la commutation markovienne, en particulier la théorie des BSDE en horizon infini
  3. Rigueur: Preuves détaillées et rigoureuses, traitement technique conforme aux normes
  4. Valeur pratique: Fourniture d'une base théorique pour les applications pratiques

Insuffisances

  1. Manque de vérification appliquée: En tant que travail purement théorique, absence d'expériences numériques et de vérification d'applications pratiques
  2. Limitations des hypothèses: L'hypothèse de positivité limite la portée des applications
  3. Complexité computationnelle: Absence de discussion sur les méthodes de résolution numérique de l'ARE et de la BSDE

Potentiel d'Impact

  1. Contribution académique: Comblage du vide dans la théorie LQ de champ moyen avec commutation markovienne
  2. Recherches ultérieures: Fourniture d'outils théoriques importants pour les domaines connexes
  3. Potentiel d'application: Perspectives d'application importantes en mathématiques financières, contrôle stochastique, etc.

Scénarios Applicables

  1. Ingénierie financière: Optimisation de portefeuille, gestion des risques
  2. Contrôle d'ingénierie: Systèmes de contrôle de réseaux, systèmes multi-agents
  3. Sciences sociales: Dynamiques de population, modèles économiques

Références

L'article cite 41 références connexes, couvrant le développement principal de la théorie du contrôle LQ, en particulier:

  • 30 Monographie de Sun & Yong sur la théorie LQ stochastique
  • 21 Travaux antérieurs de Mei-Wei-Yong sur le problème LQ de champ moyen en horizon fini
  • 5 Travaux fondateurs de Chen-Li-Zhou sur le problème LQ indéfini

Évaluation Globale: Ceci est un article théorique de haute qualité qui apporte des contributions importantes à la théorie du contrôle stochastique de champ moyen avec commutation markovienne. Le traitement technique est rigoureux, les résultats théoriques sont complets, et il jette une base solide pour le développement ultérieur du domaine. Bien qu'il manque de vérification numérique, sa valeur théorique et son potentiel d'application en font un progrès important dans le domaine.