2025-11-21T18:34:22.859424

Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching

Mei, Wei, Yong

This paper is concerned with stochastic linear quadratic (LQ, for short) optimal control problems in an infinite horizon with conditional mean-field term in a switching regime environment. The orthogonal decomposition introduced in [21] has been adopted. Desired algebraic Riccati equations (AREs, for short) and a system of backward stochastic differential equations (BSDEs, for short) in infinite time horizon with the coefficients depending on the Markov chain have been derived. The determination of closed-loop optimal strategy follows from the solvability of ARE and BSDE. Moreover, the solvability of BSDEs leads to a characterization of open-loop solvability of the optimal control problem.

academic

Линейно-квадратичное оптимальное управление для среднепольевых стохастических дифференциальных уравнений в бесконечном горизонте с переключением режимов

Основная информация

ID статьи: 2501.00981
Название: Linear-Quadratic Optimal Control for Mean-Field Stochastic Differential Equations in Infinite-Horizon with Regime Switching
Авторы: Hongwei Mei (Texas Tech University), Qingmeng Wei (Northeast Normal University), Jiongmin Yong (University of Central Florida)
Классификация: math.OC (Оптимизация и управление)
Дата публикации: 3 января 2025 г.
Ссылка на статью: https://arxiv.org/abs/2501.00981

Аннотация

В данной работе исследуется задача оптимального управления линейно-квадратичного типа (LQ) в бесконечном временном горизонте с условными среднепольевыми членами в марковской переключаемой среде. Авторы применили метод ортогонального разложения, введённый в работе 21, и вывели ожидаемые алгебраические уравнения Риккати (ARE) и систему обратных стохастических дифференциальных уравнений (BSDE) с коэффициентами, зависящими от марковской цепи, в бесконечном временном горизонте. Определение замкнутой оптимальной стратегии зависит от разрешимости ARE и BSDE. Кроме того, разрешимость BSDE обеспечивает характеризацию разомкнутой разрешимости задачи оптимального управления.

Исследовательский контекст и мотивация

Определение проблемы

Основная проблема, исследуемая в данной работе, заключается в задаче оптимального управления линейно-квадратичного типа в бесконечном временном горизонте с среднепольевыми членами в марковской переключаемой среде. Конкретно:

Уравнение состояния: рассматривается n-мерное управляемое среднепольевое стохастическое дифференциальное уравнение
```
dX(t) = [A(α(t))X(t) + Ā(α(t))E^α_t[X(t)] + B(α(t))u(t) + B̄(α(t))E^α_t[u(t)] + b(t)]dt
       + [C(α(t))X(t) + C̄(α(t))E^α_t[X(t)] + D(α(t))u(t) + D̄(α(t))E^α_t[u(t)] + σ(t)]dW(t)
```

Целевая функция:

J_∞(s,ι,ξ;u(·)) = E∫_s^∞ f(t,α(t),X(t),E^α_t[X(t)],u(t),E^α_t[u(t)])dt

Значимость исследования

Теоретическое значение: расширение классической теории LQ-управления на комбинированный случай среднепольевых и марковских переключаемых систем
Практическое применение: широкое применение в финансах, инженерии и социальных науках, таких как оптимизация портфеля, управление сетями и т.д.
Технические вызовы: комбинация бесконечного временного горизонта, среднепольевых членов и марковского переключения создаёт значительные технические трудности

Ограничения существующих методов

Ограничение конечным горизонтом: большинство существующих работ ограничены случаем конечного временного горизонта
Отсутствие марковского переключения: мало работ одновременно рассматривают среднепольевые члены и марковское переключение
Условия стабильности: существующие условия стабильности часто слишком строги и неприменимы к марковским переключаемым системам

Основные вклады

Установлена новая теория стабильности: определены L²-экспоненциальная стабильность, L²-интегрируемость и диссипативность в марковской переключаемой среде, доказана их эквивалентность
Выведены алгебраические уравнения Риккати: методом дополнения получена система ARE, зависящая от состояния марковской цепи, доказана существование и единственность стабилизирующего решения
Установлена теория бесконечного горизонта BSDE: доказана корректность системы бесконечного горизонта BSDE с марковскими переключаемыми членами
Полная характеризация разрешимости: дана полная характеризация разомкнутой и замкнутой разрешимости

Детальное описание методов

Определение задачи

Для заданных начальных условий (s,ι,ξ) ∈ D найти оптимальное управление ū(·) ∈ U_ad[s,∞) такое, что:

J_∞(s,ι,ξ;ū(·)) = inf_{u(·)∈U_ad[s,∞)} J_∞(s,ι,ξ;u(·))

Архитектура основного метода

1. Техника ортогонального разложения

Применён метод ортогонального разложения из работы 21, разлагающий исходную задачу на две ортогональные подпространства:

Операторы проекции: Π₂v(·) = E^α_tv(t), Π₁ = I - Π₂

Разложенные уравнения состояния:

dX₁(t) = {A₁(α(t))X₁(t) + B₁(α(t))u₁(t) + b₁(t)}dt + {...}dW(t)
dX₂(t) = {A₂(α(t))X₂(t) + B₂(α(t))u₂(t) + b₂(t)}dt

2. Анализ стабильности

Определены три эквивалентных понятия стабильности:

Определение 3.1: Система A,Ā,C,C̄ называется L²-экспоненциально стабильной, если существуют константы K,δ > 0 такие, что:

E|X⁰(t;s,ξ,ι)|² ≤ Ke^{-δ(t-s)}E|ξ|², ∀t ≥ s

Предложение 3.3: Следующие условия эквивалентны:

L²-экспоненциальная стабильность
L²-интегрируемость
Диссипативность
Система неравенств Ляпунова (3.7) имеет положительно определённое решение

3. Алгебраические уравнения Риккати

Методом дополнения выведена система ARE:

Λ[Pₖ(·)](ι) + Pₖ(ι)Aₖ(ι) + Aₖ(ι)ᵀPₖ(ι) + Cₖ(ι)ᵀP₁(ι)Cₖ(ι) + Qₖ(ι)
- [Pₖ(ι)Bₖ(ι) + Cₖ(ι)ᵀP₁(ι)Dₖ(ι) + Sₖ(ι)ᵀ][Rₖ(ι) + Dₖ(ι)ᵀP₁(ι)Dₖ(ι)]⁻¹
  ·[Bₖ(ι)ᵀPₖ(ι) + Dₖ(ι)ᵀP₁(ι)Cₖ(ι) + Sₖ(ι)] = 0

4. Система BSDE бесконечного горизонта

Установлена теория корректности следующей системы BSDE:

dY₁ = -[(A₁^{Θ₁})ᵀY₁ + (C₁^{Θ₁})ᵀΠ₁[Z] + P₁b₁ + (C₁^{Θ₁})ᵀP₁σ₁ + q₁ + Θ₁ᵀr₁]dt + ZdW + Z₁ᴹdM
dY₂ = -[(A₂^{Θ₂})ᵀY₂ + (C₂^{Θ₂})ᵀΠ₂[Z] + P₂b₂ + (C₂^{Θ₂})ᵀP₁σ₂ + q₂ + Θ₂ᵀr₂]dt + Z₂ᴹdM

Технические инновации

Теория марковских мер: введены мартингальные меры марковской цепи {Mᵢⱼ(·)|ι,j ∈ M}, обеспечивающие инструменты для работы с переключаемыми членами
Новые условия стабилизируемости: доказано, что L²-стабилизируемость системы A,Ā,C,C̄;B,B̄,D,D̄ не эквивалентна стабилизируемости системы на каждом фиксированном состоянии ι ∈ M
Новый метод для BSDE бесконечного горизонта: в связи с более слабыми условиями стабильности разработаны новые методы доказательства

Экспериментальная установка

Теоретическая верификация

Данная работа является теоретической и верифицирует результаты следующим образом:

Конструктивные доказательства: построение решения ARE через предельный процесс задач конечного горизонта
Двойственная верификация: проверка корректности решения BSDE через двойственные соотношения
Построение контрпримеров: примеры 3.4 и 3.8 демонстрируют необходимость теоретических результатов

Ключевые предположения

(A1): Ограниченность коэффициентов
(A2): Интегрируемость неоднородных членов
(A3): Условия положительной определённости матриц весов
(A4): Условия стабилизируемости

Основные теоретические результаты

Теорема 5.1 (Основной результат)

При предположениях (A1)-(A4):

Разрешимость ARE: существует единственное решение P₁,P₂: M → Sⁿ₊₊ такое, что (Θ₁(·),Θ₂(·)) ∈ SA,Ā,C,C̄;B,B̄,D,D̄
Корректность BSDE: система BSDE (5.2) имеет единственное адаптированное решение
Оптимальное управление: замкнутая оптимальная стратегия имеет вид:
```
ūₖ = ΘₖXₖ - (Rₖ + Dₖᵀ P₁Dₖ)⁻¹(Bₖᵀ Yₖ + Dₖᵀ Πₖ[Z] + Dₖᵀ P₁σₖ + rₖ)
```

Теорема 5.2 (Разрешимость ARE)

Через предельный процесс задач конечного горизонта доказана существование и единственность стабилизирующего решения ARE.

Теорема 5.3 (Корректность BSDE)

Для любых (φ₁(·),φ₂(·)) ∈ L²_{F^α}(0,∞;Rⁿ)⊥ × L²_{F^α}(0,∞;Rⁿ) система BSDE имеет единственное решение.

Теорема 6.1 (Характеризация разомкнутой разрешимости)

Оптимальная пара (X̄(·),ū(·)) эквивалентна решению системы FBSDE с добавлением статического условия.

Связанные работы

Историческое развитие

Классическая теория LQ: Bellman-Glicksberg-Gross (1960), Kalman (1960), Letov (1960)
Стохастическая теория LQ: Kushner (1960s), Wonham (1960s)
Неопределённая теория LQ: Chen-Li-Zhou (1998), Sun-Yong (2014-2018)
Среднепольевая теория LQ: Yong (2013), Huang-Li-Yong (2015)

Вклад данной работы в сравнении со смежными работами

По сравнению с 21: расширение на случай бесконечного временного горизонта
По сравнению с классической теорией: введение среднепольевых членов и марковского переключения
По сравнению с конечногоризонтной среднепольевой теорией: решение технических вызовов бесконечного горизонта

Заключение и обсуждение

Основные выводы

Установлен полный теоретический каркас для марковских переключаемых среднепольевых LQ-задач
Даны необходимые и достаточные условия замкнутой и разомкнутой разрешимости
Разработаны новые методы для работы с переключаемыми BSDE бесконечного горизонта

Ограничения

Предположение положительной определённости: в настоящее время требуется положительная определённость матриц весов; авторы признают, что ослабят это предположение в последующих работах
Конечное пространство состояний: марковская цепь ограничена конечным пространством состояний
Линейная структура: рассматриваются только линейные системы

Направления будущих исследований

Ослабление условия положительной определённости, исследование неопределённого случая
Расширение на бесконечномерный случай
Рассмотрение процессов скачкообразной диффузии

Глубокая оценка

Преимущества

Полнота теории: предоставлена полная теоретическая цепь от стабильности к оптимальному управлению
Технические инновации: разработаны новые методы работы с марковским переключением, особенно теория BSDE бесконечного горизонта
Строгость: доказательства детальны и строги, техническая обработка надлежащая
Практическая ценность: обеспечивает теоретическую основу для практического применения

Недостатки

Отсутствие верификации приложений: как чисто теоретическая работа, не содержит численных экспериментов и практических приложений
Ограничения предположений: условие положительной определённости ограничивает область применения
Вычислительная сложность: не обсуждаются численные методы решения ARE и BSDE

Влияние

Академический вклад: заполняет пробел в теории марковских переключаемых среднепольевых LQ-задач
Последующие исследования: предоставляет важные теоретические инструменты для смежных областей
Потенциал приложений: имеет важное значение для приложений в финансовой математике, стохастическом управлении и других областях

Применимые сценарии

Финансовая инженерия: оптимизация портфеля, управление рисками
Инженерное управление: системы управления сетями, многоагентные системы
Социальные науки: динамика населения, экономические модели

Библиография

Статья цитирует 41 связанную работу, охватывающую основные направления развития теории LQ-управления, в частности:

30 Монография Sun & Yong по стохастической теории LQ
21 Предыдущая работа Mei-Wei-Yong по конечногоризонтной среднепольевой LQ-задаче
5 Основополагающая работа Chen-Li-Zhou по неопределённой LQ-задаче

Общая оценка: Это высококачественная теоретическая работа, вносящая важный вклад в теорию марковских переключаемых среднепольевых стохастических систем управления. Техническая обработка строга, теоретические результаты полны, что обеспечивает прочную основу для дальнейшего развития этой области. Несмотря на отсутствие численной верификации, её теоретическая ценность и потенциал приложений делают её важным прогрессом в данной области.