Minimizing Spectral Risk Measures Applied to Markov Decision Processes
Bäuerle, Glauner
We study the minimization of a spectral risk measure of the total discounted cost generated by a Markov Decision Process (MDP) over a finite or infinite planning horizon. The MDP is assumed to have Borel state and action spaces and the cost function may be unbounded above. The optimization problem is split into two minimization problems using an infimum representation for spectral risk measures. We show that the inner minimization problem can be solved as an ordinary MDP on an extended state space and give sufficient conditions under which an optimal policy exists. Regarding the infinite dimensional outer minimization problem, we prove the existence of a solution and derive an algorithm for its numerical approximation. Our results include the findings in Bäuerle and Ott (2011) in the special case that the risk measure is Expected Shortfall. As an application, we present a dynamic extension of the classical static optimal reinsurance problem, where an insurance company minimizes its cost of capital.
academic
Минимизация спектральных мер риска, применённых к марковским процессам принятия решений
В данной работе исследуется минимизация спектральных мер риска общего дисконтированного стоимости, порождаемой марковскими процессами принятия решений (MDP) с конечным или бесконечным горизонтом планирования. MDP предполагает наличие борелевских пространств состояний и действий, при этом функция стоимости может быть неограниченной сверху. Используя инфимальное представление спектральных мер риска, авторы разлагают задачу оптимизации на две подзадачи минимизации. Доказано, что внутреннюю задачу минимизации можно решить как обычный MDP на расширенном пространстве состояний, и приведены достаточные условия существования оптимальной политики. Для бесконечномерной внешней задачи минимизации доказано существование решения и выведены численные алгоритмы аппроксимации. Когда мера риска является условной стоимостью под риском (Expected Shortfall), результаты включают выводы Bäuerle и Ott (2011). В качестве приложения предложено динамическое расширение классической задачи оптимального перестрахования.
Традиционные марковские процессы принятия решений обычно используют критерий математического ожидания для оптимизации, что моделирует нейтральное к риску принятие решений. Однако в практических приложениях лица, принимающие решения, часто чувствительны к риску и должны учитывать неопределённость и факторы риска.
Потребность в учёте риска: Традиционный критерий математического ожидания может привести к оптимальным политикам с высоким риском, что не соответствует предпочтениям реальных лиц, принимающих решения
Теоретический пробел: Существующая литература в основном сосредоточена на рекурсивных мерах риска или конкретных мерах риска (таких как условная стоимость под риском), отсутствует систематическое исследование общих спектральных мер риска
Практические приложения: Страховой и финансовый секторы требуют более тонких инструментов управления рисками
На расширенном пространстве состояний функция стоимости удовлетворяет:
JN(x,s,t)=g(s+tcN(x))Jn(x,s,t)=TnJn+1(x,s,t)=infa∈Dn(x)E[Jn+1(T^n(x,s,t,a,Zn+1))]
Обработка нелинейной стоимости: Преобразование нелинейной оптимизации в линейный MDP через расширение пространства состояний
Общие спектральные меры риска: Единообразная обработка всех спектральных мер риска, а не только условной стоимости под риском
Ослабление условий предположений: Требуется только нижняя ограниченность функции стоимости, без необходимости в верхней границе или условиях интегрируемости
Монотонные модели: Использование полунепрерывности вместо непрерывности на вещественном пространстве состояний
Данная работа в основном опирается на следующую важную литературу:
Bäuerle, N. and Ott, J. (2011). Markov decision processes with Average-Value-at-Risk criteria
Rockafellar, R. T. and Uryasev, S. (2000). Optimization of Conditional Value-at-Risk
Pichler, A. (2015). Premiums and reserves, adjusted by distortions
McNeil, A. J., Frey, R., and Embrechts, P. (2015). Quantitative Risk Management
Общая оценка: Это высококачественная теоретическая работа, внёсшая значительный вклад в область чувствительных к риску марковских процессов принятия решений. Статья отличается теоретической строгостью, методологической инновативностью и предоставляет ценные инструменты для практического управления рисками. Несмотря на некоторые недостатки в численных экспериментах, её теоретическая ценность и методологический вклад делают её важным источником в данной области.