Minimizing Spectral Risk Measures Applied to Markov Decision Processes
Bäuerle, Glauner
We study the minimization of a spectral risk measure of the total discounted cost generated by a Markov Decision Process (MDP) over a finite or infinite planning horizon. The MDP is assumed to have Borel state and action spaces and the cost function may be unbounded above. The optimization problem is split into two minimization problems using an infimum representation for spectral risk measures. We show that the inner minimization problem can be solved as an ordinary MDP on an extended state space and give sufficient conditions under which an optimal policy exists. Regarding the infinite dimensional outer minimization problem, we prove the existence of a solution and derive an algorithm for its numerical approximation. Our results include the findings in Bäuerle and Ott (2011) in the special case that the risk measure is Expected Shortfall. As an application, we present a dynamic extension of the classical static optimal reinsurance problem, where an insurance company minimizes its cost of capital.
academic
Minimización de Medidas de Riesgo Espectral Aplicadas a Procesos de Decisión de Markov
Este artículo estudia la minimización de medidas de riesgo espectral del costo total descontado generado por procesos de decisión de Markov (PDM) bajo horizontes de planificación finitos o infinitos. El PDM asume espacios de estado y acción de Borel, con funciones de costo potencialmente no acotadas superiormente. Mediante la representación de ínfimo de medidas de riesgo espectral, se descompone el problema de optimización en dos problemas de minimización. Los autores demuestran que el problema de minimización interno puede resolverse como un PDM ordinario en un espacio de estado extendido, y proporcionan condiciones suficientes para la existencia de políticas óptimas. Para el problema de minimización externo infinito-dimensional, se prueba la existencia de soluciones y se derivan algoritmos de aproximación numérica. Cuando la medida de riesgo es el Déficit Esperado (Expected Shortfall), los resultados contienen los hallazgos de Bäuerle y Ott (2011). Como aplicación, se propone una extensión dinámica del problema clásico estático de reaseguro óptimo.
Los procesos de decisión de Markov tradicionales típicamente emplean criterios de esperanza para la optimización, modelando tomadores de decisiones neutrales al riesgo. Sin embargo, en aplicaciones prácticas, los tomadores de decisiones frecuentemente son sensibles al riesgo, requiriendo considerar incertidumbre y factores de riesgo.
Necesidad de Sensibilidad al Riesgo: El criterio de esperanza tradicional puede conducir a políticas óptimas de alto riesgo, incompatibles con las preferencias de riesgo de tomadores de decisiones reales
Vacío Teórico: La literatura existente se enfoca principalmente en medidas de riesgo recursivas o específicas (como el Déficit Esperado), careciendo de investigación sistemática sobre medidas de riesgo espectral general
Aplicaciones Prácticas: Sectores como seguros y finanzas requieren herramientas de gestión de riesgos más refinadas
Extensión del Marco Teórico: Ampliación de la optimización de medidas de riesgo espectral desde el Déficit Esperado a la clase general de medidas de riesgo espectral
Método de Extensión del Espacio de Estado: Presentación de técnicas de extensión del espacio de estado para manejar medidas de riesgo no lineales
Teoría de Existencia: Prueba de existencia de soluciones óptimas para problemas de optimización internos y externos
Algoritmos Numéricos: Desarrollo de algoritmos de aproximación finito-dimensional para el problema de optimización externo infinito-dimensional
Aplicaciones Prácticas: Proposición de un nuevo marco para problemas de reaseguro óptimo dinámico
En el espacio de estado extendido, la función de valor satisface:
JN(x,s,t)=g(s+tcN(x))Jn(x,s,t)=TnJn+1(x,s,t)=infa∈Dn(x)E[Jn+1(T^n(x,s,t,a,Zn+1))]
Manejo de Costos No Lineales: Transformación de optimización no lineal en PDM lineal mediante extensión del espacio de estado
Medidas de Riesgo Espectral General: Tratamiento unificado de todas las medidas de riesgo espectral, no limitado al Déficit Esperado
Debilitamiento de Condiciones de Supuesto: Solo se requiere que la función de costo esté acotada inferiormente, sin necesidad de acotación superior o supuestos de integrabilidad
Modelos de Monotonía: Reemplazo de supuestos de continuidad por semicontinuidad en espacios de estado de línea real
Este artículo se basa principalmente en las siguientes referencias importantes:
Bäuerle, N. and Ott, J. (2011). Markov decision processes with Average-Value-at-Risk criteria
Rockafellar, R. T. and Uryasev, S. (2000). Optimization of Conditional Value-at-Risk
Pichler, A. (2015). Premiums and reserves, adjusted by distortions
McNeil, A. J., Frey, R., and Embrechts, P. (2015). Quantitative Risk Management
Evaluación General: Este es un artículo de alta calidad que realiza contribuciones importantes en el campo de procesos de decisión de Markov sensibles al riesgo. El artículo es teóricamente riguroso, metodológicamente innovador, y proporciona herramientas valiosas para problemas prácticos de gestión de riesgos. Aunque presenta algunas deficiencias en aspectos de experimentación numérica, su valor teórico y contribución metodológica lo convierten en literatura importante en este campo.