Minimizing Spectral Risk Measures Applied to Markov Decision Processes
Bäuerle, Glauner
We study the minimization of a spectral risk measure of the total discounted cost generated by a Markov Decision Process (MDP) over a finite or infinite planning horizon. The MDP is assumed to have Borel state and action spaces and the cost function may be unbounded above. The optimization problem is split into two minimization problems using an infimum representation for spectral risk measures. We show that the inner minimization problem can be solved as an ordinary MDP on an extended state space and give sufficient conditions under which an optimal policy exists. Regarding the infinite dimensional outer minimization problem, we prove the existence of a solution and derive an algorithm for its numerical approximation. Our results include the findings in Bäuerle and Ott (2011) in the special case that the risk measure is Expected Shortfall. As an application, we present a dynamic extension of the classical static optimal reinsurance problem, where an insurance company minimizes its cost of capital.
academic
Minimiser les Mesures de Risque Spectral Appliquées aux Processus de Décision Markoviens
Cet article étudie la minimisation des mesures de risque spectral du coût total actualisé généré par les processus de décision markoviens (PDM) sur des horizons de planification finis ou infinis. Le PDM suppose des espaces d'état et d'action de Borel, avec une fonction de coût potentiellement non bornée supérieurement. En utilisant la représentation infimale des mesures de risque spectral, le problème d'optimisation est décomposé en deux problèmes de minimisation. Les auteurs démontrent que le problème de minimisation interne peut être résolu comme un PDM ordinaire sur un espace d'état étendu, et fournissent des conditions suffisantes pour l'existence de stratégies optimales. Pour le problème de minimisation externe de dimension infinie, l'existence de solutions est prouvée et des algorithmes d'approximation numérique sont dérivés. Lorsque la mesure de risque est le déficit attendu (Expected Shortfall), les résultats englobent les découvertes de Bäuerle et Ott (2011). En application, une extension dynamique du problème classique de réassurance optimale statique est proposée.
Les processus de décision markoviens traditionnels utilisent généralement le critère d'espérance pour l'optimisation, ce qui modélise un décideur neutre au risque. Cependant, dans les applications pratiques, les décideurs sont souvent sensibles au risque et doivent tenir compte de l'incertitude et des facteurs de risque.
Besoin de sensibilité au risque: Le critère d'espérance traditionnel peut conduire à des stratégies optimales à haut risque, incompatibles avec les préférences de risque des décideurs réels
Lacune théorique: La littérature existante se concentre principalement sur les mesures de risque récursives ou spécifiques (comme le déficit attendu), manquant d'une étude systématique des mesures de risque spectral générales
Applications pratiques: Les domaines de l'assurance et de la finance nécessitent des outils de gestion des risques plus sophistiqués
Extension du cadre théorique: Extension de l'optimisation des mesures de risque spectral du déficit attendu à la classe générale des mesures de risque spectral
Méthode d'extension d'espace d'état: Proposition d'une technique d'extension d'espace d'état pour traiter les mesures de risque non linéaires
Théorie d'existence: Preuve de l'existence de solutions optimales pour les problèmes d'optimisation interne et externe
Algorithme numérique: Développement d'algorithmes d'approximation de dimension finie pour le problème d'optimisation externe de dimension infinie
Application pratique: Proposition d'un nouveau cadre pour le problème dynamique de réassurance optimale
Sur l'espace d'état étendu, la fonction de valeur satisfait:
JN(x,s,t)=g(s+tcN(x))Jn(x,s,t)=TnJn+1(x,s,t)=infa∈Dn(x)E[Jn+1(T^n(x,s,t,a,Zn+1))]
Traitement des coûts non linéaires: Transformation de l'optimisation non linéaire en PDM linéaire via extension d'espace d'état
Mesures de risque spectral générales: Traitement unifié de toutes les mesures de risque spectral, non limité au déficit attendu
Affaiblissement des conditions d'hypothèse: Seule la borne inférieure de la fonction de coût est requise, sans nécessité de borne supérieure ou d'hypothèse d'intégrabilité
Modèles de monotonie: Remplacement de l'hypothèse de continuité par la semi-continuité sur l'espace d'état réel
Cet article s'appuie principalement sur les références importantes suivantes:
Bäuerle, N. and Ott, J. (2011). Markov decision processes with Average-Value-at-Risk criteria
Rockafellar, R. T. and Uryasev, S. (2000). Optimization of Conditional Value-at-Risk
Pichler, A. (2015). Premiums and reserves, adjusted by distortions
McNeil, A. J., Frey, R., and Embrechts, P. (2015). Quantitative Risk Management
Évaluation Générale: Ceci est un article théorique de haute qualité apportant des contributions importantes au domaine des processus de décision markoviens sensibles au risque. L'article est théoriquement rigoureux, méthodologiquement innovant et fournit des outils précieux pour les problèmes pratiques de gestion des risques. Bien que présentant certaines insuffisances en matière d'expériences numériques, sa valeur théorique et ses contributions méthodologiques en font une littérature importante dans ce domaine.