Minimizing Spectral Risk Measures Applied to Markov Decision Processes
Bäuerle, Glauner
We study the minimization of a spectral risk measure of the total discounted cost generated by a Markov Decision Process (MDP) over a finite or infinite planning horizon. The MDP is assumed to have Borel state and action spaces and the cost function may be unbounded above. The optimization problem is split into two minimization problems using an infimum representation for spectral risk measures. We show that the inner minimization problem can be solved as an ordinary MDP on an extended state space and give sufficient conditions under which an optimal policy exists. Regarding the infinite dimensional outer minimization problem, we prove the existence of a solution and derive an algorithm for its numerical approximation. Our results include the findings in Bäuerle and Ott (2011) in the special case that the risk measure is Expected Shortfall. As an application, we present a dynamic extension of the classical static optimal reinsurance problem, where an insurance company minimizes its cost of capital.
academic
Minimierung von spektralen Risikomaßen angewendet auf Markov-Entscheidungsprozesse
Diese Arbeit untersucht die Minimierung spektraler Risikomaße für die Gesamtdiskontierungskosten, die durch Markov-Entscheidungsprozesse (MDP) entstehen, unter endlichem oder unendlichem Planungshorizont. Der MDP wird mit Borel-Zustands- und Aktionsräumen angenommen, wobei die Kostenfunktion nach oben unbegrenzt sein kann. Durch die Verwendung der Infimum-Darstellung spektraler Risikomaße wird das Optimierungsproblem in zwei Minimierungsprobleme zerlegt. Die Autoren zeigen, dass das innere Minimierungsproblem als gewöhnlicher MDP auf einem erweiterten Zustandsraum gelöst werden kann, und geben hinreichende Bedingungen für die Existenz optimaler Strategien an. Für das unendlichdimensionale äußere Minimierungsproblem wird die Existenz von Lösungen nachgewiesen und ein numerischer Approximationsalgorithmus hergeleitet. Wenn das Risikomaß Expected Shortfall ist, enthalten die Ergebnisse die Erkenntnisse von Bäuerle und Ott (2011). Als Anwendung wird eine dynamische Erweiterung des klassischen statischen optimalen Rückversicherungsproblems vorgestellt.
Traditionelle Markov-Entscheidungsprozesse verwenden normalerweise das Erwartungskriterium zur Optimierung, was einen risikoneutralen Entscheidungsträger modelliert. In praktischen Anwendungen sind Entscheidungsträger jedoch häufig risikoavers und müssen Unsicherheit und Risikofaktoren berücksichtigen.
Risikoempfindlichkeitsbedarf: Das traditionelle Erwartungskriterium kann zu hochriskanten optimalen Strategien führen, die nicht den Risikovorlieben realer Entscheidungsträger entsprechen
Theoretische Lücke: Die vorhandene Literatur konzentriert sich hauptsächlich auf rekursive Risikomaße oder spezifische Risikomaße (wie Expected Shortfall) und fehlt eine systematische Untersuchung allgemeiner spektraler Risikomaße
Praktische Anwendungen: Versicherungs- und Finanzbereiche benötigen verfeinerte Risikomanagement-Instrumente
Theoretischer Rahmen-Erweiterung: Erweiterung der spektralen Risikomaß-Optimierung von Expected Shortfall auf die allgemeine Klasse spektraler Risikomaße
Zustandsraum-Erweiterungsmethode: Entwicklung einer Zustandsraum-Erweiterungstechnik zur Behandlung nichtlinearer Risikomaße
Existenztheorie: Nachweis der Existenz optimaler Lösungen für innere und äußere Optimierungsprobleme
Numerischer Algorithmus: Entwicklung eines endlichdimensionalen Approximationsalgorithmus für das äußere unendlichdimensionale Optimierungsproblem
Praktische Anwendung: Neuer Rahmen für das dynamische optimale Rückversicherungsproblem
Diese Arbeit bezieht sich hauptsächlich auf folgende wichtige Literatur:
Bäuerle, N. and Ott, J. (2011). Markov decision processes with Average-Value-at-Risk criteria
Rockafellar, R. T. and Uryasev, S. (2000). Optimization of Conditional Value-at-Risk
Pichler, A. (2015). Premiums and reserves, adjusted by distortions
McNeil, A. J., Frey, R., and Embrechts, P. (2015). Quantitative Risk Management
Gesamtbewertung: Dies ist ein hochqualitatives theoretisches Papier, das wichtige Beiträge zum Bereich risikoempfindlicher Markov-Entscheidungsprozesse leistet. Das Papier ist theoretisch streng, methodisch innovativ und bietet wertvolle Werkzeuge für praktische Risikomanagementprobleme. Obwohl es in numerischen Experimenten etwas zu wünschen übrig lässt, machen sein theoretischer Wert und seine methodologischen Beiträge es zu einer wichtigen Literatur in diesem Bereich.