2025-11-25T21:49:18.967326

On time-consistent equilibrium stopping under aggregation of diverse discount rates

Deng, Yu, Zhang
This paper studies a central planner's decision making on behalf of a group of members with diverse discount rates. In the context of optimal stopping, we work with an aggregation preference to incorporate all discount rates via an attitude function that reflects the aggregation rule chosen by the central planner. The problem formulation is also applicable to single agent's stopping problem with uncertain discount rate, where our aggregation preference coincides with the conventional smooth ambiguity preference. The resulting optimal stopping problem is time inconsistent, for which we develop an iterative approach using consistent planning and characterize all time-consistent mild equilibria as fixed points of an operator in the setting of one-dimensional diffusion processes. We provide some sufficient conditions on the underlying models and the attitude function such that the smallest mild equilibrium attains the optimal equilibrium. In addition, we show that the optimal equilibrium is a weak equilibrium. When the sufficient condition of the attitude function is violated, we illustrate by various examples that the characterization of the optimal equilibrium may differ significantly from some existing results for a single agent, which now sensitively depends on the attitude function and the diversity distribution of discount rates within the group.
academic

Sobre el equilibrio consistente en el tiempo en la parada óptima bajo agregación de tasas de descuento diversas

Información Básica

  • ID del Artículo: 2302.07470
  • Título: On time-consistent equilibrium stopping under aggregation of diverse discount rates
  • Autores: Shuoqing Deng (Hong Kong University of Science and Technology), Xiang Yu (Hong Kong Polytechnic University), Jiacheng Zhang (Chinese University of Hong Kong)
  • Clasificación: q-fin.MF (Finanzas Matemáticas), math.OC (Optimización y Control)
  • Fecha de Publicación: Febrero de 2023 (versión arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2302.07470

Resumen

Este artículo estudia el problema de un planificador central que toma decisiones en representación de miembros de un grupo con tasas de descuento heterogéneas. En el contexto de la parada óptima, se utiliza una preferencia agregada para integrar todas las tasas de descuento mediante una función de actitud que refleja la regla de agregación elegida por el planificador central. La formulación del problema también es aplicable a problemas de parada de un único agente con tasa de descuento incierta, donde la preferencia agregada coincide con la preferencia difusa suavizada tradicional. El problema de parada óptima resultante presenta inconsistencia temporal, para lo cual se desarrolla un método iterativo utilizando planificación consistente, y se caracterizan todos los equilibrios suaves consistentes en el tiempo como puntos fijos de un operador en el contexto de procesos de difusión unidimensionales. El artículo proporciona condiciones suficientes sobre el modelo subyacente y la función de actitud para que el equilibrio suave mínimo sea óptimo. Además, se demuestra que el equilibrio óptimo es un equilibrio débil. Cuando se violan las condiciones suficientes de la función de actitud, diversos ejemplos ilustran que la caracterización del equilibrio óptimo puede diferir significativamente de los resultados existentes para un único agente, dependiendo ahora sensiblemente de la función de actitud y de la distribución de la diversidad de tasas de descuento dentro del grupo.

Antecedentes de Investigación y Motivación

Contexto del Problema

  1. Realismo de la heterogeneidad en tasas de descuento: Estudios experimentales demuestran que los individuos exhiben tasas de descuento heterogéneas al evaluar ganancias y costos a largo plazo. Weitzman (2001) encuestó a numerosos economistas sobre tasas de descuento para proyectos a largo plazo (como propuestas de mitigación del cambio climático), encontrando una respuesta promedio de 3.96% con una desviación estándar de 2.94%, evidenciando un amplio desacuerdo sobre las tasas de descuento.
  2. Desafíos en la toma de decisiones colectivas: Cómo coordinar la toma de decisiones social o colectiva ante desacuerdos generalizados es un problema importante y desafiante en muchas aplicaciones financieras y económicas. Los individuos mantienen perspectivas divergentes sobre temas tan variados como tasas de crecimiento económico futuro, rentabilidad de nuevas tecnologías y riesgos del calentamiento global.
  3. Limitaciones de los enfoques existentes:
    • Los enfoques basados en eficiencia de Pareto son autoritarios, equivaliendo efectivamente a seleccionar las preferencias temporales de solo un miembro del grupo
    • Las reglas de agregación que respetan el consenso y las tasas de descuento divergentes típicamente resultan ser temporalmente inconsistentes

Motivación de la Investigación

Este artículo tiene como objetivo abordar el problema de la inconsistencia temporal en la toma de decisiones dinámica, en el contexto de la parada óptima, abrazando todas las tasas de descuento heterogéneas de los miembros del grupo.

Contribuciones Principales

  1. Propuesta de marco de preferencias agregadas: Se propone una preferencia agregada en problemas de parada óptima que respeta e integra las diferentes tasas de descuento de todos los miembros del grupo, permitiendo al planificador central elegir una función de actitud que refleje la ponderación de diferentes niveles de tasas de descuento.
  2. Desarrollo de método iterativo: Se desarrolla un método iterativo para el problema de parada óptima temporalmente inconsistente, caracterizando todas las estrategias de parada de equilibrio consistentes en el tiempo como puntos fijos de un operador cuidadosamente definido en el contexto de procesos de difusión unidimensionales.
  3. Establecimiento de condiciones de existencia del equilibrio óptimo: Se proporcionan condiciones suficientes sobre el modelo subyacente y la función de actitud para garantizar la existencia de un equilibrio óptimo único, cuya función de valor domina la función de valor bajo todos los demás equilibrios en el caso de rendimientos tipo Put.
  4. Revelación del impacto de la función de actitud: Se demuestran mediante ejemplos concretos cómo la función de actitud ϕ(x) y la distribución de la tasa de descuento aleatoria distorsionan significativamente la caracterización del equilibrio óptimo, encontrando que en ciertos casos el equilibrio óptimo podría no existir.

Explicación Detallada de Métodos

Definición de la Tarea

Se estudia el problema de parada óptima en tiempo infinito: supτT0φ(E[erτg(Xτx)])dFρ(r)\sup_{\tau \in \mathcal{T}} \int_0^{\infty} \varphi\left(E[e^{-r\tau}g(X_\tau^x)]\right) dF_\rho(r)

Donde:

  • (Xtx)t0(X_t^x)_{t \geq 0} es el proceso de estado subyacente con valor inicial X0x=xX_0^x = x
  • g(x)g(x) es la función de rendimiento
  • φ(x)\varphi(x) es la función de actitud
  • Fρ(r)F_\rho(r) es la función de distribución de la tasa de descuento ρ\rho

Arquitectura del Modelo

1. Diseño de Preferencias Agregadas

Se adopta una preferencia agregada similar a la preferencia difusa suavizada de Klibanoff et al. (2005, 2009): Δφ(Su(f)dπ)dμ\int_{\Delta} \varphi\left(\int_S u(f)d\pi\right) d\mu

Donde la función de actitud φ()\varphi(\cdot) caracteriza la regla de agregación para diferentes valores de utilidad esperada.

2. Marco de Consistencia Temporal

Debido a la naturaleza no lineal de la doble esperanza, el problema de parada óptima no posee consistencia temporal. Se adopta la planificación consistente propuesta por Strotz (1956): el agente elige la mejor acción presente hoy sujetando la obediencia futura como una restricción.

3. Operador de Mejora de Estrategia

Se define el operador de mejora de estrategia Θ()\Theta(\cdot): Θ(R):=SR(IRR)\Theta(R) := S_R \cup (I_R \cap R)

Donde:

  • SR:={xR:φ(g(x))>J(x,R)}S_R := \{x \in \mathbb{R} : \varphi(g(x)) > J(x,R)\} (región de parada)
  • IR:={xR:φ(g(x))=J(x,R)}I_R := \{x \in \mathbb{R} : \varphi(g(x)) = J(x,R)\} (región de indiferencia)
  • CR:={xR:φ(g(x))<J(x,R)}C_R := \{x \in \mathbb{R} : \varphi(g(x)) < J(x,R)\} (región de continuación)

Puntos de Innovación Técnica

  1. Tratamiento de agregación no lineal: A diferencia de la agregación lineal φ(x)=x\varphi(x) = x, este trabajo maneja funciones de actitud generales que no pueden simplificarse a una única esperanza, requiriendo el desarrollo de nuevos métodos iterativos.
  2. Caracterización de punto fijo: Se caracterizan los equilibrios consistentes en el tiempo como puntos fijos del operador, demostrando la convergencia de la iteración comenzando desde cualquier estrategia de parada inicial arbitraria.
  3. Identificación del equilibrio óptimo: Se proporcionan condiciones suficientes para identificar el equilibrio óptimo, particularmente en el caso de funciones de rendimiento tipo Put.

Resultados Teóricos

Teoremas Principales

Teorema 3.1 (Caracterización de Equilibrio)

El conjunto de equilibrios E\mathcal{E} puede caracterizarse como: E={limnΘn(R)=n=0Θn(R):RB(R)}\mathcal{E} = \left\{\lim_{n \to \infty} \Theta^n(R) = \bigcup_{n=0}^{\infty} \Theta^n(R) : R \in \mathcal{B}(\mathbb{R})\right\}

Teorema 4.8 (Existencia del Equilibrio Óptimo)

Asumiendo que se cumplen las condiciones C-(i) a C-(iii), existe a0a^* \geq 0 tal que la región de parada [0,a][0,a] es un equilibrio consistente en el tiempo si y solo si aaa \geq a^*. Además, el equilibrio [0,a][0,a^*] es el equilibrio óptimo.

Condiciones Suficientes

Condición C-(i): μ(x)0\mu(x) \geq 0 para todo x0x \geq 0

Condición C-(ii): Condiciones técnicas sobre el proceso de difusión subyacente, incluyendo:

  1. φ1(x)<0\varphi_1'(x) < 0 y lim supxμ(x)+1σ2(x)<\limsup_{x \to \infty} \frac{\mu(x)+1}{\sigma^2(x)} < \infty
  2. I1=I2=+I_1 = I_2 = +\infty

Condición C-(iii): La función de actitud φ(x)\varphi(x) es C1C^1 y satisface que φ(x)x\varphi'(x)x es una función creciente, con φ(x)\varphi(x) estrictamente creciente

Resultados Experimentales

Ejemplo de Movimiento Browniano Geométrico

Para dXt=μXtdt+σXtdWtdX_t = \mu X_t dt + \sigma X_t dW_t, el umbral de equilibrio óptimo es: a=0f(r)dFρ(r)1+0f(r)dFρ(r)Ka^* = \frac{\int_0^{\infty} f(r) dF_\rho(r)}{1 + \int_0^{\infty} f(r) dF_\rho(r)} K

Donde f(r)=μσ212+(μσ212)2+2rσ2f(r) = \frac{\mu}{\sigma^2} - \frac{1}{2} + \sqrt{\left(\frac{\mu}{\sigma^2} - \frac{1}{2}\right)^2 + \frac{2r}{\sigma^2}}

Ejemplo de Proceso de Bessel

Para el proceso de Bessel tridimensional Xt=(Wt1)2+(Wt2)2+(Wt3)2X_t = \sqrt{(W_t^1)^2 + (W_t^2)^2 + (W_t^3)^2}, el umbral de equilibrio óptimo satisface: a=02rdFρ(r)K2+4+(02rdFρ(r))2K2202rdFρ(r)a^* = \frac{\int_0^{\infty} \sqrt{2r} dF_\rho(r) K - 2 + \sqrt{4 + \left(\int_0^{\infty} \sqrt{2r} dF_\rho(r)\right)^2 K^2}}{2\int_0^{\infty} \sqrt{2r} dF_\rho(r)}

Impacto de Funciones de Actitud No Estándar

Cuando φ(x)=min(x,α)\varphi(x) = \min(x, \alpha), se encuentra que:

  1. Si α\alpha es suficientemente grande, el equilibrio óptimo sigue siendo el equilibrio mínimo
  2. Para ciertos valores pequeños de α\alpha, el equilibrio óptimo existe pero difiere del equilibrio mínimo
  3. Para ciertos valores de α\alpha, el equilibrio óptimo no existe

Trabajos Relacionados

Problemas de Parada Temporalmente Inconsistentes

  • Huang and Nguyen-Huu (2018) desarrollaron métodos iterativos para descuento no exponencial
  • Bayraktar et al. (2021, 2023) estudiaron diferentes conceptos de equilibrio consistente en el tiempo
  • Christensen and Lindensjö (2018, 2020) utilizaron el enfoque de ecuación HJB extendida

Agregación de Preferencias Heterogéneas

  • Ebert et al. (2020) estudiaron reglas de agregación lineal φ(x)=x\varphi(x) = x
  • Jackson and Yariv (2015), Millner and Heal (2018) demostraron la inconsistencia temporal de las reglas de agregación

Incertidumbre del Modelo

La preferencia agregada de este artículo coincide con la preferencia difusa suavizada de Klibanoff et al. (2005, 2009), siendo aplicable a problemas de control óptimo bajo incertidumbre del modelo.

Conclusiones y Discusión

Conclusiones Principales

  1. Se desarrolló exitosamente una teoría de equilibrio consistente en el tiempo para manejar la agregación de tasas de descuento heterogéneas
  2. Se proporcionaron condiciones suficientes para la existencia y caracterización del equilibrio óptimo
  3. Se reveló el impacto sensible de la función de actitud en el equilibrio óptimo

Limitaciones

  1. Los resultados teóricos se limitan principalmente a procesos de difusión unidimensionales
  2. La caracterización general del equilibrio óptimo sigue siendo un problema abierto
  3. En ciertos casos, el equilibrio óptimo podría no existir

Direcciones Futuras

  1. Extensión a procesos de difusión multidimensionales
  2. Desarrollo de métodos generales para la caracterización del equilibrio óptimo
  3. Investigación de otros tipos de funciones de rendimiento

Evaluación Profunda

Fortalezas

  1. Innovación teórica: Primer estudio sistemático del problema de parada óptima consistente en el tiempo bajo tasas de descuento heterogéneas
  2. Metodología completa: Desarrollo de un método iterativo completo y teoría de caracterización de equilibrios
  3. Relevancia práctica: La formulación del problema posee valor de aplicación práctica significativo
  4. Análisis profundo: Análisis detallado del impacto de la función de actitud mediante ejemplos concretos

Deficiencias

  1. Limitaciones técnicas: Los resultados principales se limitan a procesos de difusión unidimensionales, restringiendo el alcance de aplicación
  2. Complejidad de condiciones: Las condiciones suficientes son de naturaleza técnica, lo que podría dificultar su verificación práctica
  3. Caracterización de optimalidad: Falta de caracterización general del equilibrio óptimo cuando se violan las condiciones de la función de actitud

Impacto

  1. Contribución teórica: Proporciona nuevas perspectivas y herramientas para la teoría de parada óptima temporalmente inconsistente
  2. Valor aplicado: Proporciona fundamento teórico para problemas prácticos como decisiones de inversión a largo plazo del gobierno y presupuesto de capital
  3. Investigación posterior: Sienta las bases para investigaciones posteriores en campos relacionados

Escenarios de Aplicación

  1. Decisiones de inversión a largo plazo del gobierno en representación de grupos de diferentes edades
  2. Problemas de presupuesto de capital empresarial bajo tasas de descuento inciertas
  3. Gestión de riesgos e optimización de cartera de instituciones financieras
  4. Análisis de costo-beneficio de políticas a largo plazo como el cambio climático

Referencias

  • Huang, Y. and A. Nguyen-Huu (2018). Time-consistent stopping under decreasing impatience. Finance and Stochastics, 22(1): 69-95.
  • Klibanoff, P., M. Marinacci, and S. Mukerji (2005). A smooth model of decision making under ambiguity. Econometrica, 73(6): 1849-1892.
  • Weitzman, M. L. (2001). Gamma discounting. American Economic Review, 91(1): 260-271.
  • Ebert, S., W. Wei and X. Y. Zhou (2020). Weighted discounting–On group diversity, time inconsistency, and consequences for investment. Journal of Economic Theory, 189: 105089.