Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location
RamÃrez-Ayerbe, Frejinger
In this paper, we consider contextual stochastic optimization problems under endogenous uncertainty, where decisions affect the underlying distributions. To implement such decisions in practice, it is crucial to ensure that their outcomes are interpretable and trustworthy. To this end, we compute relative counterfactual explanations that provide practitioners with concrete changes in the contextual covariates required for a solution to satisfy specific constraints. Whereas relative explanations have been introduced in prior literature, to the best of our knowledge this is the first work focusing on problems with binary decision variables and endogenous uncertainty. We propose a methodology that uses the Wasserstein distance as a regularization term, which leads to a reduction in computation times compared to its unregularized counterpart. We illustrate the method using a choice-based competitive facility location problem and present numerical experiments that demonstrate its ability to efficiently compute sparse and interpretable explanations.
academic
Explicaciones Relativas para Problemas Contextuales con Incertidumbre Endógena: Una Aplicación a la Localización Competitiva de Instalaciones
Este artículo estudia problemas de optimización estocástica contextual bajo incertidumbre endógena, donde las decisiones afectan la distribución subyacente. Para implementar tales decisiones en la práctica, es fundamental garantizar que sus resultados sean interpretables y confiables. Con este propósito, los autores calculan explicaciones contrafácticas relativas, proporcionando a los profesionales cambios concretos en las covariables contextuales necesarios para que la solución satisfaga restricciones específicas. Aunque las explicaciones relativas se han introducido en la literatura anterior, según el conocimiento de los autores, este es el primer trabajo que se enfoca en variables de decisión binarias e problemas con incertidumbre endógena. Los autores proponen un método que utiliza la distancia de Wasserstein como término de regularización, que reduce significativamente el tiempo computacional en comparación con el enfoque no regularizado correspondiente.
Con la creciente aplicación del aprendizaje automático y la optimización en problemas de toma de decisiones, particularmente en entornos de decisión de alto riesgo como atención médica, asignación de vivienda y servicios sociales, garantizar la interpretabilidad y confiabilidad de las soluciones se ha vuelto crítico. Instituciones como la Unión Europea, la Oficina de Política Científica y Tecnológica de la Casa Blanca y el gobierno canadiense reconocen la creciente necesidad de interpretabilidad.
Incertidumbre Endógena: La variable de decisión z afecta la distribución de probabilidad condicional P(y|z,x) de la variable aleatoria y
Requisito de Interpretabilidad: Necesidad de comprender cómo los cambios contextuales conducen a cambios en las decisiones y qué cambios son necesarios para que la solución cumpla restricciones específicas
Escenarios de Aplicación Práctica: Por ejemplo, en la planificación de infraestructura médica, los gobiernos locales pueden preguntar cuál es el cambio mínimo en los datos que resultaría en la apertura de un centro en su región
Ampliación del Alcance de Investigación: Primera aplicación de explicaciones contrafácticas relativas a problemas de optimización estocástica contextual bajo incertidumbre endógena
Generalización de Métodos Existentes: Permite un conjunto factible esperado D en lugar de una única solución objetivo, generalizando métodos existentes basados en soluciones proporcionadas por expertos
Manejo de Variables Binarias: Resuelve el problema de explicaciones relativas en el contexto de variables de decisión binarias
Regularización de Wasserstein: Utiliza un término de regularización que minimiza la distancia entre distribuciones inducidas por soluciones contrafácticas y factuales
Mejora de Eficiencia Computacional: El método de regularización propuesto reduce significativamente el tiempo computacional
Definición 1.1: Para un factor dado α ∈ (0,∞] y espacio deseado D, una explicación relativa del problema (1) es un nuevo contexto x tal que existe una solución factible en D cuya recompensa esperada cambia como máximo por un factor de α.
Ω(x⁰,x): Término de regularización utilizando la distancia 2-Wasserstein
Definición de Distancia de Wasserstein:
Para dos distribuciones de probabilidad discretas P⁰ y P, el cuadrado de la distancia 2-Wasserstein se define como:
Regularización de Distancia de Distribución: Utiliza la distancia de Wasserstein para garantizar que la distribución contrafáctica sea cercana a la distribución factual
Cota Inferior Agnóstica del Modelo: Proporciona un método agnóstico del modelo para calcular cotas inferiores
Inducción de Sparsidad: Logra soluciones dispersas mediante la combinación de regularización de norma ℓ₁ y Wasserstein
Efecto de Regularización: La regularización de Wasserstein moderada no solo mejora el tiempo de ejecución y la sparsidad, sino que también conduce a una transición más suave de la distribución de demanda
Complejidad Computacional: El problema contrafáctico hereda la complejidad del problema factual subyacente, y las instancias con presupuesto r mayor frecuentemente alcanzan el límite de tiempo
Mecanismo de Sparsidad: La sparsidad de cambios no solo se logra minimizando la norma ℓ₁, sino que la regularización también alienta al modelo a concentrar cambios en menos instalaciones en lugar de dispersar pequeñas modificaciones
Restricción a Variables Continuas: La formulación actual requiere que las covariables contextuales sean continuas, siendo la extensión a covariables categóricas aún un desafío
No Unicidad de Soluciones: Las soluciones típicamente no son únicas, lo que puede conducir a desacuerdos entre partes interesadas y posibilidad de manipular explicaciones
Consideraciones Éticas: Múltiples explicaciones contrafácticas válidas pueden plantear problemas éticos, como ocultar características contextuales sensibles
Contribución Teórica: Primera aplicación sistemática de explicaciones contrafácticas a problemas con incertidumbre endógena, con marco teórico completo
Innovación Metodológica: La introducción de regularización de Wasserstein tiene base teórica y efecto práctico, mejorando significativamente el rendimiento computacional
Experimentación Completa: Experimentos exhaustivos desde ejemplos pequeños hasta instancias a gran escala, con métricas de evaluación multidimensionales
Valor Práctico: La aplicación CFLP elegida tiene importancia práctica significativa con resultados operacionales
El artículo cita 63 referencias relevantes que abarcan explicaciones contrafácticas, teoría de optimización, problemas de localización de instalaciones y otros campos, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo académico de alta calidad que logra un buen equilibrio entre innovación teórica y aplicación práctica. La introducción de regularización de Wasserstein es un punto destacado, con base teórica sólida y ventajas computacionales prácticas. Aunque existen algunas limitaciones, el artículo realiza contribuciones importantes a la investigación de interpretabilidad en problemas de optimización contextual.