2025-11-13T21:28:11.123642

Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location

RamÃrez-Ayerbe, Frejinger

In this paper, we consider contextual stochastic optimization problems under endogenous uncertainty, where decisions affect the underlying distributions. To implement such decisions in practice, it is crucial to ensure that their outcomes are interpretable and trustworthy. To this end, we compute relative counterfactual explanations that provide practitioners with concrete changes in the contextual covariates required for a solution to satisfy specific constraints. Whereas relative explanations have been introduced in prior literature, to the best of our knowledge this is the first work focusing on problems with binary decision variables and endogenous uncertainty. We propose a methodology that uses the Wasserstein distance as a regularization term, which leads to a reduction in computation times compared to its unregularized counterpart. We illustrate the method using a choice-based competitive facility location problem and present numerical experiments that demonstrate its ability to efficiently compute sparse and interpretable explanations.

academic

Explicaciones Relativas para Problemas Contextuales con Incertidumbre Endógena: Una Aplicación a la Localización Competitiva de Instalaciones

Información Básica

ID del Artículo: 2506.19155
Título: Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location
Autores: Jasone Ramírez-Ayerbe, Emma Frejinger (CIRRELT y Departamento de Informática e Investigación Operativa, Université de Montréal)
Clasificación: math.OC (Optimización y Control Matemático)
Fecha de Publicación: 14 de octubre de 2025 (Preimpresión arXiv versión 3)
Enlace del Artículo: https://arxiv.org/abs/2506.19155v3

Resumen

Este artículo estudia problemas de optimización estocástica contextual bajo incertidumbre endógena, donde las decisiones afectan la distribución subyacente. Para implementar tales decisiones en la práctica, es fundamental garantizar que sus resultados sean interpretables y confiables. Con este propósito, los autores calculan explicaciones contrafácticas relativas, proporcionando a los profesionales cambios concretos en las covariables contextuales necesarios para que la solución satisfaga restricciones específicas. Aunque las explicaciones relativas se han introducido en la literatura anterior, según el conocimiento de los autores, este es el primer trabajo que se enfoca en variables de decisión binarias e problemas con incertidumbre endógena. Los autores proponen un método que utiliza la distancia de Wasserstein como término de regularización, que reduce significativamente el tiempo computacional en comparación con el enfoque no regularizado correspondiente.

Contexto e Motivación de la Investigación

Antecedentes del Problema

Con la creciente aplicación del aprendizaje automático y la optimización en problemas de toma de decisiones, particularmente en entornos de decisión de alto riesgo como atención médica, asignación de vivienda y servicios sociales, garantizar la interpretabilidad y confiabilidad de las soluciones se ha vuelto crítico. Instituciones como la Unión Europea, la Oficina de Política Científica y Tecnológica de la Casa Blanca y el gobierno canadiense reconocen la creciente necesidad de interpretabilidad.

Problema Central

Incertidumbre Endógena: La variable de decisión z afecta la distribución de probabilidad condicional P(y|z,x) de la variable aleatoria y
Requisito de Interpretabilidad: Necesidad de comprender cómo los cambios contextuales conducen a cambios en las decisiones y qué cambios son necesarios para que la solución cumpla restricciones específicas
Escenarios de Aplicación Práctica: Por ejemplo, en la planificación de infraestructura médica, los gobiernos locales pueden preguntar cuál es el cambio mínimo en los datos que resultaría en la apertura de un centro en su región

Limitaciones de Métodos Existentes

Las explicaciones contrafácticas existentes se enfocan principalmente en problemas de clasificación supervisada
Falta de investigación en problemas de optimización con variables de decisión binarias e incertidumbre endógena
Los métodos tradicionales tienen alta complejidad computacional y carecen de mecanismos de regularización efectivos

Contribuciones Principales

Ampliación del Alcance de Investigación: Primera aplicación de explicaciones contrafácticas relativas a problemas de optimización estocástica contextual bajo incertidumbre endógena
Generalización de Métodos Existentes: Permite un conjunto factible esperado D en lugar de una única solución objetivo, generalizando métodos existentes basados en soluciones proporcionadas por expertos
Manejo de Variables Binarias: Resuelve el problema de explicaciones relativas en el contexto de variables de decisión binarias
Regularización de Wasserstein: Utiliza un término de regularización que minimiza la distancia entre distribuciones inducidas por soluciones contrafácticas y factuales
Mejora de Eficiencia Computacional: El método de regularización propuesto reduce significativamente el tiempo computacional

Detalles de la Metodología

Definición de la Tarea

Dado un problema de optimización estocástica contextual:

z*(x⁰) ∈ argmax_{z∈Z} E_{P(y|z,x⁰)}[r(y,z)]

Donde:

z ∈ Z: Vector de variables de decisión
x⁰ ∈ X ⊆ ℝ^{dx}: Covariables contextuales continuas (características)
y: Vector de variables aleatorias que capturan la incertidumbre endógena
P(y|z,x⁰): Distribución de probabilidad condicional

Definición de Explicación Contrafáctica Relativa

Definición 1.1: Para un factor dado α ∈ (0,∞] y espacio deseado D, una explicación relativa del problema (1) es un nuevo contexto x tal que existe una solución factible en D cuya recompensa esperada cambia como máximo por un factor de α.

Problema de Optimización Central

El cálculo de la explicación relativa se puede formular como el siguiente problema de optimización no convexa:

L*_free := min_{x∈X,z∈Z} L(x,x⁰)
s.t. E_{P(y|z,x)}[r(y,z)] ≥ α · E_{P(y|z⁰,x⁰)}[r(y,z⁰)]
     z ∈ D

Función de Costo y Regularización de Wasserstein

La función de costo adopta la siguiente forma:

L(x⁰,x) = J(x⁰,x) + λΩ(x⁰,x)

Donde:

J(x⁰,x): Componente de disimilaridad
Ω(x⁰,x): Término de regularización utilizando la distancia 2-Wasserstein

Definición de Distancia de Wasserstein: Para dos distribuciones de probabilidad discretas P⁰ y P, el cuadrado de la distancia 2-Wasserstein se define como:

W²₂(P⁰,P) := min_{π∈Π} ∑_{c∈C} ∑_{c'∈C} π_{cc'} δ(c,c')²

Sujeto a las restricciones:

∑{c'∈C} π{cc'} = P⁰(c) ∀c ∈ C
∑{c∈C} π{cc'} = P(c') ∀c' ∈ C
π_{cc'} ≥ 0

Puntos de Innovación Técnica

Regularización de Distancia de Distribución: Utiliza la distancia de Wasserstein para garantizar que la distribución contrafáctica sea cercana a la distribución factual
Cota Inferior Agnóstica del Modelo: Proporciona un método agnóstico del modelo para calcular cotas inferiores
Inducción de Sparsidad: Logra soluciones dispersas mediante la combinación de regularización de norma ℓ₁ y Wasserstein

Configuración Experimental

Escenario de Aplicación: Problema de Localización de Instalaciones Competitivas Basado en Elección (CFLP)

Modelo: Modelo Logit Multinomial (MNL)
Decisión: Seleccionar un subconjunto de ubicaciones candidatas bajo restricción de presupuesto para maximizar la captura de demanda esperada
Función de Utilidad: v_ = -0.1θ_ + x_d, donde θ_ es la distancia y x_d es la puntuación de atracción

Configuración del Conjunto de Datos

Ejemplo Pequeño: |N|=4 usuarios, |D|=3 instalaciones candidatas, |E|=2 instalaciones competidoras, r=2 instalaciones abiertas
Instancias a Gran Escala:
- Número de usuarios: 100, 200
- Número de instalaciones candidatas: 10, 20, 40
- Presupuesto: 4, 8
- Instalaciones competidoras fijas: 5

Métricas de Evaluación

Tiempo Computacional: Tiempo de resolución promedio y mediano
Distancia de Wasserstein: W²₂
Sparsidad: Porcentaje de características contextuales modificadas
Captura de Demanda: Demanda factual y contrafáctica
Norma ℓ₁: Distancia L1 del cambio contextual

Detalles de Implementación

Solver: Gurobi 11.0.1
Entorno de Programación: Python 3.11.7
Plataforma Computacional: Procesador Intel Core i9-10980XE
Límite de Tiempo: 1 hora
Parámetro de Regularización: λ ∈ {0, 0.1, 1}

Resultados Experimentales

Resultados Principales

Mejora Significativa de Eficiencia Computacional:
- El tiempo de resolución promedio con λ=0.1 se reduce considerablemente en comparación con λ=0
- Ejemplo: Para N=100, D=10, r=4, tiempo promedio con λ=0.1 es 137.92s vs 266.49s con λ=0
Mejora de Sparsidad:
- La regularización de Wasserstein mejora la sparsidad de la solución
- Con λ=0.1, la sparsidad generalmente es superior al caso λ=0
Brecha de Optimización:
- En instancias que alcanzan el límite de tiempo, la brecha de optimización del caso no regularizado es notablemente mayor

Análisis de Casos

Resultados del Ejemplo Pequeño:

Sin Regularización (λ=0): x_=0.350, W²₂=164.917
Con Regularización (λ=0.25): x_=0.479, W²₂=90.849
Aunque la versión regularizada tiene un cambio contextual mayor, la distancia de distribución es menor con la misma sparsidad

Hallazgos Experimentales

Efecto de Regularización: La regularización de Wasserstein moderada no solo mejora el tiempo de ejecución y la sparsidad, sino que también conduce a una transición más suave de la distribución de demanda
Complejidad Computacional: El problema contrafáctico hereda la complejidad del problema factual subyacente, y las instancias con presupuesto r mayor frecuentemente alcanzan el límite de tiempo
Mecanismo de Sparsidad: La sparsidad de cambios no solo se logra minimizando la norma ℓ₁, sino que la regularización también alienta al modelo a concentrar cambios en menos instalaciones en lugar de dispersar pequeñas modificaciones

Trabajo Relacionado

Explicaciones Contrafácticas para Problemas de Optimización

Bogetoft et al. (2024): Aplicación del concepto al Análisis Envolvente de Datos (DEA)
Kurtz et al. (2025): Explicaciones contrafácticas para programación lineal, formalizando tres tipos: débil, fuerte y relativo
Serie de Trabajos de Korikov: Cálculo de explicaciones contrafácticas débiles para programación lineal entera mediante optimización inversa

Problemas de Optimización Contextual

Forel et al. (2023): Asume que los parámetros se estiman a partir de covariables contextuales, utilizando bosques aleatorios o k-NN como predictores
Vivier-Ardisson et al. (2024): Extensión a clasificadores diferenciables, incluyendo redes neuronales

Diferencias con Trabajo Relacionado

Configuración del Objetivo: Permite un conjunto factible esperado D en lugar de un único objetivo proporcionado por expertos
Tipo de Incertidumbre: Se enfoca en incertidumbre endógena
Tipo de Variables: Maneja variables de decisión binarias
Innovación de Regularización: Introduce regularización de distancia de Wasserstein

Conclusiones y Discusión

Conclusiones Principales

Validez del Método: Extiende exitosamente las explicaciones contrafácticas a problemas estocásticos contextuales con incertidumbre endógena
Ventajas Computacionales: La regularización de Wasserstein mejora significativamente la eficiencia computacional
Calidad de Soluciones: Obtiene explicaciones más dispersas e interpretables con transiciones de probabilidad de elección más suaves

Limitaciones

Restricción a Variables Continuas: La formulación actual requiere que las covariables contextuales sean continuas, siendo la extensión a covariables categóricas aún un desafío
No Unicidad de Soluciones: Las soluciones típicamente no son únicas, lo que puede conducir a desacuerdos entre partes interesadas y posibilidad de manipular explicaciones
Consideraciones Éticas: Múltiples explicaciones contrafácticas válidas pueden plantear problemas éticos, como ocultar características contextuales sensibles

Direcciones Futuras

Contrafácticas Débiles: Calcular contrafácticas débiles que fuercen la optimalidad de la nueva solución en lugar de contrafácticas relativas
Extensión de Distribuciones: Extender a otras distribuciones de probabilidad
Dominios de Aplicación: Aplicaciones en optimización de clasificación y problemas de fijación de precios
Garantías de Unicidad: Incorporar términos objetivos que garanticen la unicidad de soluciones

Evaluación Profunda

Fortalezas

Contribución Teórica: Primera aplicación sistemática de explicaciones contrafácticas a problemas con incertidumbre endógena, con marco teórico completo
Innovación Metodológica: La introducción de regularización de Wasserstein tiene base teórica y efecto práctico, mejorando significativamente el rendimiento computacional
Experimentación Completa: Experimentos exhaustivos desde ejemplos pequeños hasta instancias a gran escala, con métricas de evaluación multidimensionales
Valor Práctico: La aplicación CFLP elegida tiene importancia práctica significativa con resultados operacionales

Deficiencias

Rango de Aplicabilidad Limitado: Solo aplicable a variables contextuales continuas, limitando la universalidad del método
Análisis de Complejidad Insuficiente: Falta análisis teórico de complejidad algorítmica
Selección de Parámetros: Carece de orientación sistemática para la selección del parámetro de regularización λ de Wasserstein
Experimentos Comparativos: Comparación insuficiente con otros métodos de explicación contrafáctica

Impacto

Contribución Académica: Abre nuevas direcciones para la investigación de interpretabilidad en optimización contextual
Valor Práctico: Proporciona apoyo a la toma de decisiones interpretable para problemas como planificación de instalaciones y asignación de recursos
Reproducibilidad: Proporciona código completo y ejemplos, facilitando reproducción y extensión

Escenarios de Aplicación

Planificación de Instalaciones: Decisiones de ubicación para instalaciones médicas, escuelas y puntos comerciales
Asignación de Recursos: Problemas de asignación de recursos públicos que requieren explicación de decisiones
Formulación de Políticas: Procesos de toma de decisiones gubernamentales que requieren transparencia e interpretabilidad
Decisiones Comerciales: Selección de ubicaciones estratégicas en entornos competitivos

Referencias

El artículo cita 63 referencias relevantes que abarcan explicaciones contrafácticas, teoría de optimización, problemas de localización de instalaciones y otros campos, proporcionando una base teórica sólida para la investigación.

Evaluación General: Este es un artículo académico de alta calidad que logra un buen equilibrio entre innovación teórica y aplicación práctica. La introducción de regularización de Wasserstein es un punto destacado, con base teórica sólida y ventajas computacionales prácticas. Aunque existen algunas limitaciones, el artículo realiza contribuciones importantes a la investigación de interpretabilidad en problemas de optimización contextual.