2025-11-13T21:28:11.123642

Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location

Ramírez-Ayerbe, Frejinger
In this paper, we consider contextual stochastic optimization problems under endogenous uncertainty, where decisions affect the underlying distributions. To implement such decisions in practice, it is crucial to ensure that their outcomes are interpretable and trustworthy. To this end, we compute relative counterfactual explanations that provide practitioners with concrete changes in the contextual covariates required for a solution to satisfy specific constraints. Whereas relative explanations have been introduced in prior literature, to the best of our knowledge this is the first work focusing on problems with binary decision variables and endogenous uncertainty. We propose a methodology that uses the Wasserstein distance as a regularization term, which leads to a reduction in computation times compared to its unregularized counterpart. We illustrate the method using a choice-based competitive facility location problem and present numerical experiments that demonstrate its ability to efficiently compute sparse and interpretable explanations.
academic

Explicaciones Relativas para Problemas Contextuales con Incertidumbre Endógena: Una Aplicación a la Localización Competitiva de Instalaciones

Información Básica

  • ID del Artículo: 2506.19155
  • Título: Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location
  • Autores: Jasone Ramírez-Ayerbe, Emma Frejinger (CIRRELT y Departamento de Informática e Investigación Operativa, Université de Montréal)
  • Clasificación: math.OC (Optimización y Control Matemático)
  • Fecha de Publicación: 14 de octubre de 2025 (Preimpresión arXiv versión 3)
  • Enlace del Artículo: https://arxiv.org/abs/2506.19155v3

Resumen

Este artículo estudia problemas de optimización estocástica contextual bajo incertidumbre endógena, donde las decisiones afectan la distribución subyacente. Para implementar tales decisiones en la práctica, es fundamental garantizar que sus resultados sean interpretables y confiables. Con este propósito, los autores calculan explicaciones contrafácticas relativas, proporcionando a los profesionales cambios concretos en las covariables contextuales necesarios para que la solución satisfaga restricciones específicas. Aunque las explicaciones relativas se han introducido en la literatura anterior, según el conocimiento de los autores, este es el primer trabajo que se enfoca en variables de decisión binarias e problemas con incertidumbre endógena. Los autores proponen un método que utiliza la distancia de Wasserstein como término de regularización, que reduce significativamente el tiempo computacional en comparación con el enfoque no regularizado correspondiente.

Contexto e Motivación de la Investigación

Antecedentes del Problema

Con la creciente aplicación del aprendizaje automático y la optimización en problemas de toma de decisiones, particularmente en entornos de decisión de alto riesgo como atención médica, asignación de vivienda y servicios sociales, garantizar la interpretabilidad y confiabilidad de las soluciones se ha vuelto crítico. Instituciones como la Unión Europea, la Oficina de Política Científica y Tecnológica de la Casa Blanca y el gobierno canadiense reconocen la creciente necesidad de interpretabilidad.

Problema Central

  1. Incertidumbre Endógena: La variable de decisión z afecta la distribución de probabilidad condicional P(y|z,x) de la variable aleatoria y
  2. Requisito de Interpretabilidad: Necesidad de comprender cómo los cambios contextuales conducen a cambios en las decisiones y qué cambios son necesarios para que la solución cumpla restricciones específicas
  3. Escenarios de Aplicación Práctica: Por ejemplo, en la planificación de infraestructura médica, los gobiernos locales pueden preguntar cuál es el cambio mínimo en los datos que resultaría en la apertura de un centro en su región

Limitaciones de Métodos Existentes

  • Las explicaciones contrafácticas existentes se enfocan principalmente en problemas de clasificación supervisada
  • Falta de investigación en problemas de optimización con variables de decisión binarias e incertidumbre endógena
  • Los métodos tradicionales tienen alta complejidad computacional y carecen de mecanismos de regularización efectivos

Contribuciones Principales

  1. Ampliación del Alcance de Investigación: Primera aplicación de explicaciones contrafácticas relativas a problemas de optimización estocástica contextual bajo incertidumbre endógena
  2. Generalización de Métodos Existentes: Permite un conjunto factible esperado D en lugar de una única solución objetivo, generalizando métodos existentes basados en soluciones proporcionadas por expertos
  3. Manejo de Variables Binarias: Resuelve el problema de explicaciones relativas en el contexto de variables de decisión binarias
  4. Regularización de Wasserstein: Utiliza un término de regularización que minimiza la distancia entre distribuciones inducidas por soluciones contrafácticas y factuales
  5. Mejora de Eficiencia Computacional: El método de regularización propuesto reduce significativamente el tiempo computacional

Detalles de la Metodología

Definición de la Tarea

Dado un problema de optimización estocástica contextual:

z*(x⁰) ∈ argmax_{z∈Z} E_{P(y|z,x⁰)}[r(y,z)]

Donde:

  • z ∈ Z: Vector de variables de decisión
  • x⁰ ∈ X ⊆ ℝ^{dx}: Covariables contextuales continuas (características)
  • y: Vector de variables aleatorias que capturan la incertidumbre endógena
  • P(y|z,x⁰): Distribución de probabilidad condicional

Definición de Explicación Contrafáctica Relativa

Definición 1.1: Para un factor dado α ∈ (0,∞] y espacio deseado D, una explicación relativa del problema (1) es un nuevo contexto x tal que existe una solución factible en D cuya recompensa esperada cambia como máximo por un factor de α.

Problema de Optimización Central

El cálculo de la explicación relativa se puede formular como el siguiente problema de optimización no convexa:

L*_free := min_{x∈X,z∈Z} L(x,x⁰)
s.t. E_{P(y|z,x)}[r(y,z)] ≥ α · E_{P(y|z⁰,x⁰)}[r(y,z⁰)]
     z ∈ D

Función de Costo y Regularización de Wasserstein

La función de costo adopta la siguiente forma:

L(x⁰,x) = J(x⁰,x) + λΩ(x⁰,x)

Donde:

  • J(x⁰,x): Componente de disimilaridad
  • Ω(x⁰,x): Término de regularización utilizando la distancia 2-Wasserstein

Definición de Distancia de Wasserstein: Para dos distribuciones de probabilidad discretas P⁰ y P, el cuadrado de la distancia 2-Wasserstein se define como:

W²₂(P⁰,P) := min_{π∈Π} ∑_{c∈C} ∑_{c'∈C} π_{cc'} δ(c,c')²

Sujeto a las restricciones:

  • {c'∈C} π{cc'} = P⁰(c) ∀c ∈ C
  • {c∈C} π{cc'} = P(c') ∀c' ∈ C
  • π_{cc'} ≥ 0

Puntos de Innovación Técnica

  1. Regularización de Distancia de Distribución: Utiliza la distancia de Wasserstein para garantizar que la distribución contrafáctica sea cercana a la distribución factual
  2. Cota Inferior Agnóstica del Modelo: Proporciona un método agnóstico del modelo para calcular cotas inferiores
  3. Inducción de Sparsidad: Logra soluciones dispersas mediante la combinación de regularización de norma ℓ₁ y Wasserstein

Configuración Experimental

Escenario de Aplicación: Problema de Localización de Instalaciones Competitivas Basado en Elección (CFLP)

  • Modelo: Modelo Logit Multinomial (MNL)
  • Decisión: Seleccionar un subconjunto de ubicaciones candidatas bajo restricción de presupuesto para maximizar la captura de demanda esperada
  • Función de Utilidad: v_ = -0.1θ_ + x_d, donde θ_ es la distancia y x_d es la puntuación de atracción

Configuración del Conjunto de Datos

  • Ejemplo Pequeño: |N|=4 usuarios, |D|=3 instalaciones candidatas, |E|=2 instalaciones competidoras, r=2 instalaciones abiertas
  • Instancias a Gran Escala:
    • Número de usuarios: 100, 200
    • Número de instalaciones candidatas: 10, 20, 40
    • Presupuesto: 4, 8
    • Instalaciones competidoras fijas: 5

Métricas de Evaluación

  • Tiempo Computacional: Tiempo de resolución promedio y mediano
  • Distancia de Wasserstein: W²₂
  • Sparsidad: Porcentaje de características contextuales modificadas
  • Captura de Demanda: Demanda factual y contrafáctica
  • Norma ℓ₁: Distancia L1 del cambio contextual

Detalles de Implementación

  • Solver: Gurobi 11.0.1
  • Entorno de Programación: Python 3.11.7
  • Plataforma Computacional: Procesador Intel Core i9-10980XE
  • Límite de Tiempo: 1 hora
  • Parámetro de Regularización: λ ∈ {0, 0.1, 1}

Resultados Experimentales

Resultados Principales

  1. Mejora Significativa de Eficiencia Computacional:
    • El tiempo de resolución promedio con λ=0.1 se reduce considerablemente en comparación con λ=0
    • Ejemplo: Para N=100, D=10, r=4, tiempo promedio con λ=0.1 es 137.92s vs 266.49s con λ=0
  2. Mejora de Sparsidad:
    • La regularización de Wasserstein mejora la sparsidad de la solución
    • Con λ=0.1, la sparsidad generalmente es superior al caso λ=0
  3. Brecha de Optimización:
    • En instancias que alcanzan el límite de tiempo, la brecha de optimización del caso no regularizado es notablemente mayor

Análisis de Casos

Resultados del Ejemplo Pequeño:

  • Sin Regularización (λ=0): x_=0.350, W²₂=164.917
  • Con Regularización (λ=0.25): x_=0.479, W²₂=90.849
  • Aunque la versión regularizada tiene un cambio contextual mayor, la distancia de distribución es menor con la misma sparsidad

Hallazgos Experimentales

  1. Efecto de Regularización: La regularización de Wasserstein moderada no solo mejora el tiempo de ejecución y la sparsidad, sino que también conduce a una transición más suave de la distribución de demanda
  2. Complejidad Computacional: El problema contrafáctico hereda la complejidad del problema factual subyacente, y las instancias con presupuesto r mayor frecuentemente alcanzan el límite de tiempo
  3. Mecanismo de Sparsidad: La sparsidad de cambios no solo se logra minimizando la norma ℓ₁, sino que la regularización también alienta al modelo a concentrar cambios en menos instalaciones en lugar de dispersar pequeñas modificaciones

Trabajo Relacionado

Explicaciones Contrafácticas para Problemas de Optimización

  • Bogetoft et al. (2024): Aplicación del concepto al Análisis Envolvente de Datos (DEA)
  • Kurtz et al. (2025): Explicaciones contrafácticas para programación lineal, formalizando tres tipos: débil, fuerte y relativo
  • Serie de Trabajos de Korikov: Cálculo de explicaciones contrafácticas débiles para programación lineal entera mediante optimización inversa

Problemas de Optimización Contextual

  • Forel et al. (2023): Asume que los parámetros se estiman a partir de covariables contextuales, utilizando bosques aleatorios o k-NN como predictores
  • Vivier-Ardisson et al. (2024): Extensión a clasificadores diferenciables, incluyendo redes neuronales

Diferencias con Trabajo Relacionado

  1. Configuración del Objetivo: Permite un conjunto factible esperado D en lugar de un único objetivo proporcionado por expertos
  2. Tipo de Incertidumbre: Se enfoca en incertidumbre endógena
  3. Tipo de Variables: Maneja variables de decisión binarias
  4. Innovación de Regularización: Introduce regularización de distancia de Wasserstein

Conclusiones y Discusión

Conclusiones Principales

  1. Validez del Método: Extiende exitosamente las explicaciones contrafácticas a problemas estocásticos contextuales con incertidumbre endógena
  2. Ventajas Computacionales: La regularización de Wasserstein mejora significativamente la eficiencia computacional
  3. Calidad de Soluciones: Obtiene explicaciones más dispersas e interpretables con transiciones de probabilidad de elección más suaves

Limitaciones

  1. Restricción a Variables Continuas: La formulación actual requiere que las covariables contextuales sean continuas, siendo la extensión a covariables categóricas aún un desafío
  2. No Unicidad de Soluciones: Las soluciones típicamente no son únicas, lo que puede conducir a desacuerdos entre partes interesadas y posibilidad de manipular explicaciones
  3. Consideraciones Éticas: Múltiples explicaciones contrafácticas válidas pueden plantear problemas éticos, como ocultar características contextuales sensibles

Direcciones Futuras

  1. Contrafácticas Débiles: Calcular contrafácticas débiles que fuercen la optimalidad de la nueva solución en lugar de contrafácticas relativas
  2. Extensión de Distribuciones: Extender a otras distribuciones de probabilidad
  3. Dominios de Aplicación: Aplicaciones en optimización de clasificación y problemas de fijación de precios
  4. Garantías de Unicidad: Incorporar términos objetivos que garanticen la unicidad de soluciones

Evaluación Profunda

Fortalezas

  1. Contribución Teórica: Primera aplicación sistemática de explicaciones contrafácticas a problemas con incertidumbre endógena, con marco teórico completo
  2. Innovación Metodológica: La introducción de regularización de Wasserstein tiene base teórica y efecto práctico, mejorando significativamente el rendimiento computacional
  3. Experimentación Completa: Experimentos exhaustivos desde ejemplos pequeños hasta instancias a gran escala, con métricas de evaluación multidimensionales
  4. Valor Práctico: La aplicación CFLP elegida tiene importancia práctica significativa con resultados operacionales

Deficiencias

  1. Rango de Aplicabilidad Limitado: Solo aplicable a variables contextuales continuas, limitando la universalidad del método
  2. Análisis de Complejidad Insuficiente: Falta análisis teórico de complejidad algorítmica
  3. Selección de Parámetros: Carece de orientación sistemática para la selección del parámetro de regularización λ de Wasserstein
  4. Experimentos Comparativos: Comparación insuficiente con otros métodos de explicación contrafáctica

Impacto

  1. Contribución Académica: Abre nuevas direcciones para la investigación de interpretabilidad en optimización contextual
  2. Valor Práctico: Proporciona apoyo a la toma de decisiones interpretable para problemas como planificación de instalaciones y asignación de recursos
  3. Reproducibilidad: Proporciona código completo y ejemplos, facilitando reproducción y extensión

Escenarios de Aplicación

  1. Planificación de Instalaciones: Decisiones de ubicación para instalaciones médicas, escuelas y puntos comerciales
  2. Asignación de Recursos: Problemas de asignación de recursos públicos que requieren explicación de decisiones
  3. Formulación de Políticas: Procesos de toma de decisiones gubernamentales que requieren transparencia e interpretabilidad
  4. Decisiones Comerciales: Selección de ubicaciones estratégicas en entornos competitivos

Referencias

El artículo cita 63 referencias relevantes que abarcan explicaciones contrafácticas, teoría de optimización, problemas de localización de instalaciones y otros campos, proporcionando una base teórica sólida para la investigación.


Evaluación General: Este es un artículo académico de alta calidad que logra un buen equilibrio entre innovación teórica y aplicación práctica. La introducción de regularización de Wasserstein es un punto destacado, con base teórica sólida y ventajas computacionales prácticas. Aunque existen algunas limitaciones, el artículo realiza contribuciones importantes a la investigación de interpretabilidad en problemas de optimización contextual.