Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location
RamÃrez-Ayerbe, Frejinger
In this paper, we consider contextual stochastic optimization problems under endogenous uncertainty, where decisions affect the underlying distributions. To implement such decisions in practice, it is crucial to ensure that their outcomes are interpretable and trustworthy. To this end, we compute relative counterfactual explanations that provide practitioners with concrete changes in the contextual covariates required for a solution to satisfy specific constraints. Whereas relative explanations have been introduced in prior literature, to the best of our knowledge this is the first work focusing on problems with binary decision variables and endogenous uncertainty. We propose a methodology that uses the Wasserstein distance as a regularization term, which leads to a reduction in computation times compared to its unregularized counterpart. We illustrate the method using a choice-based competitive facility location problem and present numerical experiments that demonstrate its ability to efficiently compute sparse and interpretable explanations.
academic
Explications Relatives pour les Problèmes Contextuels avec Incertitude Endogène : Une Application à la Localisation Compétitive d'Installations
Cet article étudie les problèmes d'optimisation stochastique contextuelle sous incertitude endogène, où les décisions influencent la distribution sous-jacente. Pour mettre en œuvre de telles décisions dans la pratique, il est crucial d'assurer que leurs résultats sont interprétables et fiables. À cette fin, les auteurs calculent des explications contrefactuelles relatives, fournissant aux praticiens les modifications concrètes des covariables contextuelles nécessaires pour que la solution satisfasse des contraintes spécifiques. Bien que les explications relatives aient été introduites dans la littérature antérieure, ceci est, selon les auteurs, le premier travail se concentrant sur les variables de décision binaires et les problèmes d'incertitude endogène. Les auteurs proposent une méthode utilisant la distance de Wasserstein comme terme de régularisation, qui réduit le temps de calcul par rapport à la méthode non régularisée correspondante.
Avec l'augmentation croissante de l'application de l'apprentissage automatique et de l'optimisation aux problèmes décisionnels, en particulier dans les environnements décisionnels à haut risque tels que la santé, l'allocation de logements et les services sociaux, assurer l'interprétabilité et la fiabilité des solutions est devenu crucial. Des institutions telles que l'Union européenne, le Bureau de la Politique Scientifique et Technologique de la Maison-Blanche et le gouvernement canadien reconnaissent le besoin croissant d'interprétabilité.
Incertitude endogène : La variable de décision z affecte la distribution de probabilité conditionnelle P(y|z,x) de la variable aléatoire y
Besoin d'interprétabilité : Comprendre comment les changements contextuels conduisent à des changements décisionnels et quels changements sont nécessaires pour que la solution satisfasse des contraintes spécifiques
Scénarios d'application pratique : Par exemple, dans la planification des infrastructures médicales, les gouvernements locaux pourraient demander quels changements minimaux dans les données conduiraient à l'ouverture d'un centre dans leur région
Extension du Domaine de Recherche : Première application des explications contrefactuelles relatives aux problèmes d'optimisation stochastique contextuelle sous incertitude endogène
Généralisation des Méthodes Existantes : Permet un ensemble réalisable attendu D plutôt qu'une solution cible unique, généralisant les méthodes existantes basées sur des solutions fournies par des experts
Traitement des Variables Binaires : Résout le problème des explications relatives impliquant des variables de décision binaires
Régularisation de Wasserstein : Utilise un terme de régularisation minimisant la distance entre les distributions induites par les solutions contrefactuelles et factuelles
Amélioration de l'Efficacité Computationnelle : La méthode de régularisation proposée réduit significativement le temps de calcul
Définition 1.1 : Pour un facteur donné α ∈ (0,∞] et un espace souhaité D, une explication relative du problème (1) est un nouveau contexte x tel qu'il existe une solution réalisable dans D dont la modification de la récompense attendue est au maximum α fois celle-ci.
Ω(x⁰,x) : terme de régularisation utilisant la distance 2-Wasserstein
Définition de la Distance de Wasserstein :
Pour deux distributions de probabilité discrètes P⁰ et P, le carré de la distance 2-Wasserstein est défini comme :
Régularisation par Distance de Distribution : Utilise la distance de Wasserstein pour assurer la proximité entre la distribution contrefactuelle et la distribution factuelle
Borne Inférieure Indépendante du Modèle : Fournit une méthode indépendante du modèle pour calculer les bornes inférieures
Induction de Parcimonie : Réalise des solutions parcimonieuses par la combinaison de la norme ℓ₁ et de la régularisation de Wasserstein
Avec régularisation (λ=0.25) : x_=0.479, W²₂=90.849
Bien que la version régularisée présente un changement contextuel plus important, la distance de distribution est plus petite et la parcimonie est identique
Effet de la Régularisation : Une régularisation de Wasserstein modérée améliore non seulement le temps d'exécution et la parcimonie, mais conduit également à une transition plus fluide de la distribution de demande
Complexité Computationnelle : Le problème contrefactuel hérite de la complexité du problème factuel sous-jacent, les instances avec un budget r important atteignant fréquemment la limite de temps
Mécanisme de Parcimonie : Les changements parcimonieux ne sont pas seulement réalisés par la minimisation de la norme ℓ₁, la régularisation encourage également le modèle à concentrer les changements sur moins d'installations plutôt que de les disperser en petites modifications
Bogetoft et al. (2024) : Application du concept à l'analyse par enveloppe de données (DEA)
Kurtz et al. (2025) : Explications contrefactuelles pour la programmation linéaire, formalisant trois types : faible, fort et relatif
Série de travaux de Korikov : Calcul d'explications contrefactuelles faibles pour la programmation linéaire en nombres entiers par optimisation inverse
Forel et al. (2023) : Suppose que les paramètres sont estimés à partir de covariables contextuelles, utilisant des forêts aléatoires ou k-NN comme prédicteurs
Vivier-Ardisson et al. (2024) : Extension aux classificateurs différentiables, incluant les réseaux de neurones
Restriction aux Variables Continues : La formulation actuelle exige que les covariables contextuelles soient continues, l'extension aux covariables catégoriques reste un défi
Non-Unicité des Solutions : Les solutions ne sont généralement pas uniques, ce qui peut conduire à des désaccords entre les parties prenantes et à la possibilité de manipuler les explications
Considérations Éthiques : Plusieurs explications contrefactuelles valides peuvent soulever des problèmes éthiques, tels que dissimuler les caractéristiques contextuelles sensibles
Explications Contrefactuelles Faibles : Calculer des explications contrefactuelles faibles forçant l'optimalité de la nouvelle solution plutôt que des explications relatives
Extension de Distribution : Extension à d'autres distributions de probabilité
Domaines d'Application : Applications dans les problèmes contextuels tels que l'optimisation de classification et la tarification
Garanties d'Unicité : Incorporation de termes objectifs assurant l'unicité des solutions
Contribution Théorique : Première application systématique des explications contrefactuelles aux problèmes d'incertitude endogène, cadre théorique complet
Innovation Méthodologique : L'introduction de la régularisation de Wasserstein est à la fois théoriquement fondée et pratiquement efficace, améliorant significativement les performances computationnelles
Expérimentation Complète : Expériences complètes allant des petits exemples aux instances à grande échelle, avec des indicateurs d'évaluation multidimensionnels
Valeur Pratique : L'application CFLP choisie a une importance pratique significative, les résultats étant opérationnels
Contribution Académique : Ouvre une nouvelle direction pour la recherche sur l'interprétabilité de l'optimisation contextuelle
Valeur Pratique : Fournit un support décisionnel interprétable pour les problèmes pratiques tels que la localisation d'installations et l'allocation de ressources
Reproductibilité : Fournit un code complet et des instances, facilitant la reproduction et l'extension
L'article cite 63 références pertinentes, couvrant plusieurs domaines incluant les explications contrefactuelles, la théorie de l'optimisation et les problèmes de localisation d'installations, fournissant une base théorique solide pour la recherche.
Évaluation Globale : Ceci est un article académique de haute qualité qui a atteint un bon équilibre entre l'innovation théorique et l'application pratique. L'introduction de la régularisation de Wasserstein est un point fort, offrant à la fois une justification théorique et des avantages computationnels pratiques. Malgré certaines limitations, il apporte des contributions importantes à la recherche sur l'interprétabilité des problèmes d'optimisation contextuelle.