2025-11-13T21:28:11.123642

Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location

Ramírez-Ayerbe, Frejinger
In this paper, we consider contextual stochastic optimization problems under endogenous uncertainty, where decisions affect the underlying distributions. To implement such decisions in practice, it is crucial to ensure that their outcomes are interpretable and trustworthy. To this end, we compute relative counterfactual explanations that provide practitioners with concrete changes in the contextual covariates required for a solution to satisfy specific constraints. Whereas relative explanations have been introduced in prior literature, to the best of our knowledge this is the first work focusing on problems with binary decision variables and endogenous uncertainty. We propose a methodology that uses the Wasserstein distance as a regularization term, which leads to a reduction in computation times compared to its unregularized counterpart. We illustrate the method using a choice-based competitive facility location problem and present numerical experiments that demonstrate its ability to efficiently compute sparse and interpretable explanations.
academic

내생 불확실성을 가진 상황적 문제에 대한 상대적 설명: 경쟁 시설 위치 문제에의 응용

기본 정보

  • 논문 ID: 2506.19155
  • 제목: Relative Explanations for Contextual Problems with Endogenous Uncertainty: An Application to Competitive Facility Location
  • 저자: Jasone Ramírez-Ayerbe, Emma Frejinger (CIRRELT and Department of Computer Science and Operations Research, Université de Montréal)
  • 분류: math.OC (수학 최적화 및 제어)
  • 발표 시간: 2025년 10월 14일 (arXiv 사전인쇄본 제3판)
  • 논문 링크: https://arxiv.org/abs/2506.19155v3

초록

본 논문은 의사결정이 기저 분포에 영향을 미치는 내생 불확실성 하의 상황적 확률 최적화 문제를 연구한다. 실제로 이러한 의사결정을 구현하기 위해서는 그 결과의 해석 가능성과 신뢰성을 보장하는 것이 중수요하다. 이를 위해 저자들은 상대적 반사실적 설명을 계산하여 실무자들에게 해결책이 특정 제약을 만족하도록 하는 데 필요한 상황적 공변량의 구체적 변화를 제공한다. 상대적 설명이 이전 문헌에서 소개되었지만, 저자들의 지식으로는 이진 의사결정 변수와 내생 불확실성 문제에 초점을 맞춘 첫 번째 연구이다. 저자들은 Wasserstein 거리를 정규화 항으로 사용하는 방법을 제안하며, 이는 정규화되지 않은 대응 방법과 비교하여 계산 시간을 감소시킨다.

연구 배경 및 동기

문제 배경

기계학습과 최적화가 의사결정 문제에 적용되는 사례가 증가하고 있으며, 특히 의료, 주택 할당, 사회 서비스 등 고위험 의사결정 환경에서 해결책의 해석 가능성과 신뢰성을 보장하는 것이 중요해지고 있다. 유럽연합, 미국 백악관 과학기술정책실, 캐나다 정부 등의 기관들은 해석 가능성에 대한 증가하는 필요성을 인식하고 있다.

핵심 문제

  1. 내생 불확실성: 의사결정 변수 z가 확률변수 y의 조건부 확률분포 P(y|z,x)에 영향을 미침
  2. 해석 가능성 요구: 상황적 변화가 어떻게 의사결정 변화로 이어지는지, 그리고 해결책이 특정 제약을 충족하도록 하는 데 어떤 변화가 필요한지 이해할 필요
  3. 실제 응용 시나리오: 예를 들어, 의료 기반시설 계획에서 지방 정부가 자신의 지역에 센터를 개설하도록 하는 데이터의 최소 변화를 질문할 수 있음

기존 방법의 한계

  • 기존 반사실적 설명은 주로 지도학습 분류 문제에 초점
  • 이진 의사결정 변수와 내생 불확실성을 가진 최적화 문제에 대한 연구 부족
  • 전통적 방법은 계산 복잡도가 높고 효과적인 정규화 메커니즘 부재

핵심 기여

  1. 연구 범위 확장: 내생 불확실성 하의 상황적 확률 최적화 문제에 상대적 반사실적 설명을 처음 적용
  2. 기존 방법 일반화: 단일 목표 해결책이 아닌 기대 가능 집합 D를 허용하여 전문가 제공 해결책 기반의 기존 방법 일반화
  3. 이진 변수 처리: 이진 의사결정 변수 설정에서 상대적 설명 문제 해결
  4. Wasserstein 정규화: 반사실적 및 사실적 해결책이 유도하는 분포 간 거리를 최소화하는 정규화 항 사용
  5. 계산 효율성 향상: 제안된 정규화 방법이 계산 시간을 현저히 감소

방법론 상세 설명

작업 정의

주어진 상황적 확률 최적화 문제:

z*(x⁰) ∈ argmax_{z∈Z} E_{P(y|z,x⁰)}[r(y,z)]

여기서:

  • z ∈ Z: 의사결정 변수 벡터
  • x⁰ ∈ X ⊆ ℝ^{dx}: 연속 상황적 공변량(특성)
  • y: 내생 불확실성을 포착하는 확률변수 벡터
  • P(y|z,x⁰): 조건부 확률분포

상대적 반사실적 설명 정의

정의 1.1: 주어진 인수 α ∈ (0,∞]와 기대 공간 D에 대해, 문제(1)의 상대적 설명은 D에 속하는 가능한 해결책이 존재하여 기대 보상의 변화가 최대 α배인 새로운 상황 x이다.

핵심 최적화 문제

상대적 설명의 계산은 다음의 비볼록 최적화 문제로 표현될 수 있다:

L*_free := min_{x∈X,z∈Z} L(x,x⁰)
s.t. E_{P(y|z,x)}[r(y,z)] ≥ α · E_{P(y|z⁰,x⁰)}[r(y,z⁰)]
     z ∈ D

비용 함수 및 Wasserstein 정규화

비용 함수는 다음 형태를 채택한다:

L(x⁰,x) = J(x⁰,x) + λΩ(x⁰,x)

여기서:

  • J(x⁰,x): 비유사성 성분
  • Ω(x⁰,x): 정규화 항, 2-Wasserstein 거리 사용

Wasserstein 거리 정의: 두 개의 이산 확률분포 P⁰과 P에 대해, 2-Wasserstein 거리의 제곱은 다음과 같이 정의된다:

W²₂(P⁰,P) := min_{π∈Π} ∑_{c∈C} ∑_{c'∈C} π_{cc'} δ(c,c')²

제약 조건:

  • {c'∈C} π{cc'} = P⁰(c) ∀c ∈ C
  • {c∈C} π{cc'} = P(c') ∀c' ∈ C
  • π_{cc'} ≥ 0

기술적 혁신점

  1. 분포 거리 정규화: Wasserstein 거리를 사용하여 반사실적 분포가 사실적 분포에 가깝도록 보장
  2. 모델 무관 하한: 계산 하한을 제공하는 모델 무관 방법
  3. 희소성 유도: ℓ₁ 노름과 Wasserstein 정규화를 통해 희소 해 달성

실험 설정

응용 시나리오: 선택 기반 경쟁 시설 위치 문제(CFLP)

  • 모델: 다항 Logit(MNL) 모델
  • 의사결정: 예산 제약 하에서 후보 위치의 부분집합을 선택하여 기대 수요 포착 최대화
  • 효용 함수: v_ = -0.1θ_ + x_d, 여기서 θ_는 거리, x_d는 매력도 평가

데이터셋 구성

  • 소규모 예제: |N|=4 사용자, |D|=3 후보 시설, |E|=2 경쟁 시설, r=2 개방 시설
  • 대규모 인스턴스:
    • 사용자 수: 100, 200
    • 후보 시설 수: 10, 20, 40
    • 예산: 4, 8
    • 경쟁 시설 고정: 5개

평가 지표

  • 계산 시간: 평균 및 중앙값 해결 시간
  • Wasserstein 거리: W²₂
  • 희소성: 변경된 상황적 특성의 백분율
  • 수요 포착: 사실적 및 반사실적 수요량
  • ℓ₁ 노름: 상황적 변화의 L1 거리

구현 세부사항

  • 솔버: Gurobi 11.0.1
  • 프로그래밍 환경: Python 3.11.7
  • 계산 플랫폼: Intel Core i9-10980XE 프로세서
  • 시간 제한: 1시간
  • 정규화 매개변수: λ ∈ {0, 0.1, 1}

실험 결과

주요 결과

  1. 계산 효율성 현저한 향상:
    • λ=0.1일 때 평균 해결 시간이 λ=0보다 크게 감소
    • 예: N=100, D=10, r=4일 때, λ=0.1의 평균 시간 137.92초 vs λ=0의 266.49초
  2. 희소성 개선:
    • Wasserstein 정규화가 해의 희소성 향상
    • λ=0.1일 때 희소성이 일반적으로 λ=0의 경우보다 우수
  3. 최적화 간격:
    • 시간 제한에 도달한 인스턴스에서 정규화되지 않은 경우의 최적화 간격이 명확히 더 큼

사례 분석

소규모 예제 결과:

  • 정규화 없음(λ=0): x_=0.350, W²₂=164.917
  • 정규화 있음(λ=0.25): x_=0.479, W²₂=90.849
  • 정규화 버전은 상황적 변화가 더 크지만 분포 거리가 더 작으며 희소성은 동일

실험 발견

  1. 정규화 효과: 적절한 Wasserstein 정규화는 실행 시간과 희소성을 개선할 뿐만 아니라 수요 분포의 부드러운 전환을 초래
  2. 계산 복잡성: 반사실적 문제는 기저 사실적 문제의 복잡성을 상속하며, 예산 r이 큰 인스턴스는 자주 시간 제한에 도달
  3. 희소성 메커니즘: 희소 변화는 ℓ₁ 노름 최소화를 통해서만이 아니라 정규화가 모델이 변화를 소수의 시설에 집중하도록 장려함으로써 달성

관련 연구

최적화 문제의 반사실적 설명

  • Bogetoft et al. (2024): 데이터 포락 분석(DEA)에 개념 적용
  • Kurtz et al. (2025): 선형계획법의 반사실적 설명, 약한, 강한, 상대적 세 가지 유형 형식화
  • Korikov 시리즈 연구: 역 최적화를 통해 정수 선형계획법의 약한 반사실적 설명 계산

상황적 최적화 문제

  • Forel et al. (2023): 매개변수가 상황적 공변량에서 추정되고 무작위 숲 또는 k-NN을 예측기로 사용한다고 가정
  • Vivier-Ardisson et al. (2024): 신경망을 포함한 미분 가능 분류기로 확장

본 논문과 관련 연구의 차이

  1. 목표 설정: 전문가 제공 단일 목표가 아닌 기대 가능 집합 D 허용
  2. 불확실성 유형: 내생 불확실성에 초점
  3. 변수 유형: 이진 의사결정 변수 처리
  4. 정규화 혁신: Wasserstein 거리 정규화 도입

결론 및 논의

주요 결론

  1. 방법 유효성: 반사실적 설명을 내생 불확실성의 상황적 확률 문제로 성공적으로 확장
  2. 계산 이점: Wasserstein 정규화가 계산 효율성을 현저히 향상
  3. 해 품질: 더 희소하고 해석 가능한 설명을 획득하며, 선택 확률 변화가 더 부드러움

한계

  1. 연속 변수 제한: 현재 공식은 상황적 공변량이 연속형이어야 하며, 범주형 공변량으로의 확장은 여전히 과제
  2. 해의 유일성: 해가 일반적으로 유일하지 않아 이해관계자 간 의견 불일치 및 설명 조작 가능성 초래
  3. 윤리적 고려: 여러 유효한 반사실적 설명이 윤리적 문제를 야기할 수 있음, 예: 민감한 상황적 특성 은폐

향후 방향

  1. 약한 반사실적: 상대적 반사실적이 아닌 새로운 해의 최적성을 강제하는 약한 반사실적 계산
  2. 분포 확장: 다른 확률분포로 확장
  3. 응용 분야: 분류 최적화 및 가격 책정 등 상황적 문제에의 응용
  4. 유일성 보장: 해의 유일성을 보장하는 목표항 포함

심층 평가

장점

  1. 이론적 기여: 반사실적 설명을 내생 불확실성 문제에 체계적으로 처음 적용하며, 이론 프레임워크가 완전함
  2. 방법론 혁신: Wasserstein 정규화의 도입은 이론적 근거가 있으면서도 실제 효과가 있으며, 계산 성능을 현저히 개선
  3. 충분한 실험: 소규모 예제에서 대규모 인스턴스까지의 포괄적 실험, 다차원 평가 지표
  4. 실용적 가치: 선택된 CFLP 응용은 중요한 실제 의미를 가지며 결과는 실행 가능함

부족한 점

  1. 적용 범위 제한: 연속 상황적 변수에만 적용 가능하여 방법의 보편성 제한
  2. 복잡성 분석 부족: 알고리즘 복잡성에 대한 이론적 분석 부재
  3. 매개변수 선택: Wasserstein 정규화 매개변수 λ의 선택에 대한 체계적 지침 부족
  4. 비교 실험 부족: 다른 반사실적 설명 방법과의 비교가 충분하지 않음

영향력

  1. 학술적 기여: 상황적 최적화의 해석 가능성 연구에 새로운 방향 개척
  2. 실용적 가치: 시설 위치, 자원 할당 등 실제 문제에 해석 가능한 의사결정 지원 제공
  3. 재현성: 완전한 코드 및 인스턴스 제공으로 재현 및 확장 용이

적용 시나리오

  1. 시설 계획: 의료 시설, 학교, 상업 네트워크의 입지 의사결정
  2. 자원 할당: 의사결정 근거의 투명성과 해석 가능성이 필요한 공공 자원 할당 문제
  3. 정책 수립: 투명성과 해석 가능성이 필요한 정부 의사결정 과정
  4. 상업적 의사결정: 경쟁 환경에서의 전략적 위치 선택

참고문헌

논문은 반사실적 설명, 최적화 이론, 시설 위치 문제 등 여러 분야의 중요한 연구를 포함하는 63개의 관련 문헌을 인용하며, 연구에 견고한 이론적 기초를 제공한다.


종합 평가: 이는 이론적 혁신과 실제 응용 사이에서 좋은 균형을 이룬 고품질의 학술 논문이다. Wasserstein 정규화의 도입은 하이라이트로서, 이론적 근거가 있을 뿐만 아니라 실제 계산상의 이점을 가져온다. 일부 한계가 있지만, 상황적 최적화 문제의 해석 가능성 연구에 중요한 기여를 한다.