2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel

Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $Î´\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $Î´$-sufficient reasons ($Î´$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $Î´$-SRs unlikely. We propose the notion of $(Î´, Îµ)$-SR, a simple relaxation of $Î´$-SRs, and show that this kind of explanation can be computed efficiently over linear models.

academic

선형 모델에 대한 확률적 설명

기본 정보

논문 ID: 2501.00154
제목: Probabilistic Explanations for Linear Models
저자: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
분류: cs.AI (인공지능), cs.CC (계산 복잡도)
발표 시간: 2025년 1월 3일
논문 링크: https://arxiv.org/abs/2501.00154

초록

본 논문은 형식적 해석 가능 AI(Formal XAI)에서 "충분한 이유" 계산 문제를 연구한다. 모델 M과 입력 인스턴스 x가 주어졌을 때, 충분한 이유는 x의 특성 부분집합 S로서, S에서 x와 동일한 모든 인스턴스 z에 대해 M(x)=M(z)를 만족한다. 충분한 이유의 크기를 줄이기 위해 저자들은 확률적 완화를 고려한다: 무작위 인스턴스 z가 특성 집합에서 x와 일치할 때, M(x)=M(z)의 확률이 최소 δ∈(0,1]이어야 한다. 작은 δ-충분한 이유(δ-SRs)를 계산하는 것은 이론적으로 어려우며, 의사결정 트리와 같은 "해석 가능한" 모델에서도 강한 근사 불가능 결과가 존재한다. 본 논문은 (δ,ε)-SR 개념을 제안하는데, 이는 δ-SRs의 간단한 완화이며, 이러한 설명이 선형 모델에서 효율적으로 계산될 수 있음을 증명한다.

연구 배경 및 동기

핵심 문제: 기계학습 모델의 결정에 대해 수학적 보장이 있는 작은 크기의 설명을 제공하는 방법. 전통적인 충분한 이유는 100% 확실성을 요구하지만, 이는 종종 설명이 너무 커져서 인간이 이해하기 어렵다.
문제의 중요성:
- Miller (1956)는 9개 이상의 특성을 가진 설명이 인간에게 너무 클 수 있음을 지적
- 실증 연구에 따르면 설명은 간결해야 함 (Narayanan et al., 2018; Lage et al., 2019)
- 실제 응용에서 사용자는 확률 보장의 미세한 차이보다 설명의 크기에 더 관심
기존 방법의 한계:
- 최소 δ-SRs 계산은 의사결정 트리에서도 NP-hard
- 선형 모델의 경우 정확한 확률 계산은 #P-hard
- 강한 근사 불가능 결과 존재: 다항식 시간 내에 좋은 근사 비율을 얻을 수 없음
연구 동기:
- 사용자는 확률 보장의 미세한 변화보다 설명 크기에 더 민감
- 이론적 처리 가능성과 실용성 사이의 균형 필요
- 선형 모델의 특수한 구조는 효율적인 알고리즘을 허용할 수 있음

핵심 기여

(δ,ε)-최소 충분한 이유 개념 제안: 확률 보장이 δ-ε, δ+ε 범위 내에서 변할 수 있도록 허용하는 완화 버전
선형 모델에서의 처리 가능성 증명: (δ,ε)-min-SR을 계산하는 다항식 시간 알고리즘 제시, 실행 시간은 Õ(n/ε²δ²)
이론적 분리 결과 수립: 의사결정 트리에서 해당 문제가 여전히 어려움을 증명하여 선형 모델의 특수성 강조
국소 최소성 동등성 증명: 선형 모델의 경우 모든 국소 최소 δ-SR은 부분집합 최소 δ-SR
근사 간격 분석: 확률 매개변수의 작은 변화가 설명 크기의 지수 차이로 이어질 수 있음을 증명

방법 상세 설명

작업 정의

입력:

선형 모델 $\mathcal{L} = (\mathbf{w}, \theta)$ , 여기서 $\mathbf{w} \in \mathbb{Q}^n$ , $\theta \in \mathbb{Q}$
인스턴스 $\mathbf{x} \in \{0,1\}^n$
확률 임계값 $\delta \in (0,1)$ 및 오차 허용도 $\varepsilon \in (0,1)$

출력:

값 $\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]$
최소 $\delta^*$ -충분한 이유 $\mathbf{y}$

제약 조건:

$\mathcal{L}(\mathbf{x}) = 1$ ⟺ $\mathbf{x} \cdot \mathbf{w} \geq \theta$
부분 인스턴스 $\mathbf{y} \sqsubseteq \mathbf{x}$ 는 $\star$ 를 사용하여 미지의 값 표현

모델 아키텍처

1. 특성 평가 메커니즘

선형 모델 $\mathcal{L} = (\mathbf{w}, \theta)$ 와 인스턴스 $\mathbf{x}$ 에 대해 특성 $i$ 의 평가를 다음과 같이 정의:

$s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)$

평가의 부호는 특성이 분류를 "돕는"(+1) 것인지 "해치는"(-1) 것인지를 나타내며, 크기는 특성 가중치에 비례한다.

2. 탐욕적 특성 선택

핵심 보조정리: 선형 모델의 경우 균등 분포에서 평가 내림차순으로 특성을 선택하는 것이 최적이다.

구체적으로, $\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)}$ 이 최고 평가의 상위 $k$ 개 특성으로 정의된 부분 인스턴스라면:

$\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]$

3. 몬테카를로 추정

Hoeffding 부등식을 사용한 확률 추정:

$m = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta}$ 개 샘플에 대해:

$\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n$

기술적 혁신점

무작위화 확률 임계값: 알고리즘이 $\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon])$ 에서 무작위로 선택하여 어려운 인스턴스 회피
이분 탐색 전략: 확률 단조성을 활용한 효율적 탐색
이론적 보장의 완화: 실용성을 유지하면서 다항식 시간 복잡도 달성

실험 설정

알고리즘 설명

알고리즘 1: LinearMonteCarloExplainer

입력: 선형 모델 L, 인스턴스 x, 매개변수 δ, ε, β
1. δ* ← [δ-ε, δ+ε]에서 균등 샘플링
2. 모든 특성 평가 s_i 계산
3. 부분 인스턴스 수열 y^(0), ..., y^(n) 구성
4. 샘플 수 설정 m = (log 2n)/(2ε²δ²) log(2log n/β)
5. 이분 탐색을 사용하여 추정 확률 ≥ δ*인 최소 k 찾기
6. (δ*, y^(k*)) 반환

이론적 분석

주요 정리: 선형 모델 $\mathcal{L}$ 과 입력 $\mathbf{x}$ 가 주어졌을 때, 시간 $\tilde{O}(\frac{n}{\varepsilon^2\delta^2})$ 내에 확률 $1-\beta$ 로 (δ,ε)-min-SR을 계산할 수 있다.

복잡도 분석

시간 복잡도: $O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})$
공간 복잡도: $O(n)$
성공 확률: $1-\beta$

실험 결과

주요 결과

처리 가능성 비교:
- 선형 모델: 다항식 시간 해결 가능
- 의사결정 트리: 강한 근사 불가능성 (SAT가 준다항식 시간에 해결 가능하지 않은 한)
- 신경망: NPPP-hard
구체적 예시 검증:
- 예시 2는 0.999999-SR이 최소 1-SR보다 251배 작을 수 있음을 보여줌
- 예시 3은 탐욕적 선택 전략의 정확성 검증

이론적 발견

분리 결과: 의사결정 트리에 비한 선형 모델의 근본적 우월성 증명
국소 vs 전역 최적: 선형 모델의 경우 국소 최소 δ-SR은 부분집합 최소 δ-SR
근사 간격: 확률 매개변수의 작은 변화가 설명 크기의 $\Omega(n^{1/2-\epsilon})$ 배 차이 야기 가능

사례 분석

예시 3 상세 분석:

인스턴스: $\mathbf{x} = (1,0,0,1,1)$
가중치: $\mathbf{w} = (5,1,-3,2,-1)$ , 임계값: $\theta = 5$
특성 평가: $(5,-1,3,2,-1)$
최적 2특성 설명: $\{1,3\}$ , 확률 7/8

결론 및 논의

주요 결론

이론적 돌파: 확률적 설명이 선형 모델에서 다항식 시간 계산 가능함을 최초 증명
실용적 가치: (δ,ε)-SR 개념이 이론적 보장을 유지하면서 실용성 향상
모델 분리: 선형 모델과 의사결정 트리 간 설명 계산 복잡도의 근본적 차이 수립

한계

실제 효율성: 고차원 데이터(예: n=500)의 경우 ε=0.1, δ=0.01일 때 계산 여전히 비용 높음
분포 가정: 알고리즘이 균등 분포 가정, 곱 분포로의 확장에는 새로운 기술 필요
특성 유형: 이진 특성만 고려, 실제 응용은 연속 및 범주형 특성 처리 필요

향후 방향

알고리즘 최적화: 1/ε 및 1/δ에 대한 의존도 감소
분포 확장: 곱 분포 및 더 일반적인 특성 분포 처리
특성 유형: 혼합 특성 유형의 "확장 선형 분류기"로 확장
쿼리 언어: 선언적 확률 설명 쿼리 언어 설계

심층 평가

장점

이론적 기여 현저함:
- 선형 모델 확률 설명의 처리 가능성 최초 수립
- 완전한 복잡도 분석 및 알고리즘 설계 제공
- 중요한 분리 결과 증명
방법의 혁신성:
- (δ,ε)-SR 개념이 이론성과 실용성을 교묘히 균형
- 무작위화 기법이 어려운 인스턴스 효과적 회피
- 탐욕적 전략의 이론적 증명이 우아하고 깊음
분석의 깊이:
- 상세한 수학적 증명 제공
- 다양한 복잡도 측도 고려
- 관련 연구와의 명확한 연결 수립

부족한 점

실용성 제한:
- 알고리즘이 매개변수에 민감하며 고차원 경우 효율성 저하
- 이진 특성의 선형 모델에만 적용 가능
- 균등 분포 가정이 실제로는 강함
실험 검증 부족:
- 대규모 데이터셋에서의 실험 검증 부재
- 기존 휴리스틱 방법과의 비교 없음
- 이론적 결과에 더 많은 실증적 지원 필요
확장성 문제:
- 더 일반적 설정으로의 확장에 기술적 도전 큼
- 실제 ML 파이프라인에 대한 적용 가능성 불명확

영향력

이론적 영향: 형식적 XAI 분야에 중요한 긍정적 결과 제공, 해당 분야의 주요 어려움 중심 관점 타파
방법론적 영감: 무작위화 및 완화 기법이 다른 어려운 문제 해결에 영감 제공 가능
실용적 가치: 선형 모델의 해석 가능성에 대한 이론적 기초 제공

적용 시나리오

금융 위험 관리: 선형 평가 모델의 대출 결정 설명
의료 진단: 선형 회귀 기반 위험 평가 설명
추천 시스템: 선형 추천 모델의 특성 중요도 분석
법률 준수: 수학적 보장이 필요한 자동화 의사결정 설명

참고문헌

Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

본 논문은 형식적 해석 가능 AI 분야에서 중요한 이론적 기여를 하였으며, 확률적 설명이 선형 모델에서 처리 가능함을 최초로 증명하여 해당 분야에 드문 긍정적 결과를 제공한다. 실용성 측면에서 개선의 여지가 있지만, 이론적 가치와 방법론적 혁신성으로 인해 해당 분야의 중요한 연구가 되었다.