Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
論文ID : 2501.00154タイトル : Probabilistic Explanations for Linear Models著者 : Bernardo Subercaseaux (Carnegie Mellon University)、Marcelo Arenas (PUC Chile、IMFD Chile、RelationalAI)、Kuldeep S. Meel (Georgia Institute of Technology、University of Toronto)分類 : cs.AI (人工知能)、cs.CC (計算複雑性)発表日 : 2025年1月3日論文リンク : https://arxiv.org/abs/2501.00154 本論文は形式的解釈可能AI (Formal XAI) における「十分な理由」計算問題を研究している。モデルMと入力インスタンスxが与えられたとき、十分な理由とはxの特徴部分集合Sであり、S上でxと同じである任意のインスタンスzに対してM(x)=M(z)が成立する。十分な理由のサイズを削減するため、著者らは確率的緩和を検討する。すなわち、ランダムインスタンスzが特徴集合上でxと一致するとき、M(x)=M(z)の確率が少なくともδ∈(0,1]である場合を要求する。小さなδ-十分な理由 (δ-SRs) の計算は理論的に困難であり、決定木のような「解釈可能な」モデルでさえ強い近似不可能性結果が存在する。本論文は(δ,ε)-SR概念を提案し、これはδ-SRsの単純な緩和であり、このような説明が線形モデル上で効率的に計算できることを証明する。
核心問題 : 機械学習モデルの決定に対して、数学的保証を伴う小規模な説明をいかに提供するか。従来の十分な理由は100%の確実性を要求するが、これはしばしば説明が大きすぎて人間の理解に適さない。問題の重要性 :Miller (1956) は9個を超える特徴の説明は人間にとって大きすぎる可能性があると指摘 実証研究は説明は簡潔であるべきことを示唆 (Narayanan et al., 2018; Lage et al., 2019) 実際の応用では、ユーザーは確率保証の微小な差異よりも説明のサイズに関心がある 既存手法の限界 :最小δ-SRsの計算は決定木でさえNP困難 線形モデルでは、正確な確率計算は#P困難 強い近似不可能性結果が存在: 多項式時間で良い近似比を得ることができない 研究動機 :ユーザーは確率保証の微小な変化よりも説明サイズの変化に敏感 理論的処理可能性と実用性の間でバランスを見つける必要がある 線形モデルの特殊な構造は効率的なアルゴリズムを可能にするかもしれない (δ,ε)-最小十分な理由概念の提案 : 確率保証がδ-ε, δ+ε 範囲内で変動することを許容する緩和版線形モデル上の処理可能性の証明 : (δ,ε)-min-SRを計算する多項式時間アルゴリズムを提供、実行時間はÕ(n/ε²δ²)理論的分離結果の確立 : 決定木上でこの問題が依然として困難であることを証明し、線形モデルの特殊性を強調局所最小等価性の証明 : 線形モデルでは、各局所最小のδ-SRは部分集合最小のδ-SRである近似ギャップの分析 : 確率パラメータの小さな変化が説明サイズの指数的差異をもたらす可能性があることを証明入力 :
線形モデル L = ( w , θ ) \mathcal{L} = (\mathbf{w}, \theta) L = ( w , θ ) 、ここで w ∈ Q n \mathbf{w} \in \mathbb{Q}^n w ∈ Q n 、θ ∈ Q \theta \in \mathbb{Q} θ ∈ Q インスタンス x ∈ { 0 , 1 } n \mathbf{x} \in \{0,1\}^n x ∈ { 0 , 1 } n 確率閾値 δ ∈ ( 0 , 1 ) \delta \in (0,1) δ ∈ ( 0 , 1 ) と誤差許容度 ε ∈ ( 0 , 1 ) \varepsilon \in (0,1) ε ∈ ( 0 , 1 ) 出力 :
値 δ ∗ ∈ [ δ − ε , δ + ε ] \delta^* \in [\delta-\varepsilon, \delta+\varepsilon] δ ∗ ∈ [ δ − ε , δ + ε ] 最小 δ ∗ \delta^* δ ∗ -十分な理由 y \mathbf{y} y 制約条件 :
L ( x ) = 1 \mathcal{L}(\mathbf{x}) = 1 L ( x ) = 1 当且つ x ⋅ w ≥ θ \mathbf{x} \cdot \mathbf{w} \geq \theta x ⋅ w ≥ θ 部分インスタンス y ⊑ x \mathbf{y} \sqsubseteq \mathbf{x} y ⊑ x は未知値を ⋆ \star ⋆ で表現 線形モデル L = ( w , θ ) \mathcal{L} = (\mathbf{w}, \theta) L = ( w , θ ) とインスタンス x \mathbf{x} x に対して、特徴 i i i のスコアを以下のように定義:
s i = w i ⋅ ( 2 x i − 1 ) ⋅ ( 2 L ( x ) − 1 ) s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1) s i = w i ⋅ ( 2 x i − 1 ) ⋅ ( 2 L ( x ) − 1 )
スコアの符号は特徴が分類を「助ける」(+1) か「損なう」(-1) かを示し、大きさは特徴の重みに比例する。
重要な補題 : 線形モデルでは、均一分布の下で、スコアの降順で特徴を選択することが最適である。
具体的には、y ( 0 ) , … , y ( n ) \mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)} y ( 0 ) , … , y ( n ) が最高スコアの上位 k k k 個の特徴で定義された部分インスタンスである場合:
Pr z ∼ U ( y ( k + 1 ) ) [ L ( z ) = L ( x ) ] ≥ Pr z ∼ U ( y ( k ) ) [ L ( z ) = L ( x ) ] \Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] Pr z ∼ U ( y ( k + 1 ) ) [ L ( z ) = L ( x )] ≥ Pr z ∼ U ( y ( k ) ) [ L ( z ) = L ( x )]
Hoeffding不等式を用いた確率推定:
m = log 2 n 2 ε 2 δ 2 log 2 log n β m = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta} m = 2 ε 2 δ 2 l o g 2 n log β 2 l o g n 個のサンプルに対して:
Pr [ ∣ p ^ ( m ) − p ∣ ≤ ε δ / log n ] ≥ 1 − β / log n \Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n Pr [ ∣ p ^ ( m ) − p ∣ ≤ ε δ / log n ] ≥ 1 − β / log n
確率閾値のランダム化 : アルゴリズムは δ ∗ ∼ U ( [ δ − ε , δ + ε ] ) \delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon]) δ ∗ ∼ U ([ δ − ε , δ + ε ]) からランダムに選択し、困難なインスタンスを回避二分探索戦略 : 確率の単調性を利用した効率的な探索理論的保証の緩和 : 実用性を保ちながら多項式時間複雑性を達成Algorithm 1: LinearMonteCarloExplainer
入力: 線形モデルL、インスタンスx、パラメータδ、ε、β
1. δ* ← [δ-ε, δ+ε]から均一にサンプリング
2. すべての特徴スコア s_i を計算
3. 部分インスタンス列 y^(0), ..., y^(n) を構築
4. サンプル数を m = (log 2n)/(2ε²δ²) log(2log n/β) に設定
5. 二分探索を使用して、推定確率 ≥ δ* となる最小k を見つける
6. (δ*, y^(k*)) を返す
主定理 : 線形モデル L \mathcal{L} L と入力 x \mathbf{x} x が与えられたとき、時間 O ~ ( n ε 2 δ 2 ) \tilde{O}(\frac{n}{\varepsilon^2\delta^2}) O ~ ( ε 2 δ 2 n ) 内で確率 1 − β 1-\beta 1 − β で成功して (δ,ε)-min-SR を計算できる。
時間複雑性 : O ( log n ⋅ m ⋅ n ) = O ~ ( n ε 2 δ 2 ) O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2}) O ( log n ⋅ m ⋅ n ) = O ~ ( ε 2 δ 2 n ) 空間複雑性 : O ( n ) O(n) O ( n ) 成功確率 : 1 − β 1-\beta 1 − β 処理可能性の比較 :線形モデル: 多項式時間で解ける 決定木: 強い近似不可能性 (SATが準多項式時間で解けない限り) ニューラルネットワーク: NPPP困難 具体的な例の検証 :Example 2は0.999999-SRが最小1-SRより251倍小さいことを示す Example 3は貪欲選択戦略の正確性を検証 分離結果 : 決定木と比較した線形モデルの根本的な優位性を証明局所対全局最適 : 線形モデルでは、局所最小のδ-SRは部分集合最小のδ-SRである近似ギャップ : 確率パラメータの小さな変化が説明サイズの Ω ( n 1 / 2 − ϵ ) \Omega(n^{1/2-\epsilon}) Ω ( n 1/2 − ϵ ) 倍の差異をもたらす可能性Example 3 詳細分析 :
インスタンス: x = ( 1 , 0 , 0 , 1 , 1 ) \mathbf{x} = (1,0,0,1,1) x = ( 1 , 0 , 0 , 1 , 1 ) 重み: w = ( 5 , 1 , − 3 , 2 , − 1 ) \mathbf{w} = (5,1,-3,2,-1) w = ( 5 , 1 , − 3 , 2 , − 1 ) 、閾値: θ = 5 \theta = 5 θ = 5 特徴スコア: ( 5 , − 1 , 3 , 2 , − 1 ) (5,-1,3,2,-1) ( 5 , − 1 , 3 , 2 , − 1 ) 最適2特徴説明: { 1 , 3 } \{1,3\} { 1 , 3 } 、確率7/8 Darwiche and Hirth (2020) : 十分な理由概念を初めて形式化Barceló et al. (2020) : 異なるモデルクラスの複雑性階層を確立Arenas et al. (2022) : 決定木上のδ-SRsの困難性を証明Wäldchen et al. (2021) : δ-十分な理由概念を導入Izza et al. (2023) : 確率的腹部説明の計算を研究Kozachinskiy (2023) : 決定木の近似不可能性を確立Marques-Silva et al. (2020) : 素朴ベイズなどの線形分類器を研究Blanc et al. (2021) : 証明書複雑性に対する小説明理論的ブレークスルー : 確率的説明が線形モデル上で多項式時間で計算可能であることを初めて証明実用的価値 : (δ,ε)-SR概念は理論的保証を保ちながら実用性を向上モデル分離 : 線形モデルと決定木の説明計算複雑性における根本的な差異を確立実際の効率 : 高次元データ (n=500など) では、ε=0.1、δ=0.01の場合計算はまだ高コスト分布仮定 : アルゴリズムは均一分布を仮定し、積分布への拡張には新しい技術が必要特徴タイプ : 二値特徴のみを考慮し、実際の応用では連続および分類特徴の処理が必要アルゴリズム最適化 : 1/εと1/δへの依存性を低減分布拡張 : 積分布およびより一般的な特徴分布の処理特徴タイプ : 混合特徴タイプの「拡張線形分類器」への拡張クエリ言語 : 確率的説明のための宣言的クエリ言語の設計理論的貢献が顕著 :線形モデルの確率的説明の処理可能性を初めて確立 完全な複雑性分析とアルゴリズム設計を提供 重要な分離結果を証明 方法の革新性 :(δ,ε)-SR概念は理論性と実用性をうまくバランス ランダム化技術は困難なインスタンスを効果的に回避 貪欲戦略の理論的証明は優雅で深い 分析の深さ :詳細な数学的証明を提供 複数の複雑性尺度を考慮 関連研究との明確な関連性を確立 実用性の制限 :アルゴリズムはパラメータに敏感で、高次元の場合効率が悪い 二値特徴の線形モデルのみに適用可能 均一分布の仮定は実際には強い 実験検証の不足 :大規模データセット上の実験検証が欠ける 既存のヒューリスティック手法との比較がない 理論結果にはより多くの実証的支持が必要 拡張性の問題 :より一般的な設定への拡張の技術的課題は大きい 実際のMLパイプラインへの適用可能性は不明確 理論的影響 : 形式的XAI分野に重要な正の結果を提供し、該分野の主に困難性に焦点を当てた状況を打破方法的啓発 : ランダム化と緩和技術は他の困難な問題の解決に啓発を与える可能性実用的価値 : 線形モデルの解釈可能性に理論的基礎を提供金融リスク管理 : 線形スコアリングモデルのローン決定説明医療診断 : 線形回帰ベースのリスク評価説明推奨システム : 線形推奨モデルの特徴重要度分析法的コンプライアンス : 数学的保証が必要な自動化決定説明Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020. Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020. Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR. Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022. Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781. 本論文は形式的解釈可能AI分野において重要な理論的貢献を行い、確率的説明が線形モデル上で処理可能であることを初めて証明し、該分野に稀な正の結果をもたらした。実用性の面ではまだ改善の余地があるが、その理論的価値と方法的革新性により、該分野の重要な研究となっている。