Explaining the behavior of predictive models with random inputs can be achieved through sub-models decomposition, where such sub-models have easier interpretable features. Arising from the uncertainty quantification community, recent results have demonstrated the existence and uniqueness of a generalized Hoeffding decomposition for such predictive models when the stochastic input variables are correlated, based on concepts of oblique projection onto L 2 subspaces. This article focuses on the case where the input variables have Bernoulli distributions and provides a complete description of this decomposition. We show that in this case the underlying L 2 subspaces are one-dimensional and that the functional decomposition is explicit. This leads to a complete interpretability framework and theoretically allows reverse engineering. Explicit indicators of the influence of inputs on the output prediction (exemplified by Sobol' indices and Shapley effects) can be explicitly derived. Illustrated by numerical experiments, this type of analysis proves useful for addressing decision-support problems, based on binary decision diagrams, Boolean networks or binary neural networks. The article outlines perspectives for exploring high-dimensional settings and, beyond the case of binary inputs, extending these findings to models with finite countable inputs.
- 論文ID: 2510.07088
- タイトル: Explaining Models under Multivariate Bernoulli Distribution via Hoeffding Decomposition
- 著者: Baptiste Ferrere, Nicolas Bousquet, Fabrice Gamboa, Jean-Michel Loubes, Joseph Muré
- 分類: stat.ML cs.LG
- 発表日時: 2025年10月10日 (arXiv v2)
- 論文リンク: https://arxiv.org/abs/2510.07088
本論文は、確率的入力を持つ予測モデルの解釈可能性問題を研究し、部分モデル分解を通じてモデル動作の理解を実現している。不確定性定量化領域の最新の進展に基づき、入力変数が多変量ベルヌーイ分布に従う場合について、一般化Hoeffding分解の完全な記述を提供している。研究により、この場合の基礎となるL²部分空間は1次元であり、関数分解は明示的であることが示され、完全な解釈可能性フレームワークの基礎が確立された。理論上、逆エンジニアリングが可能である。さらに、入力が出力予測に与える影響の明示的指標(Sobol指数やShapley効果など)を導出し、数値実験を通じて意思決定支援問題におけるこの手法の有効性を検証している。
- 中核的課題:相関のある二値入力変数を持つ複雑な予測モデルの動作をいかに説明するか
- 実務的必要性:機械学習と不確定性定量化において、入力変数はしばしば独立ではなく、独立性を仮定する従来のHoeffding分解は実際の応用では過度に制限的である
- 応用シーン:二値決定図、ブール網、二値ニューラルネットワーク、分子構造表現、確率ブール網など
従来のHoeffding分解(HD)は入力変数の相互独立性を要求するが、これは多くの実際の応用では現実的ではない。一般化Hoeffding分解(GHD)の理論的フレームワークは存在するが、特定の分布に対する明示的な構成方法が不足している。多変量ベルヌーイ分布は多くの領域で広く応用される重要な特殊ケースである。
- 独立性仮定:古典的HDは入力変数の独立性を要求し、応用範囲を制限している
- 計算複雑性:既存のGHD手法は明示的な構成を欠き、実際の計算が困難である
- 解釈可能性の不足:二値入力に対する完全な解釈可能性フレームワークが不足している
- 理論的貢献:多変量ベルヌーイの場合のGHDのL²部分空間が1次元であることを証明し、明示的な関数分解表現を提供
- 構成的手法:Fourier-Walsh-Hadamard基の変換に基づき、分解係数の明示的計算方法を提示
- 解釈可能性フレームワーク:一般化Sobol指数とShapley効果の明示的表現式を導出
- アルゴリズム実装:高次元の場合の切断近似手法と統計的推定保証を提供
- 応用検証:合成データと実データセット上で手法の有効性を検証
d次元多変量ベルヌーイ確率ベクトルX = (X₁, ..., Xd)と平方可積分関数G: {0,1}^d → Rが与えられたとき、目標は唯一の関数分解を見つけることである:
G(X) = ∑_{A∈P_D} G_A(X_A)
ここでP_Dは{1,...,d}の冪集合であり、分解は階層的直交性条件を満たす。
論文の中核的理論結果は定理2.2であり、明示的な分解表現を確立している:
定理2.2:G: {0,1}^d → Rとし、以下を定義する:
- g(X) := (e_A(X_A)G(X)){A∈P_D}、ここでe_A(X_A) := (-1)^{∑{j∈A} X_j}/P_A(X_A)
- Γ = (Γ_{A,B}){A,B∈P_D}をGram行列、Γ{A,B} := Ee_A(X_A)e_B(X_B)
- μをg(X)の平均値
このときGHDは以下で与えられる:
G(X) = ∑_{A∈P_D} β_A e_A(X_A)
ここで係数βは線形システムを満たす:Γβ = μ
論文は幾何学的視点からの理解も提供している(系2.3):
G(X) = ∑_{A∈P_D} ⟨G(X), e*_A(X)⟩e_A(X_A)
ここでe*_A(X)はe_A(X_A)の斜対偶ベクトルである。
- 1次元部分空間性質:多変量ベルヌーイの場合、各Hoeffding分解空間V_Aが1次元であることを証明
- 明示的基の構成:変換されたFourier-Walsh-Hadamard基{e_A(X_A)}_{A∈P_D}が階層的直交基を形成
- 線形システムの求解:分解問題を2^d次元線形システムΓβ = μの求解に変換
- 排除性質:特定の変数が予測に因果的影響を持たない場合、対応するβ係数は必ずゼロであることを証明
論文は一般化Sobol指数の明示的表現式を導出している:
S_A := CovG(X), G_A(X_A)/VarG(X) = β_A β_B Γ_{A,B}/VarG(X)
これらの指数は正規化条件∑_{A∈P_D} S_A = 1を満たすが、強い負の相関が存在する場合は負の値となる可能性がある。
Harsanyi配当に基づくShapley効果の定義:
Sh_i = ∑_{A⊆D: i∈A} S_A/|A|
多変量ベルヌーイの場合、明示的表現式を持つ。
- 線形閾値関数:10次元二値分類器G(X) = sign(W^T X + b)を設計
- 相関性制御:多変量ガウス分布の閾値化により異なる相関水準の二値ベクトルを生成
- 3つの依存水準:高依存(ρ=0.9)、中程度依存(ρ=0.5)、弱依存(ρ=0.1)
- 2次元パラメータ化研究:Farlie-Gumbel-Morgenstern copulaを使用して依存構造を制御
- キノコ分類データセット:UCI機械学習ライブラリのAgaricus-Lepiota データセット、8124サンプル、22分類属性
- 分散分解誤差:‖S^ρ - S^ρ_⊥‖₁, ‖S^ρ - S^ρ_⊥‖₂
- 相対誤差:真の値に対する正規化誤差
- 分類性能:精度、再現率、F1スコア
実験により、入力依存性を無視すると顕著な近似誤差が生じることが示された:
- 高依存の場合、相対分散誤差は87%に達する
- Sobol行列の相対誤差は高依存時に75%である
- 相関性の低下に伴い、誤差は顕著に減少する
- 2次元ケース:理論的な連言規則X₁X₂を成功裏に復元
- キノコ分類:5つの重要な二値規則を特定し、そのうち臭い規則が総分散の78.2%を占める
- 特徴重要性の階層:X₁(臭い) ≫ X₂(茎根) > {X₃,X₄,X₅}(その他の特徴)
論文は推定量の理論的保証を提供している:
- 強一貫性:Ĝₙ(x) →^{a.s.} G(x)
- 漸近正規性:中心極限定理
- 非漸近集中不等式:Bernstein型不等式
完全な分解には2^d次元線形システムの求解が必要であり、高次元の場合は実行不可能である。
低次項のみを保持する切断手法を提案:
G_(x) := ∑_{A∈P_D, |A|≤c} G_A(x_A)
複雑度はO(2^d)からO(d^c)に低減され、実務ではc ∈ {1,2,3}を通常選択する。
総誤差は偏差と分散の2つの部分に分解される:
E(G(x) - Ĝₙ,c(x))² = 偏差² + 分散
- 古典的HD(Hoeffding 1948):独立入力仮定
- 一般化HD(Chastaing et al. 2012):相関入力の理論的フレームワーク
- 最新の進展(Il Idrissi et al. 2025):斜投影理論
- Sobol指数:分散分解手法
- Shapley値:協力ゲーム理論的手法
- カーネル手法:依存構造を扱う代替手法
- SHAP:Shapley値に基づく説明手法
- LIME:局所的解釈可能性手法
- 注意機構:深層学習における解釈可能性
- 多変量ベルヌーイ分布下のGHDは明示的な1次元部分空間構造を持つ
- 完全な構成的分解手法と計算フレームワークを提供
- 一般化感度指標は明示的に計算可能であり、良好な理論的性質を持つ
- 手法は意思決定支援とモデル解釈において実用的価値を持つ
- 全支持仮定:すべての2^d個の配置が正の確率を持つことを要求し、高次元の場合過度に厳格である可能性がある
- 計算複雑性:完全分解の指数複雑度は高次元応用を制限する
- 切断偏差:高次元近似により導入される偏差はさらなる研究が必要である
- 理論的拡張:全支持仮定を緩和し、有限可算入力への拡張
- アルゴリズム最適化:より効率的な高次元計算手法の開発
- 応用拡張:深層学習およびその他の機械学習モデルへの応用を探索
- 理論的厳密性:完全な数学的理論フレームワークと証明を提供
- 手法の革新性:多変量ベルヌーイの場合の明示的分解を初めて提供
- 実用的価値:二値入力モデルの説明において直接的な応用価値を持つ
- 完全性:理論からアルゴリズムから応用まで完全な連鎖を形成
- 適用範囲の制限:二値入力のみに適用可能であり、全支持仮定が必要
- 高次元の課題:指数複雑度は大規模応用を制限する
- 実験検証の限定:主に低次元と特定のシナリオで検証
- 理論的貢献:関数分解理論に重要な特殊ケースを提供
- 方法論的価値:相関二値入力を持つモデル説明のための新しいツールを提供
- 応用可能性:ブール関数、決定木などの領域に広い応用前景を持つ
- 二値決定システム:医療診断、信用評価など
- ブール網分析:遺伝子制御網、論理回路など
- 決定木の説明:ランダムフォレスト、勾配ブースティング木などのアンサンブル手法
- 二値ニューラルネットワーク:量子化ニューラルネットワークの解釈可能性分析
論文は50篇の関連文献を引用しており、Hoeffding分解理論、感度分析、機械学習の解釈可能性など複数の領域の重要な研究をカバーし、研究に堅実な理論的基礎を提供している。
総合評価:これは理論的に厳密で、手法が革新的な高品質論文であり、多変量ベルヌーイ分布の関数分解理論において重要な貢献をしている。高次元応用の面で課題は存在するが、二値入力モデルの解釈可能性分析のための強力な理論的ツールを提供している。