2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel
Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
academic

Explications Probabilistes pour les Modèles Linéaires

Informations Fondamentales

  • ID de l'article: 2501.00154
  • Titre: Probabilistic Explanations for Linear Models
  • Auteurs: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
  • Classification: cs.AI (Intelligence Artificielle), cs.CC (Complexité Computationnelle)
  • Date de publication: 3 janvier 2025
  • Lien de l'article: https://arxiv.org/abs/2501.00154

Résumé

Cet article étudie le problème du calcul des « raisons suffisantes » dans l'IA explicable formelle (Formal XAI). Étant donné un modèle M et une instance d'entrée x, une raison suffisante est un sous-ensemble S de caractéristiques tel que toute instance z qui coïncide avec x sur S satisfait M(x)=M(z). Pour réduire la taille des raisons suffisantes, les auteurs considèrent une relaxation probabiliste : exiger que pour une instance aléatoire z coïncidant avec x sur l'ensemble de caractéristiques, la probabilité que M(x)=M(z) soit au moins δ∈(0,1]. Le calcul de petites δ-raisons suffisantes (δ-SRs) est théoriquement difficile, avec des résultats forts d'inapproximabilité même pour des modèles « explicables » comme les arbres de décision. Cet article propose le concept de (δ,ε)-SR, une relaxation simple des δ-SRs, et prouve que ces explications peuvent être calculées efficacement sur les modèles linéaires.

Contexte et Motivation de la Recherche

  1. Problème central: Comment fournir des explications de petite taille avec des garanties mathématiques pour les décisions des modèles d'apprentissage automatique. Les raisons suffisantes traditionnelles exigent une certitude à 100%, ce qui entraîne souvent des explications trop grandes pour la compréhension humaine.
  2. Importance du problème:
    • Miller (1956) a montré que les explications dépassant 9 caractéristiques peuvent être trop grandes pour les humains
    • Les études empiriques indiquent que les explications doivent être concises (Narayanan et al., 2018; Lage et al., 2019)
    • Dans les applications pratiques, les utilisateurs se soucient davantage de la taille de l'explication que des petites variations des garanties probabilistes
  3. Limitations des approches existantes:
    • Le calcul des δ-SRs minimaux est NP-difficile même pour les arbres de décision
    • Pour les modèles linéaires, le calcul exact des probabilités est #P-difficile
    • Il existe des résultats forts d'inapproximabilité : impossible d'obtenir de bons rapports d'approximation en temps polynomial
  4. Motivation de la recherche:
    • Les utilisateurs sont plus sensibles à la taille de l'explication qu'aux petites variations des garanties probabilistes
    • Nécessité de trouver un équilibre entre la traitabilité théorique et la praticité
    • La structure particulière des modèles linéaires peut permettre des algorithmes efficaces

Contributions Principales

  1. Proposition du concept de (δ,ε)-raison suffisante minimale: Une version relaxée permettant aux garanties probabilistes de varier dans l'intervalle δ-ε, δ+ε
  2. Preuve de traitabilité sur les modèles linéaires: Algorithme en temps polynomial pour calculer (δ,ε)-min-SR, avec un temps d'exécution de Õ(n/ε²δ²)
  3. Établissement de résultats de séparation théorique: Preuve que le problème reste difficile sur les arbres de décision, mettant en évidence la particularité des modèles linéaires
  4. Preuve d'équivalence des minima locaux: Pour les modèles linéaires, chaque δ-SR localement minimal est un δ-SR minimalement inclus
  5. Analyse de l'écart d'approximation: Preuve que les petites variations des paramètres probabilistes peuvent entraîner des différences exponentielles dans la taille de l'explication

Détails de la Méthode

Définition de la Tâche

Entrées:

  • Modèle linéaire L=(w,θ)\mathcal{L} = (\mathbf{w}, \theta), où wQn\mathbf{w} \in \mathbb{Q}^n, θQ\theta \in \mathbb{Q}
  • Instance x{0,1}n\mathbf{x} \in \{0,1\}^n
  • Seuil probabiliste δ(0,1)\delta \in (0,1) et tolérance d'erreur ε(0,1)\varepsilon \in (0,1)

Sorties:

  • Valeur δ[δε,δ+ε]\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]
  • Raison suffisante minimale δ\delta^* notée y\mathbf{y}

Contraintes:

  • L(x)=1\mathcal{L}(\mathbf{x}) = 1 si et seulement si xwθ\mathbf{x} \cdot \mathbf{w} \geq \theta
  • Instance partielle yx\mathbf{y} \sqsubseteq \mathbf{x} utilisant \star pour les valeurs inconnues

Architecture du Modèle

1. Mécanisme d'Évaluation des Caractéristiques

Pour un modèle linéaire L=(w,θ)\mathcal{L} = (\mathbf{w}, \theta) et une instance x\mathbf{x}, le score de la caractéristique ii est défini par:

si=wi(2xi1)(2L(x)1)s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)

Le signe du score indique si la caractéristique « aide » (+1) ou « nuit » (-1) à la classification, l'amplitude étant proportionnelle au poids de la caractéristique.

2. Sélection Gloutonne des Caractéristiques

Lemme clé: Pour un modèle linéaire, sous une distribution uniforme, la sélection des caractéristiques par ordre décroissant de score est optimale.

Spécifiquement, si y(0),,y(n)\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)} sont les instances partielles définies par les k caractéristiques de score le plus élevé, alors:

PrzU(y(k+1))[L(z)=L(x)]PrzU(y(k))[L(z)=L(x)]\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]

3. Estimation de Monte-Carlo

Utilisation de l'inégalité de Hoeffding pour l'estimation probabiliste:

Pour m=log2n2ε2δ2log2lognβm = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta} échantillons, on a:

Pr[p^(m)pεδ/logn]1β/logn\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n

Points d'Innovation Technique

  1. Seuil probabiliste aléatoire: L'algorithme choisit aléatoirement δU([δε,δ+ε])\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon]), évitant ainsi les instances difficiles
  2. Stratégie de recherche binaire: Exploitation de la monotonie probabiliste pour une recherche efficace
  3. Relaxation des garanties théoriques: Obtention de complexité en temps polynomial tout en maintenant la praticité

Configuration Expérimentale

Description de l'Algorithme

Algorithme 1: LinearMonteCarloExplainer

Entrée: Modèle linéaire L, instance x, paramètres δ, ε, β
1. δ* ← Échantillonner uniformément de [δ-ε, δ+ε]
2. Calculer tous les scores de caractéristiques s_i
3. Construire la séquence d'instances partielles y^(0), ..., y^(n)
4. Définir le nombre d'échantillons m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Utiliser la recherche binaire pour trouver le minimum k tel que la probabilité estimée ≥ δ*
6. Retourner (δ*, y^(k*))

Analyse Théorique

Théorème principal: Étant donné un modèle linéaire L\mathcal{L} et une entrée x\mathbf{x}, on peut calculer (δ,ε)-min-SR en temps O~(nε2δ2)\tilde{O}(\frac{n}{\varepsilon^2\delta^2}) avec probabilité de succès 1β1-\beta.

Analyse de Complexité

  • Complexité temporelle: O(lognmn)=O~(nε2δ2)O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})
  • Complexité spatiale: O(n)O(n)
  • Probabilité de succès: 1β1-\beta

Résultats Expérimentaux

Résultats Principaux

  1. Comparaison de traitabilité:
    • Modèles linéaires: Solvable en temps polynomial
    • Arbres de décision: Inapproximabilité forte (sauf si SAT peut être résolu en temps quasi-polynomial)
    • Réseaux de neurones: NPPP-difficile
  2. Vérification par exemples concrets:
    • Exemple 2 montre qu'une 0.999999-SR peut être 251 fois plus petite que la plus petite 1-SR
    • Exemple 3 valide la correction de la stratégie de sélection gloutonne

Découvertes Théoriques

  1. Résultats de séparation: Preuve de l'avantage fondamental des modèles linéaires par rapport aux arbres de décision
  2. Optimalité locale vs globale: Pour les modèles linéaires, chaque δ-SR localement minimal est un δ-SR minimalement inclus
  3. Écart d'approximation: Les petites variations des paramètres probabilistes peuvent entraîner des différences de Ω(n1/2ϵ)\Omega(n^{1/2-\epsilon}) dans la taille de l'explication

Analyse de Cas

Analyse détaillée de l'Exemple 3:

  • Instance: x=(1,0,0,1,1)\mathbf{x} = (1,0,0,1,1)
  • Poids: w=(5,1,3,2,1)\mathbf{w} = (5,1,-3,2,-1), seuil: θ=5\theta = 5
  • Scores de caractéristiques: (5,1,3,2,1)(5,-1,3,2,-1)
  • Explication optimale à 2 caractéristiques: {1,3}\{1,3\}, probabilité 7/8

Travaux Connexes

Calcul des Raisons Suffisantes

  1. Darwiche and Hirth (2020): Première formalisation du concept de raison suffisante
  2. Barceló et al. (2020): Établissement d'une hiérarchie de complexité pour différentes classes de modèles
  3. Arenas et al. (2022): Preuve de la difficulté des δ-SRs sur les arbres de décision

Explications Probabilistes

  1. Wäldchen et al. (2021): Introduction du concept de δ-raison suffisante
  2. Izza et al. (2023): Étude du calcul des explications probabilistes abdominales
  3. Kozachinskiy (2023): Établissement des résultats d'inapproximabilité pour les arbres de décision

Explications de Modèles Linéaires

  1. Marques-Silva et al. (2020): Étude des classificateurs linéaires comme le Naïve Bayes
  2. Blanc et al. (2021): Petites explications relatives à la complexité des certificats

Conclusion et Discussion

Conclusions Principales

  1. Percée théorique: Première preuve de la calculabilité en temps polynomial des explications probabilistes sur les modèles linéaires
  2. Valeur pratique: Le concept (δ,ε)-SR améliore la praticité tout en maintenant les garanties théoriques
  3. Séparation de modèles: Établissement d'une différence fondamentale entre les modèles linéaires et les arbres de décision dans la complexité du calcul des explications

Limitations

  1. Efficacité pratique: Pour les données de haute dimension (comme n=500), le calcul reste coûteux quand ε=0.1, δ=0.01
  2. Hypothèses de distribution: L'algorithme suppose une distribution uniforme; l'extension aux distributions produit nécessite de nouvelles techniques
  3. Types de caractéristiques: Considère uniquement les caractéristiques binaires; les applications réelles nécessitent de traiter les caractéristiques continues et catégoriques

Directions Futures

  1. Optimisation algorithmique: Réduction de la dépendance à 1/ε et 1/δ
  2. Extension de distribution: Traitement des distributions produit et des distributions de caractéristiques plus générales
  3. Types de caractéristiques: Extension aux « classificateurs linéaires étendus » avec types de caractéristiques mixtes
  4. Langage de requête: Conception d'un langage de requête d'explications probabilistes déclaratif

Évaluation Approfondie

Points Forts

  1. Contributions théoriques significatives:
    • Première établissement de la traitabilité des explications probabilistes sur les modèles linéaires
    • Analyse de complexité complète et conception d'algorithmes
    • Preuve de résultats de séparation importants
  2. Innovation méthodologique:
    • Le concept (δ,ε)-SR équilibre élégamment théorie et praticité
    • Les techniques de randomisation évitent efficacement les instances difficiles
    • La preuve de la stratégie gloutonne est élégante et profonde
  3. Analyse approfondie:
    • Preuves mathématiques détaillées
    • Considération de multiples mesures de complexité
    • Connexions claires avec les travaux connexes

Insuffisances

  1. Limitations de praticité:
    • L'algorithme est sensible aux paramètres, avec une efficacité médiocre en haute dimension
    • Applicable uniquement aux modèles linéaires avec caractéristiques binaires
    • L'hypothèse de distribution uniforme est forte en pratique
  2. Validation expérimentale insuffisante:
    • Absence de validation expérimentale sur des ensembles de données à grande échelle
    • Pas de comparaison avec les méthodes heuristiques existantes
    • Les résultats théoriques nécessitent plus de soutien empirique
  3. Problèmes d'extensibilité:
    • Les défis techniques pour l'extension à des paramètres plus généraux sont importants
    • L'applicabilité au pipeline ML pratique n'est pas claire

Impact

  1. Impact théorique: Fournit un résultat positif important au domaine de l'IA explicable formelle, rompant avec la tendance dominante de la littérature axée sur les résultats de difficulté
  2. Inspiration méthodologique: Les techniques de randomisation et de relaxation peuvent inspirer la résolution d'autres problèmes difficiles
  3. Valeur pratique: Fournit une base théorique pour l'explicabilité des modèles linéaires

Scénarios d'Application

  1. Gestion des risques financiers: Explication des modèles de notation linéaires pour les décisions de prêt
  2. Diagnostic médical: Explication des évaluations de risque basées sur la régression linéaire
  3. Systèmes de recommandation: Analyse de l'importance des caractéristiques dans les modèles de recommandation linéaires
  4. Conformité juridique: Explications de décisions automatisées avec garanties mathématiques

Références

  1. Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
  2. Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
  3. Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
  4. Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
  5. Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

Cet article apporte une contribution théorique importante au domaine de l'IA explicable formelle, en prouvant pour la première fois la traitabilité des explications probabilistes sur les modèles linéaires, fournissant un résultat positif rare dans ce domaine. Bien qu'il y ait encore place à l'amélioration en termes de praticité, sa valeur théorique et son innovation méthodologique en font un travail important dans le domaine.