2025-11-15T14:04:11.886865

Probabilistic Explanations for Linear Models

Subercaseaux, Arenas, Meel

Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $Î´\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $Î´$-sufficient reasons ($Î´$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $Î´$-SRs unlikely. We propose the notion of $(Î´, Îµ)$-SR, a simple relaxation of $Î´$-SRs, and show that this kind of explanation can be computed efficiently over linear models.

academic

Explications Probabilistes pour les Modèles Linéaires

Informations Fondamentales

ID de l'article: 2501.00154
Titre: Probabilistic Explanations for Linear Models
Auteurs: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
Classification: cs.AI (Intelligence Artificielle), cs.CC (Complexité Computationnelle)
Date de publication: 3 janvier 2025
Lien de l'article: https://arxiv.org/abs/2501.00154

Résumé

Cet article étudie le problème du calcul des « raisons suffisantes » dans l'IA explicable formelle (Formal XAI). Étant donné un modèle M et une instance d'entrée x, une raison suffisante est un sous-ensemble S de caractéristiques tel que toute instance z qui coïncide avec x sur S satisfait M(x)=M(z). Pour réduire la taille des raisons suffisantes, les auteurs considèrent une relaxation probabiliste : exiger que pour une instance aléatoire z coïncidant avec x sur l'ensemble de caractéristiques, la probabilité que M(x)=M(z) soit au moins δ∈(0,1]. Le calcul de petites δ-raisons suffisantes (δ-SRs) est théoriquement difficile, avec des résultats forts d'inapproximabilité même pour des modèles « explicables » comme les arbres de décision. Cet article propose le concept de (δ,ε)-SR, une relaxation simple des δ-SRs, et prouve que ces explications peuvent être calculées efficacement sur les modèles linéaires.

Contexte et Motivation de la Recherche

Problème central: Comment fournir des explications de petite taille avec des garanties mathématiques pour les décisions des modèles d'apprentissage automatique. Les raisons suffisantes traditionnelles exigent une certitude à 100%, ce qui entraîne souvent des explications trop grandes pour la compréhension humaine.
Importance du problème:
- Miller (1956) a montré que les explications dépassant 9 caractéristiques peuvent être trop grandes pour les humains
- Les études empiriques indiquent que les explications doivent être concises (Narayanan et al., 2018; Lage et al., 2019)
- Dans les applications pratiques, les utilisateurs se soucient davantage de la taille de l'explication que des petites variations des garanties probabilistes
Limitations des approches existantes:
- Le calcul des δ-SRs minimaux est NP-difficile même pour les arbres de décision
- Pour les modèles linéaires, le calcul exact des probabilités est #P-difficile
- Il existe des résultats forts d'inapproximabilité : impossible d'obtenir de bons rapports d'approximation en temps polynomial
Motivation de la recherche:
- Les utilisateurs sont plus sensibles à la taille de l'explication qu'aux petites variations des garanties probabilistes
- Nécessité de trouver un équilibre entre la traitabilité théorique et la praticité
- La structure particulière des modèles linéaires peut permettre des algorithmes efficaces

Contributions Principales

Proposition du concept de (δ,ε)-raison suffisante minimale: Une version relaxée permettant aux garanties probabilistes de varier dans l'intervalle δ-ε, δ+ε
Preuve de traitabilité sur les modèles linéaires: Algorithme en temps polynomial pour calculer (δ,ε)-min-SR, avec un temps d'exécution de Õ(n/ε²δ²)
Établissement de résultats de séparation théorique: Preuve que le problème reste difficile sur les arbres de décision, mettant en évidence la particularité des modèles linéaires
Preuve d'équivalence des minima locaux: Pour les modèles linéaires, chaque δ-SR localement minimal est un δ-SR minimalement inclus
Analyse de l'écart d'approximation: Preuve que les petites variations des paramètres probabilistes peuvent entraîner des différences exponentielles dans la taille de l'explication

Détails de la Méthode

Définition de la Tâche

Entrées:

Modèle linéaire $\mathcal{L} = (\mathbf{w}, \theta)$ , où $\mathbf{w} \in \mathbb{Q}^n$ , $\theta \in \mathbb{Q}$
Instance $\mathbf{x} \in \{0,1\}^n$
Seuil probabiliste $\delta \in (0,1)$ et tolérance d'erreur $\varepsilon \in (0,1)$

Sorties:

Valeur $\delta^* \in [\delta-\varepsilon, \delta+\varepsilon]$
Raison suffisante minimale $\delta^*$ notée $\mathbf{y}$

Contraintes:

$\mathcal{L}(\mathbf{x}) = 1$ si et seulement si $\mathbf{x} \cdot \mathbf{w} \geq \theta$
Instance partielle $\mathbf{y} \sqsubseteq \mathbf{x}$ utilisant $\star$ pour les valeurs inconnues

Architecture du Modèle

1. Mécanisme d'Évaluation des Caractéristiques

Pour un modèle linéaire $\mathcal{L} = (\mathbf{w}, \theta)$ et une instance $\mathbf{x}$ , le score de la caractéristique $i$ est défini par:

$s_i = w_i \cdot (2x_i - 1) \cdot (2\mathcal{L}(\mathbf{x}) - 1)$

Le signe du score indique si la caractéristique « aide » (+1) ou « nuit » (-1) à la classification, l'amplitude étant proportionnelle au poids de la caractéristique.

2. Sélection Gloutonne des Caractéristiques

Lemme clé: Pour un modèle linéaire, sous une distribution uniforme, la sélection des caractéristiques par ordre décroissant de score est optimale.

Spécifiquement, si $\mathbf{y}^{(0)}, \ldots, \mathbf{y}^{(n)}$ sont les instances partielles définies par les k caractéristiques de score le plus élevé, alors:

$\Pr_{z \sim U(\mathbf{y}^{(k+1)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})] \geq \Pr_{z \sim U(\mathbf{y}^{(k)})}[\mathcal{L}(z) = \mathcal{L}(\mathbf{x})]$

3. Estimation de Monte-Carlo

Utilisation de l'inégalité de Hoeffding pour l'estimation probabiliste:

Pour $m = \frac{\log 2n}{2\varepsilon^2\delta^2} \log\frac{2\log n}{\beta}$ échantillons, on a:

$\Pr[|\hat{p}(m) - p| \leq \varepsilon\delta/\log n] \geq 1 - \beta/\log n$

Points d'Innovation Technique

Seuil probabiliste aléatoire: L'algorithme choisit aléatoirement $\delta^* \sim U([\delta-\varepsilon, \delta+\varepsilon])$ , évitant ainsi les instances difficiles
Stratégie de recherche binaire: Exploitation de la monotonie probabiliste pour une recherche efficace
Relaxation des garanties théoriques: Obtention de complexité en temps polynomial tout en maintenant la praticité

Configuration Expérimentale

Description de l'Algorithme

Algorithme 1: LinearMonteCarloExplainer

Entrée: Modèle linéaire L, instance x, paramètres δ, ε, β
1. δ* ← Échantillonner uniformément de [δ-ε, δ+ε]
2. Calculer tous les scores de caractéristiques s_i
3. Construire la séquence d'instances partielles y^(0), ..., y^(n)
4. Définir le nombre d'échantillons m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Utiliser la recherche binaire pour trouver le minimum k tel que la probabilité estimée ≥ δ*
6. Retourner (δ*, y^(k*))

Analyse Théorique

Théorème principal: Étant donné un modèle linéaire $\mathcal{L}$ et une entrée $\mathbf{x}$ , on peut calculer (δ,ε)-min-SR en temps $\tilde{O}(\frac{n}{\varepsilon^2\delta^2})$ avec probabilité de succès $1-\beta$ .

Analyse de Complexité

Complexité temporelle: $O(\log n \cdot m \cdot n) = \tilde{O}(\frac{n}{\varepsilon^2\delta^2})$
Complexité spatiale: $O(n)$
Probabilité de succès: $1-\beta$

Résultats Expérimentaux

Résultats Principaux

Comparaison de traitabilité:
- Modèles linéaires: Solvable en temps polynomial
- Arbres de décision: Inapproximabilité forte (sauf si SAT peut être résolu en temps quasi-polynomial)
- Réseaux de neurones: NPPP-difficile
Vérification par exemples concrets:
- Exemple 2 montre qu'une 0.999999-SR peut être 251 fois plus petite que la plus petite 1-SR
- Exemple 3 valide la correction de la stratégie de sélection gloutonne

Découvertes Théoriques

Résultats de séparation: Preuve de l'avantage fondamental des modèles linéaires par rapport aux arbres de décision
Optimalité locale vs globale: Pour les modèles linéaires, chaque δ-SR localement minimal est un δ-SR minimalement inclus
Écart d'approximation: Les petites variations des paramètres probabilistes peuvent entraîner des différences de $\Omega(n^{1/2-\epsilon})$ dans la taille de l'explication

Analyse de Cas

Analyse détaillée de l'Exemple 3:

Instance: $\mathbf{x} = (1,0,0,1,1)$
Poids: $\mathbf{w} = (5,1,-3,2,-1)$ , seuil: $\theta = 5$
Scores de caractéristiques: $(5,-1,3,2,-1)$
Explication optimale à 2 caractéristiques: $\{1,3\}$ , probabilité 7/8

Travaux Connexes

Calcul des Raisons Suffisantes

Darwiche and Hirth (2020): Première formalisation du concept de raison suffisante
Barceló et al. (2020): Établissement d'une hiérarchie de complexité pour différentes classes de modèles
Arenas et al. (2022): Preuve de la difficulté des δ-SRs sur les arbres de décision

Explications Probabilistes

Wäldchen et al. (2021): Introduction du concept de δ-raison suffisante
Izza et al. (2023): Étude du calcul des explications probabilistes abdominales
Kozachinskiy (2023): Établissement des résultats d'inapproximabilité pour les arbres de décision

Explications de Modèles Linéaires

Marques-Silva et al. (2020): Étude des classificateurs linéaires comme le Naïve Bayes
Blanc et al. (2021): Petites explications relatives à la complexité des certificats

Conclusion et Discussion

Conclusions Principales

Percée théorique: Première preuve de la calculabilité en temps polynomial des explications probabilistes sur les modèles linéaires
Valeur pratique: Le concept (δ,ε)-SR améliore la praticité tout en maintenant les garanties théoriques
Séparation de modèles: Établissement d'une différence fondamentale entre les modèles linéaires et les arbres de décision dans la complexité du calcul des explications

Limitations

Efficacité pratique: Pour les données de haute dimension (comme n=500), le calcul reste coûteux quand ε=0.1, δ=0.01
Hypothèses de distribution: L'algorithme suppose une distribution uniforme; l'extension aux distributions produit nécessite de nouvelles techniques
Types de caractéristiques: Considère uniquement les caractéristiques binaires; les applications réelles nécessitent de traiter les caractéristiques continues et catégoriques

Directions Futures

Optimisation algorithmique: Réduction de la dépendance à 1/ε et 1/δ
Extension de distribution: Traitement des distributions produit et des distributions de caractéristiques plus générales
Types de caractéristiques: Extension aux « classificateurs linéaires étendus » avec types de caractéristiques mixtes
Langage de requête: Conception d'un langage de requête d'explications probabilistes déclaratif

Évaluation Approfondie

Points Forts

Contributions théoriques significatives:
- Première établissement de la traitabilité des explications probabilistes sur les modèles linéaires
- Analyse de complexité complète et conception d'algorithmes
- Preuve de résultats de séparation importants
Innovation méthodologique:
- Le concept (δ,ε)-SR équilibre élégamment théorie et praticité
- Les techniques de randomisation évitent efficacement les instances difficiles
- La preuve de la stratégie gloutonne est élégante et profonde
Analyse approfondie:
- Preuves mathématiques détaillées
- Considération de multiples mesures de complexité
- Connexions claires avec les travaux connexes

Insuffisances

Limitations de praticité:
- L'algorithme est sensible aux paramètres, avec une efficacité médiocre en haute dimension
- Applicable uniquement aux modèles linéaires avec caractéristiques binaires
- L'hypothèse de distribution uniforme est forte en pratique
Validation expérimentale insuffisante:
- Absence de validation expérimentale sur des ensembles de données à grande échelle
- Pas de comparaison avec les méthodes heuristiques existantes
- Les résultats théoriques nécessitent plus de soutien empirique
Problèmes d'extensibilité:
- Les défis techniques pour l'extension à des paramètres plus généraux sont importants
- L'applicabilité au pipeline ML pratique n'est pas claire

Impact

Impact théorique: Fournit un résultat positif important au domaine de l'IA explicable formelle, rompant avec la tendance dominante de la littérature axée sur les résultats de difficulté
Inspiration méthodologique: Les techniques de randomisation et de relaxation peuvent inspirer la résolution d'autres problèmes difficiles
Valeur pratique: Fournit une base théorique pour l'explicabilité des modèles linéaires

Scénarios d'Application

Gestion des risques financiers: Explication des modèles de notation linéaires pour les décisions de prêt
Diagnostic médical: Explication des évaluations de risque basées sur la régression linéaire
Systèmes de recommandation: Analyse de l'importance des caractéristiques dans les modèles de recommandation linéaires
Conformité juridique: Explications de décisions automatisées avec garanties mathématiques

Références

Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.

Cet article apporte une contribution théorique importante au domaine de l'IA explicable formelle, en prouvant pour la première fois la traitabilité des explications probabilistes sur les modèles linéaires, fournissant un résultat positif rare dans ce domaine. Bien qu'il y ait encore place à l'amélioration en termes de praticité, sa valeur théorique et son innovation méthodologique en font un travail important dans le domaine.