Formal XAI is an emerging field that focuses on providing explanations with mathematical guarantees for the decisions made by machine learning models. A significant amount of work in this area is centered on the computation of "sufficient reasons". Given a model $M$ and an input instance $\vec{x}$, a sufficient reason for the decision $M(\vec{x})$ is a subset $S$ of the features of $\vec{x}$ such that for any instance $\vec{z}$ that has the same values as $\vec{x}$ for every feature in $S$, it holds that $M(\vec{x}) = M(\vec{z})$. Intuitively, this means that the features in $S$ are sufficient to fully justify the classification of $\vec{x}$ by $M$. For sufficient reasons to be useful in practice, they should be as small as possible, and a natural way to reduce the size of sufficient reasons is to consider a probabilistic relaxation; the probability of $M(\vec{x}) = M(\vec{z})$ must be at least some value $δ\in (0,1]$, for a random instance $\vec{z}$ that coincides with $\vec{x}$ on the features in $S$. Computing small $δ$-sufficient reasons ($δ$-SRs) is known to be a theoretically hard problem; even over decision trees--traditionally deemed simple and interpretable models--strong inapproximability results make the efficient computation of small $δ$-SRs unlikely. We propose the notion of $(δ, ε)$-SR, a simple relaxation of $δ$-SRs, and show that this kind of explanation can be computed efficiently over linear models.
academic
Explications Probabilistes pour les Modèles Linéaires
Titre: Probabilistic Explanations for Linear Models
Auteurs: Bernardo Subercaseaux (Carnegie Mellon University), Marcelo Arenas (PUC Chile, IMFD Chile, RelationalAI), Kuldeep S. Meel (Georgia Institute of Technology, University of Toronto)
Cet article étudie le problème du calcul des « raisons suffisantes » dans l'IA explicable formelle (Formal XAI). Étant donné un modèle M et une instance d'entrée x, une raison suffisante est un sous-ensemble S de caractéristiques tel que toute instance z qui coïncide avec x sur S satisfait M(x)=M(z). Pour réduire la taille des raisons suffisantes, les auteurs considèrent une relaxation probabiliste : exiger que pour une instance aléatoire z coïncidant avec x sur l'ensemble de caractéristiques, la probabilité que M(x)=M(z) soit au moins δ∈(0,1]. Le calcul de petites δ-raisons suffisantes (δ-SRs) est théoriquement difficile, avec des résultats forts d'inapproximabilité même pour des modèles « explicables » comme les arbres de décision. Cet article propose le concept de (δ,ε)-SR, une relaxation simple des δ-SRs, et prouve que ces explications peuvent être calculées efficacement sur les modèles linéaires.
Problème central: Comment fournir des explications de petite taille avec des garanties mathématiques pour les décisions des modèles d'apprentissage automatique. Les raisons suffisantes traditionnelles exigent une certitude à 100%, ce qui entraîne souvent des explications trop grandes pour la compréhension humaine.
Importance du problème:
Miller (1956) a montré que les explications dépassant 9 caractéristiques peuvent être trop grandes pour les humains
Les études empiriques indiquent que les explications doivent être concises (Narayanan et al., 2018; Lage et al., 2019)
Dans les applications pratiques, les utilisateurs se soucient davantage de la taille de l'explication que des petites variations des garanties probabilistes
Limitations des approches existantes:
Le calcul des δ-SRs minimaux est NP-difficile même pour les arbres de décision
Pour les modèles linéaires, le calcul exact des probabilités est #P-difficile
Il existe des résultats forts d'inapproximabilité : impossible d'obtenir de bons rapports d'approximation en temps polynomial
Motivation de la recherche:
Les utilisateurs sont plus sensibles à la taille de l'explication qu'aux petites variations des garanties probabilistes
Nécessité de trouver un équilibre entre la traitabilité théorique et la praticité
La structure particulière des modèles linéaires peut permettre des algorithmes efficaces
Proposition du concept de (δ,ε)-raison suffisante minimale: Une version relaxée permettant aux garanties probabilistes de varier dans l'intervalle δ-ε, δ+ε
Preuve de traitabilité sur les modèles linéaires: Algorithme en temps polynomial pour calculer (δ,ε)-min-SR, avec un temps d'exécution de Õ(n/ε²δ²)
Établissement de résultats de séparation théorique: Preuve que le problème reste difficile sur les arbres de décision, mettant en évidence la particularité des modèles linéaires
Preuve d'équivalence des minima locaux: Pour les modèles linéaires, chaque δ-SR localement minimal est un δ-SR minimalement inclus
Analyse de l'écart d'approximation: Preuve que les petites variations des paramètres probabilistes peuvent entraîner des différences exponentielles dans la taille de l'explication
Pour un modèle linéaire L=(w,θ) et une instance x, le score de la caractéristique i est défini par:
si=wi⋅(2xi−1)⋅(2L(x)−1)
Le signe du score indique si la caractéristique « aide » (+1) ou « nuit » (-1) à la classification, l'amplitude étant proportionnelle au poids de la caractéristique.
Entrée: Modèle linéaire L, instance x, paramètres δ, ε, β
1. δ* ← Échantillonner uniformément de [δ-ε, δ+ε]
2. Calculer tous les scores de caractéristiques s_i
3. Construire la séquence d'instances partielles y^(0), ..., y^(n)
4. Définir le nombre d'échantillons m = (log 2n)/(2ε²δ²) log(2log n/β)
5. Utiliser la recherche binaire pour trouver le minimum k tel que la probabilité estimée ≥ δ*
6. Retourner (δ*, y^(k*))
Théorème principal: Étant donné un modèle linéaire L et une entrée x, on peut calculer (δ,ε)-min-SR en temps O~(ε2δ2n) avec probabilité de succès 1−β.
Résultats de séparation: Preuve de l'avantage fondamental des modèles linéaires par rapport aux arbres de décision
Optimalité locale vs globale: Pour les modèles linéaires, chaque δ-SR localement minimal est un δ-SR minimalement inclus
Écart d'approximation: Les petites variations des paramètres probabilistes peuvent entraîner des différences de Ω(n1/2−ϵ) dans la taille de l'explication
Percée théorique: Première preuve de la calculabilité en temps polynomial des explications probabilistes sur les modèles linéaires
Valeur pratique: Le concept (δ,ε)-SR améliore la praticité tout en maintenant les garanties théoriques
Séparation de modèles: Établissement d'une différence fondamentale entre les modèles linéaires et les arbres de décision dans la complexité du calcul des explications
Efficacité pratique: Pour les données de haute dimension (comme n=500), le calcul reste coûteux quand ε=0.1, δ=0.01
Hypothèses de distribution: L'algorithme suppose une distribution uniforme; l'extension aux distributions produit nécessite de nouvelles techniques
Types de caractéristiques: Considère uniquement les caractéristiques binaires; les applications réelles nécessitent de traiter les caractéristiques continues et catégoriques
Impact théorique: Fournit un résultat positif important au domaine de l'IA explicable formelle, rompant avec la tendance dominante de la littérature axée sur les résultats de difficulté
Inspiration méthodologique: Les techniques de randomisation et de relaxation peuvent inspirer la résolution d'autres problèmes difficiles
Valeur pratique: Fournit une base théorique pour l'explicabilité des modèles linéaires
Darwiche, A. and Hirth, A. (2020). On the Reasons Behind Decisions. ECAI 2020.
Barceló, P., Monet, M., Pérez, J., and Subercaseaux, B. (2020). Model interpretability through the lens of computational complexity. NeurIPS 2020.
Wäldchen, S., MacDonald, J., Hauch, S., and Kutyniok, G. (2021). The computational complexity of understanding binary classifier decisions. JAIR.
Arenas, M., Barceló, P., Romero Orth, M., and Subercaseaux, B. (2022). On computing probabilistic explanations for decision trees. NeurIPS 2022.
Kozachinskiy, A. (2023). Inapproximability of sufficient reasons for decision trees. arXiv:2304.02781.
Cet article apporte une contribution théorique importante au domaine de l'IA explicable formelle, en prouvant pour la première fois la traitabilité des explications probabilistes sur les modèles linéaires, fournissant un résultat positif rare dans ce domaine. Bien qu'il y ait encore place à l'amélioration en termes de praticité, sa valeur théorique et son innovation méthodologique en font un travail important dans le domaine.