The Interpretable and Effective Graph Neural Additive Networks
Bechler-Speicher, Globerson, Gilad-Bachrach
Graph Neural Networks (GNNs) have emerged as the predominant approach for learning over graph-structured data. However, most GNNs operate as black-box models and require post-hoc explanations, which may not suffice in high-stakes scenarios where transparency is crucial. In this paper, we present a GNN that is interpretable by design. Our model, Graph Neural Additive Network (GNAN), is a novel extension of the interpretable class of Generalized Additive Models, and can be visualized and fully understood by humans. GNAN is designed to be fully interpretable, offering both global and local explanations at the feature and graph levels through direct visualization of the model. These visualizations describe exactly how the model uses the relationships between the target variable, the features, and the graph. We demonstrate the intelligibility of GNANs in a series of examples on different tasks and datasets. In addition, we show that the accuracy of GNAN is on par with black-box GNNs, making it suitable for critical applications where transparency is essential, alongside high accuracy.
academic
Les Réseaux de Neurones Graphiques Additifs Interprétables et Efficaces
Les réseaux de neurones graphiques (GNNs) sont devenus la méthode prédominante pour l'apprentissage sur données structurées en graphes, mais la plupart des GNNs fonctionnent comme des modèles de boîte noire nécessitant des explications a posteriori, ce qui peut s'avérer insuffisant dans les scénarios à haut risque exigeant de la transparence. Cet article propose un modèle GNN conçu pour être intrinsèquement interprétable — les Réseaux de Neurones Graphiques Additifs (GNAN) — une nouvelle extension de la classe des modèles additifs généralisés interprétables, qui peut être visualisée et entièrement comprise par les humains. GNAN fournit des explications globales et locales au niveau des caractéristiques et du graphe, décrivant par la visualisation directe du modèle comment celui-ci utilise les variables cibles, les caractéristiques et les relations au sein du graphe. Les expériences démontrent que la précision de GNAN est comparable à celle des GNNs de boîte noire, le rendant applicable aux applications critiques nécessitant à la fois transparence et haute précision.
Problème central: Les GNNs existants manquent d'interprétabilité, limitant leur application dans les domaines à haut risque tels que la médecine, la finance et la justice pénale
Exigences de transparence: Les réglementations telles que le RGPD de l'UE et la Loi sur l'IA exigent que les systèmes d'IA à haut risque possèdent une transparence
Limitations des méthodes d'explication existantes:
Les méthodes d'explication a posteriori (telles que SHAP, LIME) manquent de garanties de correction
Les explications locales et globales peuvent être incohérentes
Incapacité à fournir une description complète du modèle
Interprétabilité vs Précision: La conception traditionnelle suppose que les modèles interprétables ont généralement une précision inférieure; cet article remet en question cette hypothèse
Interprétabilité par conception: Comparé aux explications a posteriori, les modèles interprétables par conception sont plus fiables
Conformité réglementaire: Satisfaire aux exigences croissantes de transparence de l'IA
Contribution théorique: Extension des modèles additifs généralisés (GAMs) aux données graphiques, proposant l'architecture GNAN
Contribution méthodologique: Conception d'un modèle de prédiction graphique entièrement interprétable, offrant des capacités d'explication globales et locales
Contribution empirique: Démonstration que GNAN obtient des performances comparables aux GNNs de boîte noire sur plusieurs ensembles de données réels
Contribution pratique: Fourniture de capacités de débogage et de validation de modèle directement visualisables
GNAN génère des représentations de nœuds en apprenant une fonction de distance ρ(x;θ): ℝ → ℝ et des fonctions de forme de caractéristiques {fk}^d_, fk(x;θk): ℝ → ℝ.
Prédiction au niveau des nœuds: σ(Σ(k=1 to d)[hi]k)
Prédiction au niveau du graphe: D'abord obtenir la représentation du graphe h = Σ(i=1 to N)hi via pooling par sommation, puis calculer σ(Σ(k=1 to d)[h]k)
Pour la classification en C classes, les fonctions de caractéristiques et de distance produisent des vecteurs de dimension C, combinés via multiplication élément par élément:
[hi]k = Σ(j=1 to N) [1/#disti(j,i)] · ρ(1/(1+dist(j,i))) ⊙ fk([xj]k)
Avantage sur tâches longue portée: GNAN excelle dans les tâches de prédiction de propriétés moléculaires longue portée, validant l'avantage du flux d'information global
Maintien des performances: Malgré une capacité limitée, les performances de GNAN sont comparables aux GNNs plus complexes
Efficacité computationnelle: Évite le passage de messages itératif, réduisant les goulots d'étranglement computationnels
Hastie & Tibshirani (1986): Théorie fondamentale des Modèles Additifs Généralisés
Agarwal et al. (2021): Modèles Additifs Neuraux
Ying et al. (2019): GNNExplainer - Méthode d'explication a posteriori pour GNNs
Rudin (2019): Débat entre modèles interprétables et explications de boîtes noires
Résumé: L'article proposant GNAN constitue une contribution importante au domaine de l'IA interprétable, démontrant avec succès qu'interprétabilité et précision peuvent être conciliées dans les tâches d'apprentissage graphique. Bien qu'il existe des limitations théoriques de la capacité d'expression, sa valeur dans les applications pratiques, particulièrement dans les scénarios à haut risque exigeant de la transparence, en fait un progrès important dans ce domaine.