The Interpretable and Effective Graph Neural Additive Networks
Bechler-Speicher, Globerson, Gilad-Bachrach
Graph Neural Networks (GNNs) have emerged as the predominant approach for learning over graph-structured data. However, most GNNs operate as black-box models and require post-hoc explanations, which may not suffice in high-stakes scenarios where transparency is crucial. In this paper, we present a GNN that is interpretable by design. Our model, Graph Neural Additive Network (GNAN), is a novel extension of the interpretable class of Generalized Additive Models, and can be visualized and fully understood by humans. GNAN is designed to be fully interpretable, offering both global and local explanations at the feature and graph levels through direct visualization of the model. These visualizations describe exactly how the model uses the relationships between the target variable, the features, and the graph. We demonstrate the intelligibility of GNANs in a series of examples on different tasks and datasets. In addition, we show that the accuracy of GNAN is on par with black-box GNNs, making it suitable for critical applications where transparency is essential, alongside high accuracy.
academic
Le Reti Neurali Additive su Grafi Interpretabili ed Efficaci
Le reti neurali su grafi (GNNs) sono diventate il metodo predominante per l'apprendimento su dati strutturati in forma di grafo, tuttavia la maggior parte delle GNNs funziona come modelli black-box che richiedono interpretazioni post-hoc, il che potrebbe risultare insufficiente in scenari ad alto rischio che richiedono trasparenza. Questo articolo propone un modello GNN interpretabile per progettazione—le Reti Neurali Additive su Grafi (GNAN)—una nuova estensione della classe di modelli additivi generalizzati interpretabili, che può essere visualizzata e completamente compresa dagli esseri umani. GNAN fornisce spiegazioni globali e locali a livello di caratteristiche e di grafo, descrivendo attraverso la visualizzazione diretta del modello come vengono utilizzate le relazioni tra variabili target, caratteristiche e grafo. Gli esperimenti dimostrano che l'accuratezza di GNAN è comparabile alle GNNs black-box, rendendola adatta ad applicazioni critiche che richiedono trasparenza e elevata accuratezza.
Problema Centrale: Le GNNs esistenti mancano di interpretabilità, limitando le applicazioni in settori ad alto rischio come medicina, finanza e giustizia penale
Requisiti di Trasparenza: Normative come il GDPR dell'UE e l'AI Act richiedono trasparenza per i sistemi di IA ad alto rischio
Limitazioni dei Metodi di Spiegazione Esistenti:
I metodi di spiegazione post-hoc (come SHAP, LIME) mancano di garanzie di correttezza
Le spiegazioni locali possono essere incoerenti con quelle globali
Impossibilità di fornire una descrizione completa del modello
Interpretabilità vs Accuratezza: L'opinione tradizionale sostiene che i modelli interpretabili hanno generalmente minore accuratezza; questo articolo sfida tale assunto
Interpretabilità per Progettazione: Rispetto alle spiegazioni post-hoc, i modelli interpretabili per progettazione sono più affidabili
Conformità Normativa: Soddisfare i requisiti sempre più rigorosi di trasparenza dell'IA
GNAN genera rappresentazioni di nodi attraverso l'apprendimento di una funzione di distanza ρ(x;θ): ℝ → ℝ e di funzioni di forma delle caratteristiche {fk}^d_, fk(x;θk): ℝ → ℝ.
Previsione a Livello di Grafo: prima ottenere la rappresentazione del grafo attraverso pooling per somma h = Σ(i=1 to N)hi, quindi calcolare σ(Σ(k=1 to d)[h]k)
Per classificazione con C classi, le funzioni di caratteristica e di distanza producono vettori C-dimensionali, combinati mediante moltiplicazione elemento-wise:
[hi]k = Σ(j=1 to N) [1/#disti(j,i)] · ρ(1/(1+dist(j,i))) ⊙ fk([xj]k)
Vantaggi nei Compiti a Lungo Raggio: GNAN eccelle nella previsione di proprietà molecolari a lungo raggio, convalidando i vantaggi del flusso di informazioni globale
Mantenimento delle Prestazioni: Nonostante la capacità limitata, le prestazioni di GNAN sono comparabili a GNNs più complesse
Efficienza Computazionale: Evita il passaggio di messaggi iterativo, riducendo i colli di bottiglia computazionali
Hastie & Tibshirani (1986): Teoria fondamentale dei Modelli Additivi Generalizzati
Agarwal et al. (2021): Neural Additive Models
Ying et al. (2019): GNNExplainer - metodo di spiegazione post-hoc per GNNs
Rudin (2019): Dibattito tra modelli interpretabili e spiegazioni di modelli black-box
Sintesi: Il GNAN proposto in questo articolo rappresenta un importante contributo nel campo dell'IA interpretabile, dimostrando con successo la possibilità di ottenere sia interpretabilità che accuratezza nei compiti di apprendimento su grafi. Sebbene esistano limitazioni teoriche nella capacità espressiva, il suo valore nelle applicazioni pratiche, in particolare negli scenari ad alto rischio che richiedono trasparenza, lo rende un importante progresso in questo campo.