The Interpretable and Effective Graph Neural Additive Networks
Bechler-Speicher, Globerson, Gilad-Bachrach
Graph Neural Networks (GNNs) have emerged as the predominant approach for learning over graph-structured data. However, most GNNs operate as black-box models and require post-hoc explanations, which may not suffice in high-stakes scenarios where transparency is crucial. In this paper, we present a GNN that is interpretable by design. Our model, Graph Neural Additive Network (GNAN), is a novel extension of the interpretable class of Generalized Additive Models, and can be visualized and fully understood by humans. GNAN is designed to be fully interpretable, offering both global and local explanations at the feature and graph levels through direct visualization of the model. These visualizations describe exactly how the model uses the relationships between the target variable, the features, and the graph. We demonstrate the intelligibility of GNANs in a series of examples on different tasks and datasets. In addition, we show that the accuracy of GNAN is on par with black-box GNNs, making it suitable for critical applications where transparency is essential, alongside high accuracy.
academic
Die interpretierbaren und effektiven Graph Neural Additive Networks
Graphische neuronale Netze (GNNs) sind zur Standardmethode für das Lernen auf graphstrukturierten Daten geworden, aber die meisten GNNs funktionieren als Black-Box-Modelle und erfordern nachträgliche Erklärungen, was in hochriskanten Szenarien, die Transparenz erfordern, möglicherweise nicht ausreichend ist. Dieses Papier präsentiert ein von Grund auf interpretierbares GNN-Modell – Graph Neural Additive Networks (GNAN) – eine neue Erweiterung der Klasse der interpretierbaren verallgemeinerten additiven Modelle, die von Menschen visualisiert und vollständig verstanden werden können. GNAN bietet globale und lokale Erklärungen auf Merkmals- und Graphebene, die durch direkte Visualisierung des Modells beschreiben, wie das Modell Zielvariabler, Merkmale und Beziehungen zwischen Graphen nutzt. Experimente zeigen, dass die Genauigkeit von GNAN mit Black-Box-GNNs vergleichbar ist und sich für kritische Anwendungen eignet, die Transparenz und hohe Genauigkeit erfordern.
Kernproblem: Bestehende GNNs mangelt es an Interpretierbarkeit, was ihre Anwendung in hochriskanten Bereichen wie Medizin, Finanzen und Strafjustiz einschränkt
Transparenzanforderungen: Vorschriften wie die EU-DSGVO und das AI-Gesetz erfordern Transparenz bei hochriskanten KI-Systemen
Einschränkungen bestehender Erklärungsmethoden:
Nachträgliche Erklärungsmethoden (z. B. SHAP, LIME) bieten keine Korrektheitszusicherungen
Lokale Erklärungen können mit globalen Erklärungen inkonsistent sein
Können keine vollständige Modellbeschreibung liefern
Interpretierbarkeit vs. Genauigkeit: Die traditionelle Ansicht besagt, dass interpretierbare Modelle typischerweise eine geringere Genauigkeit aufweisen; dieses Papier stellt diese Ansicht in Frage
Interpretierbarkeit durch Design: Im Vergleich zu nachträglichen Erklärungen sind von Grund auf interpretierbare Modelle zuverlässiger
Einhaltung von Vorschriften: Erfüllung zunehmend strenger KI-Transparenzvorschriften
Vorteil bei Langreichweiten-Aufgaben: GNAN zeigt hervorragende Leistung bei der Vorhersage von Langreichweiten-Moleküleigenschaften und validiert die Vorteile des globalen Informationsflusses
Leistungserhaltung: Trotz begrenzter Kapazität ist die Leistung von GNAN mit komplexeren GNNs vergleichbar
Ying et al. (2019): GNNExplainer – Nachträgliche Erklärungsmethode für GNNs
Rudin (2019): Debatte zwischen interpretierbaren Modellen und Black-Box-Erklärungen
Zusammenfassung: Das in diesem Papier vorgeschlagene GNAN ist ein wichtiger Beitrag im Bereich der interpretierbaren KI und beweist erfolgreich, dass Interpretierbarkeit und Genauigkeit bei Graphenlernaufgaben erreicht werden können. Trotz theoretischer Einschränkungen der Ausdrucksfähigkeit macht sein praktischer Wert, besonders in hochriskanten Szenarien, die Transparenz erfordern, es zu einem wichtigen Fortschritt in diesem Bereich.