The Interpretable and Effective Graph Neural Additive Networks
Bechler-Speicher, Globerson, Gilad-Bachrach
Graph Neural Networks (GNNs) have emerged as the predominant approach for learning over graph-structured data. However, most GNNs operate as black-box models and require post-hoc explanations, which may not suffice in high-stakes scenarios where transparency is crucial. In this paper, we present a GNN that is interpretable by design. Our model, Graph Neural Additive Network (GNAN), is a novel extension of the interpretable class of Generalized Additive Models, and can be visualized and fully understood by humans. GNAN is designed to be fully interpretable, offering both global and local explanations at the feature and graph levels through direct visualization of the model. These visualizations describe exactly how the model uses the relationships between the target variable, the features, and the graph. We demonstrate the intelligibility of GNANs in a series of examples on different tasks and datasets. In addition, we show that the accuracy of GNAN is on par with black-box GNNs, making it suitable for critical applications where transparency is essential, alongside high accuracy.
academic
Интерпретируемые и эффективные графовые нейронные аддитивные сети
Графовые нейронные сети (GNNs) стали основным методом обучения на данных со структурой графа, однако большинство GNNs функционируют как чёрные ящики, требующие апостериорного объяснения, что может быть недостаточным в высокорисковых сценариях, требующих прозрачности. В данной работе предложена интерпретируемая по замыслу модель GNN — графовые нейронные аддитивные сети (GNAN), представляющие новое расширение класса интерпретируемых обобщённых аддитивных моделей, которые могут быть визуализированы и полностью поняты человеком. GNAN обеспечивает глобальные и локальные объяснения на уровне признаков и графа, описывая посредством прямой визуализации модели, как модель использует целевую переменную, признаки и отношения в графе. Экспериментальные результаты демонстрируют, что точность GNAN сопоставима с чёрными ящиками GNNs и применима к критическим приложениям, требующим прозрачности и высокой точности.
Основная проблема: существующие GNNs недостаточно интерпретируемы, их применение в высокорисковых областях (медицина, финансы, уголовное правосудие) ограничено
Требования к прозрачности: нормативные акты, такие как GDPR ЕС и Закон об искусственном интеллекте, требуют прозрачности высокорисковых систем ИИ
Ограничения существующих методов объяснения:
Апостериорные методы объяснения (например, SHAP, LIME) не гарантируют корректность
Локальные объяснения могут быть несогласованны с глобальными
Интерпретируемость vs точность: традиционное мнение предполагает, что интерпретируемые модели обычно менее точны; данная работа оспаривает это утверждение
Интерпретируемость по замыслу: модели, интерпретируемые по замыслу, более надёжны, чем апостериорно объясняемые
Нормативное соответствие: удовлетворение всё более строгих нормативных требований к прозрачности ИИ
Теоретический вклад: расширение обобщённых аддитивных моделей (GAMs) на графовые данные с предложением архитектуры GNAN
Методологический вклад: разработка полностью интерпретируемой модели предсказания на графах с возможностью глобального и локального объяснения
Эмпирический вклад: доказательство того, что GNAN демонстрирует производительность, сопоставимую с чёрными ящиками GNNs на множестве реальных наборов данных
Практический вклад: обеспечение возможности прямой визуализации для отладки и верификации модели
Предсказание на уровне графа: сначала получить представление графа через суммирующую пулинг-операцию h = Σ(i=1 to N)hi, затем вычислить σ(Σ(k=1 to d)[h]k)
Преимущество на долгодействующих задачах: GNAN показывает выдающиеся результаты на задачах предсказания долгодействующих молекулярных свойств, подтверждая преимущества глобального информационного потока
Сохранение производительности: несмотря на ограниченную ёмкость, производительность GNAN сопоставима с более сложными GNNs
Вычислительная эффективность: избегание итеративной передачи сообщений снижает вычислительные узкие места
Hastie & Tibshirani (1986): Фундаментальная теория обобщённых аддитивных моделей
Agarwal et al. (2021): Neural Additive Models
Ying et al. (2019): GNNExplainer — апостериорный метод объяснения GNN
Rudin (2019): Дискуссия об интерпретируемых моделях vs чёрных ящиках с объяснениями
Резюме: Предложенная в данной работе модель GNAN представляет собой важный вклад в область интерпретируемого ИИ, успешно доказывая возможность достижения как интерпретируемости, так и точности в задачах обучения на графах. Несмотря на теоретические ограничения выразительной способности, её практическая ценность, особенно в высокорисковых сценариях, требующих прозрачности, делает её важным прогрессом в данной области.