The Interpretable and Effective Graph Neural Additive Networks
Bechler-Speicher, Globerson, Gilad-Bachrach
Graph Neural Networks (GNNs) have emerged as the predominant approach for learning over graph-structured data. However, most GNNs operate as black-box models and require post-hoc explanations, which may not suffice in high-stakes scenarios where transparency is crucial. In this paper, we present a GNN that is interpretable by design. Our model, Graph Neural Additive Network (GNAN), is a novel extension of the interpretable class of Generalized Additive Models, and can be visualized and fully understood by humans. GNAN is designed to be fully interpretable, offering both global and local explanations at the feature and graph levels through direct visualization of the model. These visualizations describe exactly how the model uses the relationships between the target variable, the features, and the graph. We demonstrate the intelligibility of GNANs in a series of examples on different tasks and datasets. In addition, we show that the accuracy of GNAN is on par with black-box GNNs, making it suitable for critical applications where transparency is essential, alongside high accuracy.
academic
Las Redes Neurales Aditivas de Grafos Interpretables y Efectivas
Las redes neurales de grafos (GNNs) se han convertido en el método predominante para el aprendizaje en datos con estructura de grafos, pero la mayoría de las GNNs funcionan como modelos de caja negra que requieren explicaciones posteriores, lo cual puede ser insuficiente en escenarios de alto riesgo que demandan transparencia. Este artículo propone un modelo GNN interpretable por diseño —Redes Neurales Aditivas de Grafos (GNAN)—, una nueva extensión de la clase de modelos aditivos generalizados interpretables que puede ser visualizada y comprendida completamente por humanos. GNAN proporciona explicaciones globales y locales a nivel de características y a nivel de grafo, describiendo mediante visualización directa del modelo cómo utiliza las relaciones entre variables objetivo, características y grafos. Los experimentos demuestran que la precisión de GNAN es comparable a la de las GNNs de caja negra, siendo aplicable a aplicaciones críticas que requieren transparencia y alta precisión.
Problema Central: Las GNNs existentes carecen de interpretabilidad, limitando su aplicación en dominios de alto riesgo como medicina, finanzas y justicia penal
Requisitos de Transparencia: Regulaciones como el RGPD de la Unión Europea y la Ley de IA requieren transparencia en sistemas de IA de alto riesgo
Limitaciones de Métodos de Explicación Existentes:
Los métodos de explicación posteriores (como SHAP, LIME) carecen de garantías de corrección
Las explicaciones locales pueden ser inconsistentes con las explicaciones globales
No pueden proporcionar una descripción completa del modelo
Interpretabilidad vs. Precisión: La opinión tradicional sostiene que los modelos interpretables generalmente tienen menor precisión; este trabajo desafía esta noción
Interpretabilidad por Diseño: Los modelos interpretables por diseño son más confiables que las explicaciones posteriores
Cumplimiento Normativo: Satisfacer requisitos cada vez más estrictos de transparencia en IA
GNAN genera representaciones de nodos mediante el aprendizaje de una función de distancia ρ(x;θ): ℝ → ℝ y funciones de forma de características {fk}^d_, fk(x;θk): ℝ → ℝ.
Para clasificación con C clases, las funciones de características y de distancia producen vectores de dimensión C, combinados mediante multiplicación elemento a elemento:
[hi]k = Σ(j=1 a N) [1/#disti(j,i)] · ρ(1/(1+dist(j,i))) ⊙ fk([xj]k)
Ventaja en Tareas de Largo Alcance: GNAN destaca en tareas de predicción de propiedades moleculares de largo alcance, validando las ventajas del flujo de información global
Mantenimiento de Desempeño: A pesar de capacidad limitada, GNAN logra desempeño comparable a GNNs más complejas
Eficiencia Computacional: Evita paso de mensajes iterativo, reduciendo cuellos de botella computacionales
Hastie & Tibshirani (1986): Teoría fundamental de Modelos Aditivos Generalizados
Agarwal et al. (2021): Modelos Aditivos Neurales
Ying et al. (2019): GNNExplainer - Método de explicación posterior para GNNs
Rudin (2019): Debate entre modelos interpretables vs. explicaciones de cajas negras
Resumen: El GNAN propuesto en este artículo es una contribución importante en el campo de la IA interpretable, demostrando exitosamente que la interpretabilidad y la precisión pueden coexistir en tareas de aprendizaje en grafos. Aunque existen limitaciones teóricas en capacidad expresiva, su valor en aplicaciones prácticas, particularmente en escenarios de alto riesgo que demandan transparencia, lo convierte en un progreso importante en este campo.