2025-11-21T04:31:15.286585

Lecture Notes on Verifying Graph Neural Networks

Schwarzentruber

In these lecture notes, we first recall the connection between graph neural networks, Weisfeiler-Lehman tests and logics such as first-order logic and graded modal logic. We then present a modal logic in which counting modalities appear in linear inequalities in order to solve verification tasks on graph neural networks. We describe an algorithm for the satisfiability problem of that logic. It is inspired from the tableau method of vanilla modal logic, extended with reasoning in quantifier-free fragment Boolean algebra with Presburger arithmetic.

academic

Notes de Cours sur la Vérification des Réseaux de Neurones Graphiques

Informations Fondamentales

ID de l'article: 2510.11617
Titre: Lecture Notes on Verifying Graph Neural Networks
Auteur: François Schwarzentruber (ENS de Lyon)
Classification: cs.LO (Logique en Informatique), cs.LG (Apprentissage Automatique)
Date de publication: 14 octobre 2025
Lien de l'article: https://arxiv.org/abs/2510.11617

Résumé

Ces notes de cours examinent d'abord les connexions entre les réseaux de neurones graphiques, le test de Weisfeiler-Lehman et la logique du premier ordre, ainsi que les systèmes logiques modaux hiérarchisés. Elles proposent ensuite une logique modale dans laquelle les modalités de comptage apparaissent dans des inégalités linéaires, pour résoudre les tâches de vérification des réseaux de neurones graphiques. Un algorithme pour le problème de satisfiabilité de cette logique est décrit, inspiré par les méthodes de tableaux traditionnelles de la logique modale, et étendant le raisonnement sur les fragments sans quantificateurs de l'algèbre booléenne et l'arithmétique de Presburger.

Contexte de Recherche et Motivation

Contexte du Problème

Les réseaux de neurones graphiques (GNNs) ont été largement appliqués dans les recommandations de réseaux sociaux, les graphes de connaissances, l'analyse de molécules chimiques, la découverte de médicaments et d'autres domaines. Cependant, le problème de la vérification des GNNs fait face à des défis majeurs :

Limitations de capacité expressive: La capacité expressive des GNNs est limitée par le test 1-WL (Weisfeiler-Lehman), incapable de distinguer certains graphes non isomorphes
Complexité des tâches de vérification: Nécessité de vérifier si un GNN satisfait des spécifications particulières, telles que les propriétés de sécurité et de correction
Fondations théoriques insuffisantes: Absence de cadre logique systématique pour décrire et vérifier le comportement des GNNs

Motivation de la Recherche

Besoins pratiques: Dans les applications critiques pour la sécurité, il est nécessaire d'assurer la fiabilité et la correction des GNNs
Lacunes théoriques: Les méthodes de vérification existantes manquent d'une base théorique logique unifiée
Défis techniques: Nécessité de traiter les opérations d'agrégation et les contraintes de comptage dans les GNNs

Contributions Principales

Établissement de connexions théoriques: Exposition systématique des connexions profondes entre les GNNs, le test de Weisfeiler-Lehman et les systèmes logiques (FO, FOC, GML)
Proposition de la logique K#: Conception d'une nouvelle logique modale K# capable d'exprimer les opérations de comptage et d'agrégation des GNNs
Conception d'algorithmes: Développement d'un algorithme PSPACE pour le problème de satisfiabilité de la logique K#, basé sur les méthodes de tableaux et le raisonnement QFBAPA
Analyse de complexité: Preuve des limites de complexité computationnelle des problèmes de vérification des GNNs sous différentes fonctions d'activation
Cadre pratique: Fourniture d'un cadre complet pour réduire les tâches de vérification des GNNs aux problèmes de satisfiabilité logique

Détails de la Méthode

Définition des Tâches

Les tâches principales de vérification des GNNs incluent :

Satisfiabilité: Étant donné un GNN N, existe-t-il une entrée pour laquelle sa sortie est positive ?
Vérification de spécification: Un GNN satisfait-il une spécification logique donnée φ ?
Vérification d'équivalence: Deux GNNs sont-ils équivalents sur toutes les entrées ?

Architecture de la Logique K#

Définition Syntaxique

φ ::= p | ¬φ | φ ∨ φ | ξ ≥ 0
ξ ::= c | 1φ | #φ | ξ + ξ | c × ξ

Définition Sémantique

1φ: Vaut 1 si φ est vrai, 0 sinon
#φ: Compte le nombre de nœuds successeurs satisfaisant φ
Expressions linéaires: Support de l'addition et de la multiplication scalaire

Caractéristiques Clés

Capacité expressive: La logique K# contient la logique modale hiérarchisée (GML) comme sous-ensemble
Relation de correspondance: Existence d'une traduction bidirectionnelle en temps polynomial avec les GNNs truncReLU
Contraintes de comptage: Capacité à exprimer des relations de comptage complexes et des opérations d'agrégation

Correspondance GNN-K#

De K# vers GNN

tr(xi = 1) = xi
tr(¬φ) = 1 - truncReLU(tr(φ))
tr(φ ∧ ψ) = truncReLU(tr(φ) + tr(ψ) - 1)
tr(#φ) = agg(tr(φ))

De GNN vers K#

tr'(truncReLU(ϑ)) = 1tr'(ϑ)≥1
tr'(agg(ϑ)) = #(tr'(ϑ) ≥ 1)

Algorithme de Satisfiabilité

Fondements QFBAPA

Utilisation de l'algèbre booléenne quantifiée librement et de l'arithmétique de Presburger (QFBAPA) pour traiter les contraintes de comptage :

Technique des diagrammes de Venn: Conversion des expressions d'ensemble en variables de région
Limite de Carathéodory: Preuve que seul un nombre polynomial de régions non nulles doit être considéré
Complexité NP: Le problème de satisfiabilité QFBAPA est dans NP

Algorithme de Tableaux K#

procédure satK#(Γ)
  Traiter les règles booléennes et les constructions 1φ
  Extraire les contraintes d'inégalités linéaires S
  Deviner les régions non nulles B ⊆ {0,1}d, |B| ≤ 2d log₂(4d)
  Remplacer #ψᵢ par ∑ρ∈B|ρᵢ=1 sρ
  Vérifier la satisfiabilité QFPA
  Vérifier récursivement chaque région

Configuration Expérimentale

Vérification Théorique

L'article procède principalement à une analyse théorique, vérifiant par preuve constructive :

Correction: Correction et complétude de l'algorithme
Complexité: Limites de complexité temporelle et spatiale
Capacité expressive: Relations de capacité expressive entre différents fragments logiques

Résultats de Complexité

Fonction d'activation	Graphes dirigés	Graphes non dirigés
truncReLU	PSPACE-complet	PSPACE-complet
ReLU	NEXPTIME-complet	Indécidable
truncReLU avec lecture globale	NEXPTIME-complet	Indécidable

Résultats Expérimentaux

Résultats Théoriques Principaux

Relations de Capacité Expressive

cr(G,u) = cr(G',u') ⟺ G,u et G',u' satisfont les mêmes formules GML
GML ⊆ K# ⊆ FOC₂
K# est strictement plus puissant que FO

Limites de Complexité

Satisfiabilité K#: PSPACE-complet
Vérification GNN truncReLU: PSPACE-complet
Vérification GNN ReLU: NEXPTIME-complet
Lecture globale: Conduit à l'indécidabilité (cas des graphes non dirigés)

Efficacité de l'Algorithme

Complexité spatiale: Espace polynomial
Nombre de régions: Au maximum 2d log₂(4d) régions non nulles
Surcharge de traduction: Temps polynomial (cas des poids entiers)

Perspectives Techniques

Connexion Weisfeiler-Lehman

L'algorithme de raffinage des couleurs capture le modèle de calcul essentiel des GNNs
La hiérarchie k-WL correspond à la capacité expressive des GNNs d'ordre différent
La logique modale fournit un langage naturel pour décrire cette hiérarchie

Traitement des Contraintes de Comptage

QFBAPA fournit un cadre efficace pour traiter les opérations d'agrégation
La technique des diagrammes de Venn simplifie les contraintes de comptage complexes en programmation linéaire
La limite de Carathéodory assure la complexité spatiale polynomiale de l'algorithme

Travaux Connexes

Fondations Théoriques des GNNs

Capacité expressive: Xu et al. (2019), Morris et al. (2019) établissent les connexions entre GNNs et test WL
Caractérisation logique: Barceló et al. (2020) établissent pour la première fois la correspondance entre GNNs et logique
Méthodes de vérification: Benedikt et al. (2024) proposent des procédures de décision, mais manquent d'un cadre unifié

Vérification de Logique Modale

Méthodes traditionnelles: Procédures de décision de logique modale basées sur les méthodes de tableaux
Extensions de comptage: Algorithmes de satisfiabilité de logique modale hiérarchisée
Théorie de complexité: Analyse de complexité des différents fragments de logique modale

Vérification de Réseaux de Neurones

Méthodes SMT: Utilisation de solveurs SMT pour vérifier les propriétés des réseaux de neurones
Interprétation abstraite: Analyse du comportement du réseau par domaines abstraits
Exécution symbolique: Exploration symbolique des chemins d'exécution du réseau

Conclusions et Discussion

Conclusions Principales

Unification théorique: Établissement d'un cadre théorique unifié pour les GNNs, le test WL et les systèmes logiques
Contributions algorithmiques: Fourniture d'algorithmes efficaces pour la vérification des GNNs, avec complexité optimale
Capacité expressive: La logique K# capture exactement la capacité computationnelle des GNNs truncReLU
Séparation de complexité: Les différentes fonctions d'activation entraînent des complexités de vérification significativement différentes

Limitations

Restriction des fonctions d'activation: Les résultats principaux se concentrent sur truncReLU, le cas ReLU étant plus complexe
Problèmes de quantification: Les poids rationnels nécessitent des dénominateurs communs de taille exponentielle
Complexité de mise en œuvre: La mise en œuvre pratique de l'algorithme fait face à des défis d'efficacité
Portée d'application: Principalement orienté vers les tâches de classification de nœuds, les tâches au niveau des graphes nécessitant des considérations supplémentaires

Directions Futures

Extension des fonctions d'activation: Recherche de méthodes de vérification pour des fonctions d'activation plus générales
Optimisation d'algorithmes: Amélioration de la performance pratique et de la scalabilité de l'algorithme
Développement d'outils: Développement d'outils pratiques de vérification des GNNs
Extension d'applications: Extension à d'autres architectures et types de tâches GNN

Évaluation Approfondie

Avantages

Profondeur théorique: Établissement de connexions théoriques profondes, comblant des lacunes théoriques importantes
Innovation méthodologique: La conception de la logique K# équilibre habilement la capacité expressive et la décidabilité
Élégance algorithmique: La combinaison des méthodes de tableaux et de QFBAPA est à la fois naturelle et efficace
Résultats complets: Fourniture d'une analyse de complexité complète et de preuves de correspondance
Valeur pédagogique: En tant que notes de cours, la structure est claire et appropriée pour l'apprentissage et l'enseignement

Insuffisances

Absence de vérification expérimentale: Manque de vérification expérimentale réelle et d'évaluation de performance
Détails d'implémentation: Discussion insuffisante des détails d'implémentation et des stratégies d'optimisation de l'algorithme
Cas d'application: Absence de scénarios d'application concrets et d'études de cas
Support d'outils: Absence d'outils de vérification disponibles ou de système prototype

Impact

Contribution théorique: Établissement d'une base théorique solide pour le domaine de la vérification des GNNs
Inspiration méthodologique: Fourniture d'orientations méthodologiques importantes pour les recherches ultérieures
Valeur éducative: En tant que matériel d'enseignement excellent, contribue à la formation de talents dans le domaine
Perspectives pratiques: Bien que fortement théorique, indique la direction du développement d'outils pratiques

Scénarios Applicables

Systèmes critiques pour la sécurité: Applications GNN nécessitant une vérification stricte
Recherche théorique: Analyse théorique de la capacité expressive et de la complexité des GNNs
Enseignement et formation: Enseignement des réseaux de neurones graphiques et de la vérification logique
Développement d'outils: Base théorique pour le développement d'outils de vérification des GNNs

Références

L'article cite 65 références importantes, couvrant :

Fondations théoriques des GNNs (Grohe 2021, Barceló et al. 2020)
Test de Weisfeiler-Lehman (Morris et al. 2019, Xu et al. 2019)
Logique modale (Blackburn et al. 2001, Tobies 1999)
Théorie de la complexité (Grädel et al. 1997, Kuncak and Rinard 2007)
Vérification de réseaux de neurones (Benedikt et al. 2024, Haase and Zetzsche 2019)

Évaluation Générale: Cet article est un excellent travail qui allie profondeur théorique et valeur pédagogique. Non seulement il résout d'importants problèmes théoriques de vérification des GNNs, mais il jette également les bases solides pour les recherches ultérieures et les applications pratiques. Bien qu'il manque de vérification expérimentale, l'importance de ses contributions théoriques ne peut être ignorée.