2025-11-21T04:31:15.286585

Lecture Notes on Verifying Graph Neural Networks

Schwarzentruber
In these lecture notes, we first recall the connection between graph neural networks, Weisfeiler-Lehman tests and logics such as first-order logic and graded modal logic. We then present a modal logic in which counting modalities appear in linear inequalities in order to solve verification tasks on graph neural networks. We describe an algorithm for the satisfiability problem of that logic. It is inspired from the tableau method of vanilla modal logic, extended with reasoning in quantifier-free fragment Boolean algebra with Presburger arithmetic.
academic

Notes de Cours sur la Vérification des Réseaux de Neurones Graphiques

Informations Fondamentales

  • ID de l'article: 2510.11617
  • Titre: Lecture Notes on Verifying Graph Neural Networks
  • Auteur: François Schwarzentruber (ENS de Lyon)
  • Classification: cs.LO (Logique en Informatique), cs.LG (Apprentissage Automatique)
  • Date de publication: 14 octobre 2025
  • Lien de l'article: https://arxiv.org/abs/2510.11617

Résumé

Ces notes de cours examinent d'abord les connexions entre les réseaux de neurones graphiques, le test de Weisfeiler-Lehman et la logique du premier ordre, ainsi que les systèmes logiques modaux hiérarchisés. Elles proposent ensuite une logique modale dans laquelle les modalités de comptage apparaissent dans des inégalités linéaires, pour résoudre les tâches de vérification des réseaux de neurones graphiques. Un algorithme pour le problème de satisfiabilité de cette logique est décrit, inspiré par les méthodes de tableaux traditionnelles de la logique modale, et étendant le raisonnement sur les fragments sans quantificateurs de l'algèbre booléenne et l'arithmétique de Presburger.

Contexte de Recherche et Motivation

Contexte du Problème

Les réseaux de neurones graphiques (GNNs) ont été largement appliqués dans les recommandations de réseaux sociaux, les graphes de connaissances, l'analyse de molécules chimiques, la découverte de médicaments et d'autres domaines. Cependant, le problème de la vérification des GNNs fait face à des défis majeurs :

  1. Limitations de capacité expressive: La capacité expressive des GNNs est limitée par le test 1-WL (Weisfeiler-Lehman), incapable de distinguer certains graphes non isomorphes
  2. Complexité des tâches de vérification: Nécessité de vérifier si un GNN satisfait des spécifications particulières, telles que les propriétés de sécurité et de correction
  3. Fondations théoriques insuffisantes: Absence de cadre logique systématique pour décrire et vérifier le comportement des GNNs

Motivation de la Recherche

  • Besoins pratiques: Dans les applications critiques pour la sécurité, il est nécessaire d'assurer la fiabilité et la correction des GNNs
  • Lacunes théoriques: Les méthodes de vérification existantes manquent d'une base théorique logique unifiée
  • Défis techniques: Nécessité de traiter les opérations d'agrégation et les contraintes de comptage dans les GNNs

Contributions Principales

  1. Établissement de connexions théoriques: Exposition systématique des connexions profondes entre les GNNs, le test de Weisfeiler-Lehman et les systèmes logiques (FO, FOC, GML)
  2. Proposition de la logique K#: Conception d'une nouvelle logique modale K# capable d'exprimer les opérations de comptage et d'agrégation des GNNs
  3. Conception d'algorithmes: Développement d'un algorithme PSPACE pour le problème de satisfiabilité de la logique K#, basé sur les méthodes de tableaux et le raisonnement QFBAPA
  4. Analyse de complexité: Preuve des limites de complexité computationnelle des problèmes de vérification des GNNs sous différentes fonctions d'activation
  5. Cadre pratique: Fourniture d'un cadre complet pour réduire les tâches de vérification des GNNs aux problèmes de satisfiabilité logique

Détails de la Méthode

Définition des Tâches

Les tâches principales de vérification des GNNs incluent :

  • Satisfiabilité: Étant donné un GNN N, existe-t-il une entrée pour laquelle sa sortie est positive ?
  • Vérification de spécification: Un GNN satisfait-il une spécification logique donnée φ ?
  • Vérification d'équivalence: Deux GNNs sont-ils équivalents sur toutes les entrées ?

Architecture de la Logique K#

Définition Syntaxique

φ ::= p | ¬φ | φ ∨ φ | ξ ≥ 0
ξ ::= c | 1φ | #φ | ξ + ξ | c × ξ

Définition Sémantique

  • : Vaut 1 si φ est vrai, 0 sinon
  • : Compte le nombre de nœuds successeurs satisfaisant φ
  • Expressions linéaires: Support de l'addition et de la multiplication scalaire

Caractéristiques Clés

  1. Capacité expressive: La logique K# contient la logique modale hiérarchisée (GML) comme sous-ensemble
  2. Relation de correspondance: Existence d'une traduction bidirectionnelle en temps polynomial avec les GNNs truncReLU
  3. Contraintes de comptage: Capacité à exprimer des relations de comptage complexes et des opérations d'agrégation

Correspondance GNN-K#

De K# vers GNN

tr(xi = 1) = xi
tr(¬φ) = 1 - truncReLU(tr(φ))
tr(φ ∧ ψ) = truncReLU(tr(φ) + tr(ψ) - 1)
tr(#φ) = agg(tr(φ))

De GNN vers K#

tr'(truncReLU(ϑ)) = 1tr'(ϑ)≥1
tr'(agg(ϑ)) = #(tr'(ϑ) ≥ 1)

Algorithme de Satisfiabilité

Fondements QFBAPA

Utilisation de l'algèbre booléenne quantifiée librement et de l'arithmétique de Presburger (QFBAPA) pour traiter les contraintes de comptage :

  • Technique des diagrammes de Venn: Conversion des expressions d'ensemble en variables de région
  • Limite de Carathéodory: Preuve que seul un nombre polynomial de régions non nulles doit être considéré
  • Complexité NP: Le problème de satisfiabilité QFBAPA est dans NP

Algorithme de Tableaux K#

procédure satK#(Γ)
  Traiter les règles booléennes et les constructions 1φ
  Extraire les contraintes d'inégalités linéaires S
  Deviner les régions non nulles B ⊆ {0,1}d, |B| ≤ 2d log₂(4d)
  Remplacer #ψᵢ par ∑ρ∈B|ρᵢ=1 sρ
  Vérifier la satisfiabilité QFPA
  Vérifier récursivement chaque région

Configuration Expérimentale

Vérification Théorique

L'article procède principalement à une analyse théorique, vérifiant par preuve constructive :

  1. Correction: Correction et complétude de l'algorithme
  2. Complexité: Limites de complexité temporelle et spatiale
  3. Capacité expressive: Relations de capacité expressive entre différents fragments logiques

Résultats de Complexité

Fonction d'activationGraphes dirigésGraphes non dirigés
truncReLUPSPACE-completPSPACE-complet
ReLUNEXPTIME-completIndécidable
truncReLU avec lecture globaleNEXPTIME-completIndécidable

Résultats Expérimentaux

Résultats Théoriques Principaux

Relations de Capacité Expressive

  • cr(G,u) = cr(G',u') ⟺ G,u et G',u' satisfont les mêmes formules GML
  • GML ⊆ K# ⊆ FOC₂
  • K# est strictement plus puissant que FO

Limites de Complexité

  1. Satisfiabilité K#: PSPACE-complet
  2. Vérification GNN truncReLU: PSPACE-complet
  3. Vérification GNN ReLU: NEXPTIME-complet
  4. Lecture globale: Conduit à l'indécidabilité (cas des graphes non dirigés)

Efficacité de l'Algorithme

  • Complexité spatiale: Espace polynomial
  • Nombre de régions: Au maximum 2d log₂(4d) régions non nulles
  • Surcharge de traduction: Temps polynomial (cas des poids entiers)

Perspectives Techniques

Connexion Weisfeiler-Lehman

  • L'algorithme de raffinage des couleurs capture le modèle de calcul essentiel des GNNs
  • La hiérarchie k-WL correspond à la capacité expressive des GNNs d'ordre différent
  • La logique modale fournit un langage naturel pour décrire cette hiérarchie

Traitement des Contraintes de Comptage

  • QFBAPA fournit un cadre efficace pour traiter les opérations d'agrégation
  • La technique des diagrammes de Venn simplifie les contraintes de comptage complexes en programmation linéaire
  • La limite de Carathéodory assure la complexité spatiale polynomiale de l'algorithme

Travaux Connexes

Fondations Théoriques des GNNs

  • Capacité expressive: Xu et al. (2019), Morris et al. (2019) établissent les connexions entre GNNs et test WL
  • Caractérisation logique: Barceló et al. (2020) établissent pour la première fois la correspondance entre GNNs et logique
  • Méthodes de vérification: Benedikt et al. (2024) proposent des procédures de décision, mais manquent d'un cadre unifié

Vérification de Logique Modale

  • Méthodes traditionnelles: Procédures de décision de logique modale basées sur les méthodes de tableaux
  • Extensions de comptage: Algorithmes de satisfiabilité de logique modale hiérarchisée
  • Théorie de complexité: Analyse de complexité des différents fragments de logique modale

Vérification de Réseaux de Neurones

  • Méthodes SMT: Utilisation de solveurs SMT pour vérifier les propriétés des réseaux de neurones
  • Interprétation abstraite: Analyse du comportement du réseau par domaines abstraits
  • Exécution symbolique: Exploration symbolique des chemins d'exécution du réseau

Conclusions et Discussion

Conclusions Principales

  1. Unification théorique: Établissement d'un cadre théorique unifié pour les GNNs, le test WL et les systèmes logiques
  2. Contributions algorithmiques: Fourniture d'algorithmes efficaces pour la vérification des GNNs, avec complexité optimale
  3. Capacité expressive: La logique K# capture exactement la capacité computationnelle des GNNs truncReLU
  4. Séparation de complexité: Les différentes fonctions d'activation entraînent des complexités de vérification significativement différentes

Limitations

  1. Restriction des fonctions d'activation: Les résultats principaux se concentrent sur truncReLU, le cas ReLU étant plus complexe
  2. Problèmes de quantification: Les poids rationnels nécessitent des dénominateurs communs de taille exponentielle
  3. Complexité de mise en œuvre: La mise en œuvre pratique de l'algorithme fait face à des défis d'efficacité
  4. Portée d'application: Principalement orienté vers les tâches de classification de nœuds, les tâches au niveau des graphes nécessitant des considérations supplémentaires

Directions Futures

  1. Extension des fonctions d'activation: Recherche de méthodes de vérification pour des fonctions d'activation plus générales
  2. Optimisation d'algorithmes: Amélioration de la performance pratique et de la scalabilité de l'algorithme
  3. Développement d'outils: Développement d'outils pratiques de vérification des GNNs
  4. Extension d'applications: Extension à d'autres architectures et types de tâches GNN

Évaluation Approfondie

Avantages

  1. Profondeur théorique: Établissement de connexions théoriques profondes, comblant des lacunes théoriques importantes
  2. Innovation méthodologique: La conception de la logique K# équilibre habilement la capacité expressive et la décidabilité
  3. Élégance algorithmique: La combinaison des méthodes de tableaux et de QFBAPA est à la fois naturelle et efficace
  4. Résultats complets: Fourniture d'une analyse de complexité complète et de preuves de correspondance
  5. Valeur pédagogique: En tant que notes de cours, la structure est claire et appropriée pour l'apprentissage et l'enseignement

Insuffisances

  1. Absence de vérification expérimentale: Manque de vérification expérimentale réelle et d'évaluation de performance
  2. Détails d'implémentation: Discussion insuffisante des détails d'implémentation et des stratégies d'optimisation de l'algorithme
  3. Cas d'application: Absence de scénarios d'application concrets et d'études de cas
  4. Support d'outils: Absence d'outils de vérification disponibles ou de système prototype

Impact

  1. Contribution théorique: Établissement d'une base théorique solide pour le domaine de la vérification des GNNs
  2. Inspiration méthodologique: Fourniture d'orientations méthodologiques importantes pour les recherches ultérieures
  3. Valeur éducative: En tant que matériel d'enseignement excellent, contribue à la formation de talents dans le domaine
  4. Perspectives pratiques: Bien que fortement théorique, indique la direction du développement d'outils pratiques

Scénarios Applicables

  1. Systèmes critiques pour la sécurité: Applications GNN nécessitant une vérification stricte
  2. Recherche théorique: Analyse théorique de la capacité expressive et de la complexité des GNNs
  3. Enseignement et formation: Enseignement des réseaux de neurones graphiques et de la vérification logique
  4. Développement d'outils: Base théorique pour le développement d'outils de vérification des GNNs

Références

L'article cite 65 références importantes, couvrant :

  • Fondations théoriques des GNNs (Grohe 2021, Barceló et al. 2020)
  • Test de Weisfeiler-Lehman (Morris et al. 2019, Xu et al. 2019)
  • Logique modale (Blackburn et al. 2001, Tobies 1999)
  • Théorie de la complexité (Grädel et al. 1997, Kuncak and Rinard 2007)
  • Vérification de réseaux de neurones (Benedikt et al. 2024, Haase and Zetzsche 2019)

Évaluation Générale: Cet article est un excellent travail qui allie profondeur théorique et valeur pédagogique. Non seulement il résout d'importants problèmes théoriques de vérification des GNNs, mais il jette également les bases solides pour les recherches ultérieures et les applications pratiques. Bien qu'il manque de vérification expérimentale, l'importance de ses contributions théoriques ne peut être ignorée.