2025-11-21T04:31:15.286585

Lecture Notes on Verifying Graph Neural Networks

Schwarzentruber
In these lecture notes, we first recall the connection between graph neural networks, Weisfeiler-Lehman tests and logics such as first-order logic and graded modal logic. We then present a modal logic in which counting modalities appear in linear inequalities in order to solve verification tasks on graph neural networks. We describe an algorithm for the satisfiability problem of that logic. It is inspired from the tableau method of vanilla modal logic, extended with reasoning in quantifier-free fragment Boolean algebra with Presburger arithmetic.
academic

Vorlesungsnotizen zur Verifikation von Graphischen Neuronalen Netzen

Grundinformationen

  • Paper-ID: 2510.11617
  • Titel: Lecture Notes on Verifying Graph Neural Networks
  • Autor: François Schwarzentruber (ENS de Lyon)
  • Klassifizierung: cs.LO (Logik in der Informatik), cs.LG (Maschinelles Lernen)
  • Veröffentlichungsdatum: 14. Oktober 2025
  • Paper-Link: https://arxiv.org/abs/2510.11617

Zusammenfassung

Diese Vorlesungsnotizen überprüfen zunächst die Verbindungen zwischen Graphischen Neuronalen Netzen, dem Weisfeiler-Lehman-Test und logischen Systemen wie der Logik erster Ordnung und gestufter Modallogik. Anschließend wird eine Modallogik vorgestellt, in der Zählmodalitäten in linearen Ungleichungen auftreten, um Verifikationsaufgaben für Graphische Neuronale Netze zu lösen. Es wird ein Algorithmus für das Erfüllbarkeitsproblem dieser Logik beschrieben, der von klassischen Tableaux-Methoden der Modallogik inspiriert ist und die Inferenz über quantorenfreie Fragmente der Booleschen Algebra mit Presburger-Arithmetik erweitert.

Forschungshintergrund und Motivation

Problemhintergrund

Graphische Neuronale Netze (GNNs) werden in vielen Bereichen wie sozialen Netzwerk-Empfehlungen, Wissensgraphen, chemischer Molekülanalyse und Wirkstoffforschung weit verbreitet eingesetzt. Allerdings sieht sich die Verifikation von GNNs erheblichen Herausforderungen gegenüber:

  1. Ausdruckskraftbeschränkungen: Die Ausdruckskraft von GNNs ist durch den 1-WL-Test (Weisfeiler-Lehman) begrenzt und kann bestimmte nicht-isomorphe Graphen nicht unterscheiden
  2. Komplexität von Verifikationsaufgaben: Es ist erforderlich zu überprüfen, ob ein GNN bestimmte Spezifikationen erfüllt, wie Sicherheits- und Korrektheitseigenschaften
  3. Unzureichende theoretische Grundlagen: Es fehlt ein systematisches logisches Rahmenwerk zur Beschreibung und Verifikation des Verhaltens von GNNs

Forschungsmotivation

  • Praktische Anforderungen: In sicherheitskritischen Anwendungen ist es erforderlich, die Zuverlässigkeit und Korrektheit von GNNs zu gewährleisten
  • Theoretische Lücken: Bestehende Verifikationsmethoden entbehren einer einheitlichen logischen theoretischen Grundlage
  • Technische Herausforderungen: Es ist notwendig, Aggregationsoperationen und Zählbeschränkungen in GNNs zu behandeln

Kernbeiträge

  1. Theoretische Verbindungen etablieren: Systematische Darlegung der tiefgreifenden Verbindungen zwischen GNNs, dem Weisfeiler-Lehman-Test und logischen Systemen (FO, FOC, GML)
  2. K#-Logik vorschlagen: Entwurf einer neuen Modallogik K#, die Zähl- und Aggregationsoperationen von GNNs ausdrücken kann
  3. Algorithmusentwurf: Entwicklung eines PSPACE-Algorithmus für das Erfüllbarkeitsproblem der K#-Logik, basierend auf Tableaux-Methoden und QFBAPA-Inferenz
  4. Komplexitätsanalyse: Beweis der Rechenkomplexitätsgrenzen von GNN-Verifikationsproblemen unter verschiedenen Aktivierungsfunktionen
  5. Praktisches Rahmenwerk: Bereitstellung eines vollständigen Rahmenwerks zur Reduktion von GNN-Verifikationsaufgaben auf logische Erfüllbarkeitsprobleme

Methodische Details

Aufgabendefinition

Die Kernaufgaben der GNN-Verifikation umfassen:

  • Erfüllbarkeit: Existiert für ein gegebenes GNN N eine Eingabe, so dass die Ausgabe positiv ist?
  • Spezifikationsverifikation: Erfüllt das GNN eine gegebene logische Spezifikation φ?
  • Äquivalenzprüfung: Sind zwei GNNs auf allen Eingaben äquivalent?

K#-Logik-Architektur

Syntaxdefinition

φ ::= p | ¬φ | φ ∨ φ | ξ ≥ 0
ξ ::= c | 1φ | #φ | ξ + ξ | c × ξ

Semantikdefinition

  • : Der Wert ist 1, wenn φ wahr ist, andernfalls 0
  • : Zählt die Anzahl der Nachfolgerknoten, die φ erfüllen
  • Lineare Ausdrücke: Unterstützen Addition und Skalarmultiplikation

Schlüsseleigenschaften

  1. Ausdruckskraft: K#-Logik enthält gestaffelte Modallogik (GML) als Teilmenge
  2. Entsprechung: Polynomiale bidirektionale Übersetzung mit truncReLU-GNNs existiert
  3. Zählbeschränkungen: Kann komplexe Zählbeziehungen und Aggregationsoperationen ausdrücken

GNN-K#-Entsprechung

Von K# zu GNN

tr(xi = 1) = xi
tr(¬φ) = 1 - truncReLU(tr(φ))
tr(φ ∧ ψ) = truncReLU(tr(φ) + tr(ψ) - 1)
tr(#φ) = agg(tr(φ))

Von GNN zu K#

tr'(truncReLU(ϑ)) = 1tr'(ϑ)≥1
tr'(agg(ϑ)) = #(tr'(ϑ) ≥ 1)

Erfüllbarkeitssalgorithmus

QFBAPA-Grundlagen

Verwendung von quantorenfreier Boolescher Algebra mit Presburger-Arithmetik (QFBAPA) zur Behandlung von Zählbeschränkungen:

  • Venn-Diagramm-Technik: Konvertierung von Mengenausdrücken in Bereichsvariablen
  • Carathéodory-Schranke: Beweis, dass nur polynomiale Anzahl von Nicht-Null-Bereichen berücksichtigt werden müssen
  • NP-Komplexität: QFBAPA-Erfüllbarkeitsproblem liegt in NP

K#-Tableaux-Algorithmus

procedure satK#(Γ)
  Verarbeitung von Booleschen Regeln und 1φ-Konstruktionen
  Extraktion linearer Ungleichungsbeschränkungen S
  Vermutung von Nicht-Null-Bereichen B ⊆ {0,1}d, |B| ≤ 2d log₂(4d)
  Ersetzung von #ψᵢ durch ∑ρ∈B|ρᵢ=1 sρ
  Überprüfung der QFPA-Erfüllbarkeit
  Rekursive Verifikation verschiedener Bereiche

Experimentelle Einrichtung

Theoretische Verifikation

Das Paper führt hauptsächlich theoretische Analysen durch und überprüft durch konstruktive Beweise:

  1. Korrektheit: Korrektheit und Vollständigkeit des Algorithmus
  2. Komplexität: Zeit- und Raumkomplexitätsgrenzen
  3. Ausdruckskraft: Ausdruckskraftbeziehungen verschiedener logischer Fragmente

Komplexitätsergebnisse

AktivierungsfunktionGerichtete GraphenUngerichtete Graphen
truncReLUPSPACE-vollständigPSPACE-vollständig
ReLUNEXPTIME-vollständigUnentscheidbar
truncReLU mit globalem LesenNEXPTIME-vollständigUnentscheidbar

Experimentelle Ergebnisse

Haupttheoretische Ergebnisse

Ausdruckskraftbeziehungen

  • cr(G,u) = cr(G',u') ⟺ G,u und G',u' erfüllen dieselben GML-Formeln
  • GML ⊆ K# ⊆ FOC₂
  • K# ist streng stärker als FO

Komplexitätsgrenzen

  1. K#-Erfüllbarkeit: PSPACE-vollständig
  2. truncReLU-GNN-Verifikation: PSPACE-vollständig
  3. ReLU-GNN-Verifikation: NEXPTIME-vollständig
  4. Globales Lesen: Führt zu Unentscheidbarkeit (ungerichtete Graphen)

Algorithmuseffizienz

  • Raumkomplexität: Polynomialer Raum
  • Bereichsanzahl: Maximal 2d log₂(4d) Nicht-Null-Bereiche
  • Übersetzungsaufwand: Polynomiale Zeit (ganzzahlige Gewichte)

Technische Erkenntnisse

Weisfeiler-Lehman-Verbindung

  • Der Farbverfeinerungsalgorithmus erfasst das wesentliche Rechenmuster von GNNs
  • Die k-WL-Hierarchie entspricht der Ausdruckskraft verschiedener GNN-Ordnungen
  • Modallogik bietet eine natürliche Sprache zur Beschreibung dieser Hierarchie

Behandlung von Zählbeschränkungen

  • QFBAPA bietet einen wirksamen Rahmen zur Behandlung von Aggregationsoperationen
  • Venn-Diagramm-Technik vereinfacht komplexe Zählbeschränkungen zu linearer Programmierung
  • Carathéodory-Schranke gewährleistet die polynomiale Raumkomplexität des Algorithmus

Verwandte Arbeiten

Theoretische Grundlagen von GNNs

  • Ausdruckskraft: Xu et al. (2019), Morris et al. (2019) etablieren Verbindungen zwischen GNNs und WL-Tests
  • Logische Charakterisierung: Barceló et al. (2020) etablieren erstmals Entsprechungen zwischen GNNs und Logik
  • Verifikationsmethoden: Benedikt et al. (2024) schlagen Entscheidungsverfahren vor, entbehren aber eines einheitlichen Rahmenwerks

Modallogik-Verifikation

  • Klassische Methoden: Entscheidungsverfahren für Modallogik basierend auf Tableaux-Methoden
  • Zählerweiterungen: Erfüllbarkeitssalgorithmen für gestaffelte Modallogik
  • Komplexitätstheorie: Komplexitätsanalyse verschiedener Modallogik-Fragmente

Verifikation Neuronaler Netze

  • SMT-Methoden: Verwendung von SMT-Lösern zur Verifikation von Netzwerkeigenschaften
  • Abstrakte Interpretation: Analyse des Netzwerkverhaltens durch abstrakte Domänen
  • Symbolische Ausführung: Symbolische Erkundung von Netzwerkausführungspfaden

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Theoretische Vereinigung: Etablierung eines einheitlichen theoretischen Rahmenwerks für GNNs, WL-Tests und logische Systeme
  2. Algorithmusbeiträge: Bereitstellung wirksamer Algorithmen für GNN-Verifikation mit optimaler Komplexität
  3. Ausdruckskraft: K#-Logik erfasst genau die Rechenkraft von truncReLU-GNNs
  4. Komplexitätstrennung: Verschiedene Aktivierungsfunktionen führen zu erheblich unterschiedlicher Verifikationskomplexität

Einschränkungen

  1. Aktivierungsfunktionsbeschränkungen: Hauptergebnisse konzentrieren sich auf truncReLU, ReLU-Fall ist komplexer
  2. Quantifizierungsprobleme: Rationale Gewichte erfordern exponentiell große gemeinsame Nenner
  3. Implementierungskomplexität: Praktische Implementierung des Algorithmus sieht sich noch Effizienzherausforderungen gegenüber
  4. Anwendungsbereich: Konzentriert sich hauptsächlich auf Knotenklassifizierungsaufgaben, Graphenaufgaben erfordern zusätzliche Überlegungen

Zukünftige Richtungen

  1. Erweiterung von Aktivierungsfunktionen: Untersuchung von Verifikationsmethoden für allgemeinere Aktivierungsfunktionen
  2. Algorithmusoptimierung: Verbesserung der praktischen Leistung und Skalierbarkeit des Algorithmus
  3. Werkzeugentwicklung: Entwicklung praktischer GNN-Verifikationswerkzeuge
  4. Anwendungserweiterung: Erweiterung auf mehr GNN-Architekturen und Aufgabentypen

Tiefgreifende Bewertung

Stärken

  1. Theoretische Tiefe: Etablierung tiefgreifender theoretischer Verbindungen, Schließung wichtiger theoretischer Lücken
  2. Methodische Innovation: Geschickter Entwurf der K#-Logik, der Ausdruckskraft und Entscheidbarkeit ausgewogen
  3. Algorithmuseleganz: Kombination von Tableaux-Methoden und QFBAPA ist sowohl natürlich als auch effizient
  4. Vollständige Ergebnisse: Bereitstellung vollständiger Komplexitätsanalyse und Entsprechungsbeweise
  5. Pädagogischer Wert: Als Vorlesungsnotizen mit klarer Struktur, geeignet zum Lernen und Lehren

Mängel

  1. Fehlende experimentelle Verifikation: Mangel an praktischer experimenteller Verifikation und Leistungsbewertung
  2. Implementierungsdetails: Unzureichende Diskussion spezifischer Implementierungs- und Optimierungsstrategien
  3. Anwendungsfälle: Mangel an konkreten Anwendungsszenarien und Fallstudien
  4. Werkzeugunterstützung: Keine bereitgestellten Verifikationswerkzeuge oder Prototypsysteme

Einflussfähigkeit

  1. Theoretischer Beitrag: Schaffung einer soliden theoretischen Grundlage für das GNN-Verifikationsfeld
  2. Methodische Inspiration: Bereitstellung wichtiger methodologischer Orientierung für nachfolgende Forschung
  3. Pädagogischer Wert: Als ausgezeichnetes Unterrichtsmaterial zur Förderung von Talenten im Bereich
  4. Praktische Perspektive: Obwohl theoretisch stark, weist es die Richtung für die Entwicklung praktischer Werkzeuge

Anwendungsszenarien

  1. Sicherheitskritische Systeme: GNN-Anwendungen, die strenge Verifikation erfordern
  2. Theoretische Forschung: Theoretische Analyse der Ausdruckskraft und Komplexität von GNNs
  3. Lehre und Schulung: Unterricht in Graphischen Neuronalen Netzen und logischer Verifikation
  4. Werkzeugentwicklung: Theoretische Grundlagen für die Entwicklung von GNN-Verifikationswerkzeugen

Literaturverzeichnis

Das Paper zitiert 65 wichtige Literaturquellen, die folgende Bereiche abdecken:

  • Theoretische Grundlagen von GNNs (Grohe 2021, Barceló et al. 2020)
  • Weisfeiler-Lehman-Test (Morris et al. 2019, Xu et al. 2019)
  • Modallogik (Blackburn et al. 2001, Tobies 1999)
  • Komplexitätstheorie (Grädel et al. 1997, Kuncak and Rinard 2007)
  • Verifikation Neuronaler Netze (Benedikt et al. 2024, Haase and Zetzsche 2019)

Gesamtbewertung: Dies ist ein ausgezeichnetes Paper, das theoretische Tiefe und pädagogischen Wert vereint. Es löst nicht nur wichtige theoretische Probleme der GNN-Verifikation, sondern schafft auch eine solide Grundlage für nachfolgende Forschung und praktische Anwendungen. Obwohl experimentelle Verifikation fehlt, ist die Bedeutung seiner theoretischen Beiträge unbestreitbar.