2025-11-21T04:31:15.286585

Lecture Notes on Verifying Graph Neural Networks

Schwarzentruber
In these lecture notes, we first recall the connection between graph neural networks, Weisfeiler-Lehman tests and logics such as first-order logic and graded modal logic. We then present a modal logic in which counting modalities appear in linear inequalities in order to solve verification tasks on graph neural networks. We describe an algorithm for the satisfiability problem of that logic. It is inspired from the tableau method of vanilla modal logic, extended with reasoning in quantifier-free fragment Boolean algebra with Presburger arithmetic.
academic

Lecture Notes on Verifying Graph Neural Networks

基本信息

  • 论文ID: 2510.11617
  • 标题: Lecture Notes on Verifying Graph Neural Networks
  • 作者: François Schwarzentruber (ENS de Lyon)
  • 分类: cs.LO (Logic in Computer Science), cs.LG (Machine Learning)
  • 发表时间: October 14, 2025
  • 论文链接: https://arxiv.org/abs/2510.11617

摘要

本讲义首先回顾了图神经网络、Weisfeiler-Lehman测试与一阶逻辑、分级模态逻辑等逻辑系统之间的联系。然后提出了一种模态逻辑,其中计数模态出现在线性不等式中,用于解决图神经网络的验证任务。描述了该逻辑可满足性问题的算法,该算法受到传统模态逻辑的表格方法启发,并扩展了量词自由片段布尔代数与Presburger算术的推理。

研究背景与动机

问题背景

图神经网络(GNNs)已广泛应用于社交网络推荐、知识图谱、化学分子分析、药物发现等多个领域。然而,GNNs的验证问题却面临重大挑战:

  1. 表达能力限制: GNNs的表达能力受到1-WL(Weisfeiler-Lehman)测试的限制,无法区分某些非同构图
  2. 验证任务复杂性: 需要验证GNN是否满足特定规范,如安全性、正确性等属性
  3. 理论基础不足: 缺乏系统的逻辑框架来描述和验证GNN的行为

研究动机

  • 实际需求: 在安全关键应用中,需要确保GNN的可靠性和正确性
  • 理论空白: 现有验证方法缺乏统一的逻辑理论基础
  • 技术挑战: 需要处理GNN中的聚合操作和计数约束

核心贡献

  1. 建立理论联系: 系统阐述了GNNs、Weisfeiler-Lehman测试与逻辑系统(FO、FOC、GML)之间的深层联系
  2. 提出K#逻辑: 设计了新的模态逻辑K#,能够表达GNN的计数和聚合操作
  3. 算法设计: 开发了K#逻辑可满足性问题的PSPACE算法,基于表格方法和QFBAPA推理
  4. 复杂性分析: 证明了不同激活函数下GNN验证问题的计算复杂性界限
  5. 实用框架: 提供了将GNN验证任务归约为逻辑可满足性问题的完整框架

方法详解

任务定义

GNN验证的核心任务包括:

  • 可满足性: 给定GNN N,是否存在输入使其输出为正?
  • 规范验证: GNN是否满足给定的逻辑规范φ?
  • 等价性检查: 两个GNN是否在所有输入上等价?

K#逻辑架构

语法定义

φ ::= p | ¬φ | φ ∨ φ | ξ ≥ 0
ξ ::= c | 1φ | #φ | ξ + ξ | c × ξ

语义定义

  • : 如果φ为真则值为1,否则为0
  • : 计算满足φ的后继节点数量
  • 线性表达式: 支持加法和标量乘法

关键特性

  1. 表达能力: K#逻辑包含分级模态逻辑(GML)作为子集
  2. 对应关系: 与truncReLU-GNNs存在多项式时间的双向翻译
  3. 计数约束: 能够表达复杂的计数关系和聚合操作

GNN-K#对应关系

从K#到GNN

tr(xi = 1) = xi
tr(¬φ) = 1 - truncReLU(tr(φ))
tr(φ ∧ ψ) = truncReLU(tr(φ) + tr(ψ) - 1)
tr(#φ) = agg(tr(φ))

从GNN到K#

tr'(truncReLU(ϑ)) = 1tr'(ϑ)≥1
tr'(agg(ϑ)) = #(tr'(ϑ) ≥ 1)

可满足性算法

QFBAPA基础

使用量词自由布尔代数与Presburger算术(QFBAPA)处理计数约束:

  • Venn图技术: 将集合表达式转换为区域变量
  • Carathéodory界限: 证明只需考虑多项式数量的非零区域
  • NP复杂性: QFBAPA可满足性问题在NP内

K#表格算法

procedure satK#(Γ)
  处理布尔规则和1φ构造
  提取线性不等式约束S
  猜测非零区域B ⊆ {0,1}d,|B| ≤ 2d log₂(4d)
  将#ψᵢ替换为∑ρ∈B|ρᵢ=1 sρ
  检查QFPA可满足性
  递归验证各区域

实验设置

理论验证

论文主要进行理论分析,通过构造性证明验证:

  1. 正确性: 算法的正确性和完备性
  2. 复杂性: 时间和空间复杂性界限
  3. 表达能力: 不同逻辑片段的表达能力关系

复杂性结果

激活函数有向图无向图
truncReLUPSPACE-completePSPACE-complete
ReLUNEXPTIME-completeUndecidable
带全局读取的truncReLUNEXPTIME-completeUndecidable

实验结果

主要理论结果

表达能力关系

  • cr(G,u) = cr(G',u') ⟺ G,u和G',u'满足相同的GML公式
  • GML ⊆ K# ⊆ FOC₂
  • K#严格强于FO

复杂性界限

  1. K#可满足性: PSPACE-complete
  2. truncReLU-GNN验证: PSPACE-complete
  3. ReLU-GNN验证: NEXPTIME-complete
  4. 全局读取: 导致不可判定性(无向图情况)

算法效率

  • 空间复杂性: 多项式空间
  • 区域数量: 最多2d log₂(4d)个非零区域
  • 翻译开销: 多项式时间(整数权重情况)

技术洞察

Weisfeiler-Lehman连接

  • 颜色精化算法捕获GNN的本质计算模式
  • k-WL层次结构对应不同阶GNN的表达能力
  • 模态逻辑提供了描述这种层次结构的自然语言

计数约束处理

  • QFBAPA提供了处理聚合操作的有效框架
  • Venn图技术将复杂计数约束简化为线性规划
  • Carathéodory界限确保算法的多项式空间复杂性

相关工作

GNN理论基础

  • 表达能力: Xu等(2019)、Morris等(2019)建立了GNN与WL测试的联系
  • 逻辑刻画: Barceló等(2020)首次建立GNN与逻辑的对应关系
  • 验证方法: Benedikt等(2024)提出了决策程序,但缺乏统一框架

模态逻辑验证

  • 传统方法: 基于表格方法的模态逻辑判定程序
  • 计数扩展: 分级模态逻辑的可满足性算法
  • 复杂性理论: 各种模态逻辑片段的复杂性分析

神经网络验证

  • SMT方法: 使用SMT求解器验证神经网络属性
  • 抽象解释: 通过抽象域分析网络行为
  • 符号执行: 符号化地探索网络的执行路径

结论与讨论

主要结论

  1. 理论统一: 建立了GNN、WL测试与逻辑系统的统一理论框架
  2. 算法贡献: 提供了GNN验证的有效算法,复杂性最优
  3. 表达能力: K#逻辑恰好捕获truncReLU-GNN的计算能力
  4. 复杂性分离: 不同激活函数导致显著不同的验证复杂性

局限性

  1. 激活函数限制: 主要结果集中在truncReLU,ReLU情况更复杂
  2. 量化问题: 有理数权重需要指数大小的公分母
  3. 实现复杂性: 算法的实际实现仍面临效率挑战
  4. 应用范围: 主要针对节点分类任务,图级任务需要额外考虑

未来方向

  1. 扩展激活函数: 研究更一般激活函数的验证方法
  2. 优化算法: 改进算法的实际性能和可扩展性
  3. 工具开发: 开发实用的GNN验证工具
  4. 应用拓展: 扩展到更多GNN架构和任务类型

深度评价

优点

  1. 理论深度: 建立了深刻的理论联系,填补了重要的理论空白
  2. 方法创新: K#逻辑的设计巧妙地平衡了表达能力和可判定性
  3. 算法优雅: 表格方法与QFBAPA的结合既自然又高效
  4. 结果完整: 提供了完整的复杂性分析和对应关系证明
  5. 教学价值: 作为讲义,结构清晰,适合学习和教学

不足

  1. 实验验证缺失: 缺乏实际的实验验证和性能评估
  2. 实现细节: 算法的具体实现和优化策略讨论不足
  3. 应用案例: 缺乏具体的应用场景和案例研究
  4. 工具支持: 没有提供可用的验证工具或原型系统

影响力

  1. 理论贡献: 为GNN验证领域奠定了坚实的理论基础
  2. 方法启发: 为后续研究提供了重要的方法论指导
  3. 教育价值: 作为优秀的教学材料,有助于领域人才培养
  4. 实用前景: 虽然理论性强,但为实用工具开发指明了方向

适用场景

  1. 安全关键系统: 需要严格验证的GNN应用
  2. 理论研究: GNN表达能力和复杂性的理论分析
  3. 教学培训: 图神经网络和逻辑验证的教学
  4. 工具开发: GNN验证工具的理论基础

参考文献

论文引用了65篇重要文献,涵盖了:

  • GNN理论基础(Grohe 2021, Barceló et al. 2020)
  • Weisfeiler-Lehman测试(Morris et al. 2019, Xu et al. 2019)
  • 模态逻辑(Blackburn et al. 2001, Tobies 1999)
  • 复杂性理论(Grädel et al. 1997, Kuncak and Rinard 2007)
  • 神经网络验证(Benedikt et al. 2024, Haase and Zetzsche 2019)

总体评价: 这是一篇理论深度和教学价值并重的优秀论文。它不仅解决了GNN验证的重要理论问题,还为后续研究和实际应用奠定了坚实基础。虽然缺乏实验验证,但其理论贡献的重要性不容忽视。