2025-11-25T10:28:17.626083

Smoothed analysis for graph isomorphism

Anastos, Kwan, Moore

There is no known polynomial-time algorithm for graph isomorphism testing, but elementary combinatorial "refinement" algorithms seem to be very efficient in practice. Some philosophical justification is provided by a classical theorem of Babai, ErdÅs and Selkow: an extremely simple polynomial-time combinatorial algorithm (variously known as "naÃ¯ve refinement", "naÃ¯ve vertex classification", "colour refinement" or the "1-dimensional Weisfeiler-Leman algorithm") yields a so-called canonical labelling scheme for "almost all graphs". More precisely, for a typical outcome of a random graph $G(n,1/2)$, this simple combinatorial algorithm assigns labels to vertices in a way that easily permits isomorphism-testing against any other graph. We improve the Babai-ErdÅs-Selkow theorem in two directions. First, we consider randomly perturbed graphs, in accordance with the smoothed analysis philosophy of Spielman and Teng: for any graph $G$, naÃ¯ve refinement becomes effective after a tiny random perturbation to $G$ (specifically, the addition and removal of $O(n\log n)$ random edges). Actually, with a twist on naÃ¯ve refinement, we show that $O(n)$ random additions and removals suffice. These results significantly improve on previous work of Gaudio-RÃ¡cz-Sridhar, and are in certain senses best-possible. Second, we complete a long line of research on canonical labelling of random graphs: for any $p$ (possibly depending on $n$), we prove that a random graph $G(n,p)$ can typically be canonically labelled in polynomial time. This is most interesting in the extremely sparse regime where $p$ has order of magnitude $c/n$; denser regimes were previously handled by BollobÃ¡s, Czajka-Pandurangan, and Linial-Mosheiff. Our proof also provides a description of the automorphism group of a typical outcome of $G(n,p_n)$ (slightly correcting a prediction of Linial-Mosheiff).

academic

Smoothed analysis for graph isomorphism

基本信息

论文ID: 2410.06095
标题: Smoothed analysis for graph isomorphism
作者: Michael Anastos, Matthew Kwan, Benjamin Moore
分类: math.CO cs.CC cs.DS
发表时间: 2024年10月
论文链接: https://arxiv.org/abs/2410.06095v3

摘要

图同构测试问题尚无已知的多项式时间算法，但基本的组合"细化"算法在实践中表现非常高效。Babai、Erdős和Selkow的经典定理为此提供了哲学上的解释：一个极其简单的多项式时间组合算法（称为"朴素细化"、"朴素顶点分类"、"颜色细化"或"1维Weisfeiler-Leman算法"）能为"几乎所有图"提供规范标记方案。

本文在两个方向上改进了Babai-Erdős-Selkow定理：首先，根据Spielman和Teng的平滑分析理念考虑随机扰动图；其次，完成了关于随机图规范标记的长期研究线。

研究背景与动机

问题背景

图同构问题的重要性：图同构测试是计算复杂性理论中的核心问题，位于P和NP-complete之间的特殊位置
实践与理论的差距：尽管最坏情况下需要指数时间，但颜色细化算法在实践中表现出色
Babai-Erdős-Selkow定理的局限性：该经典定理仅适用于随机图G(n,1/2)，对于结构化图表现不佳

研究动机

平滑分析的应用：将Spielman-Teng的平滑分析框架应用于图同构问题
扩展适用范围：证明轻微的随机扰动就能使颜色细化算法对任意图有效
完善理论体系：为所有密度的随机图提供完整的规范标记理论

核心贡献

平滑分析结果：证明了对任意图G₀进行O(n log n)随机边扰动后，颜色细化算法几乎总是成功
改进的扰动界限：通过修改的算法，将所需扰动降低至O(n)个随机边
稀疏随机图的完整理论：为任意密度p的随机图G(n,p)提供多项式时间规范标记方案
自同构群刻画：描述了典型随机图的自同构群结构，修正了Linial-Mosheiff的预测

方法详解

任务定义

给定两个n顶点图G₁和G₂，图同构问题要求确定是否存在顶点集合间的双射使得两图邻接关系保持不变。规范标记是一种为每个图分配标准形式的方法，使得同构的图具有相同的标记。

核心算法：颜色细化

基本框架

颜色细化算法是一个迭代过程：

初始化：所有顶点分配相同颜色
细化步骤：根据邻居的颜色分布更新每个顶点的颜色
稳定化：重复直到颜色分配不再变化

数学描述

对于图G和着色c : V(G) → Ω，细化操作定义为：

R_G c(v) = (c(v), (d_ω(v))_{ω∈Ω})

其中d_ω(v)是顶点v的颜色为ω的邻居数量。

视图和通用覆盖

算法的有效性通过"视图"概念分析：

视图T_G(v)编码从顶点v开始的所有可能路径
两顶点颜色相同当且仅当它们的视图同构

技术创新点

1. 扩展和反集中技术

扩展性质：利用随机图的强扩展性质，证明小的顶点集合会快速增长
反集中不等式：应用Erdős-Littlewood-Offord型不等式控制随机波动

2. 核心结构分析

k-核心：图的k-核心是最大最小度至少为k的子图
2-核心的特殊性质：在2-核心中度数至少为3的顶点通常可被颜色细化区分

3. 撒点技术（Sprinkling）

将随机扰动分解为多个独立的稀疏扰动：

每轮扰动使新顶点获得唯一颜色
利用单调性逐步改善图的性质

4. 差异图（Disparity Graph）

定义差异图D(G,c)来分析颜色细化的效果：

捕捉图结构与颜色类别间的不匹配
小连通分量对应有效的规范标记

主要定理

定理1.2（平滑分析-基础版本）

对于常数ε > 0和p ≥ (1+ε)log n/n，任意图G₀和随机图G_rand ~ G(n,p)，几乎总是颜色细化算法能区分G₀△G_rand的所有顶点。

定理1.3（改进的平滑分析）

存在图类H和多项式时间规范标记算法，使得对于p ≥ 100/n，任意图G₀和G_rand ~ G(n,p)，几乎总是G₀△G_rand ∈ H。

定理1.4（稀疏随机图）

对于任意序列(p_n)，随机图G_n ~ G(n,p_n)几乎总是可以在多项式时间内规范标记。

证明技术

关键引理4.1

这是核心技术结果，证明了在适当随机扰动的图中，当S^{≤i}({u,v})足够大时，顶点u和v几乎总是被颜色细化区分。

证明策略

探索过程：逐步揭示随机边，研究视图差异集合的演化
扩展引理：证明小的差异集合会指数增长
反集中分析：使用独立随机变量的反集中性质

2维Weisfeiler-Leman算法

对于更精细的分析，引入2维版本：

对顶点对进行着色而非单个顶点
能够检测距离信息
提供更强的区分能力

实验设置

理论分析为主

本文主要进行理论分析，通过概率方法证明算法的有效性：

概率模型：使用Erdős-Rényi随机图模型G(n,p)
渐近分析：研究n → ∞时的行为
高概率事件：证明所需性质以1-o(1)的概率成立

复杂度分析

颜色细化：O((n+m)log n)时间
2维算法：O(n³log n)时间
整体算法：多项式时间

主要结果

平滑分析结果

扰动阈值：证明了p ≥ (1+ε)log n/n是使颜色细化成功的阈值
最优性：该阈值在某种意义下是最优的
改进算法：通过2维Weisfeiler-Leman算法将阈值降至p ≥ 100/n

稀疏随机图结果

完整刻画：为所有密度p提供了规范标记方案
相变现象：在p ≈ 1/n附近发现关键相变
自同构群：完整描述了稀疏随机图的自同构群结构

技术贡献

新的分析工具：发展了分析随机扰动图的新技术
统一框架：将不同密度区间的结果统一在一个框架下
精确常数：在多个结果中给出了精确的常数界限

相关工作

历史发展

经典结果：Babai-Erdős-Selkow (1980)建立了基础理论
密集情况：Bollobás等人处理了较密集的随机图
稀疏情况：Linial-Mosheiff处理了部分稀疏情况

平滑分析背景

Spielman-Teng框架：将平滑分析引入离散问题
图算法应用：之前在图着色、匹配等问题上的应用
本文贡献：首次系统地将平滑分析应用于图同构

算法复杂性

Babai的突破：拟多项式时间算法
实用算法：个体化-细化范式
理论与实践：解释实用算法效果的理论工作

结论与讨论

主要结论

理论解释：为颜色细化算法的实用效果提供了理论解释
扰动的力量：证明了轻微随机扰动的巨大作用
完整图景：为随机图同构问题提供了完整的理论图景

局限性

扰动要求：仍需要一定量的随机扰动
常数优化：某些常数可能不是最优的
实际应用：理论结果向实际算法的转化需要进一步工作

未来方向

扰动模型：考虑其他类型的随机扰动
算法改进：开发更高效的实用算法
推广应用：将技术应用到其他图算法问题

深度评价

优点

理论深度：提供了深刻的理论洞察，解释了一个重要的实践现象
技术创新：发展了多项新的分析技术，特别是视图分析和撒点方法
完整性：为一个经典问题提供了相对完整的理论图景
精确性：在多个结果中给出了精确的阈值和常数

技术贡献

方法论：将平滑分析成功应用于离散结构问题
分析工具：差异图、视图、2维Weisfeiler-Leman等概念的系统使用
概率技术：扩展性质和反集中不等式的巧妙结合

不足之处

复杂性：证明技术较为复杂，可读性有待提高
实用性：理论结果向实际算法的转化不够直接
常数优化：某些技术常数可能存在改进空间

影响力评估

学术影响：为图同构和随机图理论做出了重要贡献
方法论影响：平滑分析在离散数学中的应用示范
实用潜力：为开发更好的图同构算法提供了理论指导

适用场景

理论研究：图同构复杂性、随机图理论研究
算法设计：启发新的图同构算法设计
相关问题：技术可能适用于其他图算法问题

技术细节补充

关键不等式

论文中使用了多个重要的概率不等式：

Chernoff界限用于集中性分析
Erdős-Littlewood-Offord型反集中不等式
模态概率的精确估计

图论结构

k-核心的性质和计算
裸路径和核结构
连通分量的演化过程

算法复杂度

详细分析了各个算法组件的时间复杂度，证明了整体的多项式时间性质。

这篇论文在图同构问题的理论研究中做出了重要贡献，特别是在解释实用算法效果和完善随机图理论方面。虽然技术较为复杂，但为这一经典问题提供了新的视角和深刻洞察。