2025-11-17T05:52:13.175509

Accelerated Evolving Set Processes for Local PageRank Computation

Huang, Luo, Xiao et al.

This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/Îµ^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $Îµ$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtÎ±)$ such linear systems, where $Î±$ is the damping factor. When $1/Îµ^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtÎ±Îµ^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.

academic

Accelerated Evolving Set Processes for Local PageRank Computation

基本信息

论文ID: 2510.08010
标题: Accelerated Evolving Set Processes for Local PageRank Computation
作者: Binbin Huang, Baojian Zhou, Luo Luo, Deqing Yang, Yanghua Xiao (复旦大学)
分类: cs.LG
发表会议: 39th Conference on Neural Information Processing Systems (NeurIPS 2025)
论文链接: https://arxiv.org/abs/2510.08010v2

摘要

本文提出了一个基于嵌套演化集合过程(nested evolving set processes)的新框架来加速个性化PageRank(PPR)计算。在每个阶段，采用局部化的非精确近似点迭代来解决简化的线性系统。研究表明，此类局部化方法的时间复杂度上界为 $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ 以获得PPR向量的ε-近似，其中m表示图中边数，R是通过嵌套演化集合过程定义的常数。框架诱导的算法仅需求解 $\tilde{\mathcal{O}}(1/\sqrt{α})$ 个这样的线性系统，其中α是阻尼因子。当 $1/ε^2 \ll m$ 时，这意味着存在一个算法能以 $\tilde{\mathcal{O}}(R^2/(\sqrt{α}ε^2))$ 的总时间复杂度计算PPR向量的ε-近似，且独立于底层图大小。

研究背景与动机

问题定义

个性化PageRank(PPR)向量π ∈ ℝⁿ定义为：

(I - (1-α)(I + AD⁻¹)/2)π = αeₛ

其中eₛ是对应源节点s的标准基向量，α ∈ (0,1)是阻尼因子，A和D分别是无向图G(V,E)的邻接矩阵和度矩阵。

研究动机

重要性：PPR是图分析的核心工具，广泛应用于局部聚类、扩散过程建模、图神经网络等领域
现有局限：
- 标准方法如APPR时间复杂度为O(1/(αε))
- 加速方法面临动量项破坏残差单调性的挑战
- 现有加速方法可能访问整个图，导致O(m/√α)的时间复杂度
开放问题：是否存在时间复杂度依赖于1/√α而非1/α的局部加速方法

核心贡献

AESP框架：提出了加速演化集合过程(AESP)框架，使用 $\tilde{O}(1/\sqrt{α})$ 个短演化集合过程而非单个长过程
理论保证：建立了 $\tilde{O}(\text{vol}(S_t)/(\sqrt{α}γ_t))$ 的时间复杂度，匹配现有文献中的加速界限猜想
局部性保证：证明了 $\text{vol}(S_t)/γ_t$ 的上界为 $\min\{O(R^2/ε^2), 2m\}$ ，当 $1/ε^2 \ll m$ 时实现与图大小无关的复杂度
实验验证：在大规模真实图上验证了方法的有效性，展示了早期阶段的显著加速效果

min f(x) = (1/2)x⊤Qx - αx⊤D^(-1/2)b

其中Q = ((1+α)/2)I - ((1-α)/2)D^(-1/2)AD^(-1/2)，特征值λ(Q) ∈ α,1。

2. 嵌套ESP定义

在外循环迭代t，局部求解器M维护内循环迭代k上的活跃集合序列{S_t^(k)}_{k≥0}，更新仅限于活跃集合内的节点。

3. AESP更新规则

x^(t) = M(φ_t, y^(t-1), η, α, b, G)
y^(t) = x^(t) + β_t(x^(t) - x^(t-1))

其中β_t是动量权重，M是局部算子。

局部化非精确近似算子

LOCGD (Local Gradient Descent)

z_t^(k+1) = z_t^(k) - (2∇h_t(z_t^(k)) ∘ 1_{S_t^k})/(1 + α + 2η)

活跃节点集合： $S_t^k = \{u : |∇_u h_t^{-1/2}(z_t^{(k)})| ≥ ε_t\}$

LOCAPPR (Local APPR)

对 $u_i ∈ S_t^k$ 的坐标级更新：

z_t^(k_{i+1}) = z_t^(k_i) - (2∇h_t(z_t^{(k_i)}) ∘ 1_{u_i})/(1 + α + 2η)

技术创新点

单调性保持：通过求解条件数为常数的正则化PPR线性系统，保证D^{1/2}-缩放梯度的ℓ₁范数单调递减
局部性控制：引入常数R来界定嵌套ESP过程中梯度比率的有界性
加速与局部性平衡：在条件数1/α的依赖性和每轮时间复杂度O(R²/ε²)之间实现权衡

实验设置

数据集

实验使用19个真实世界图，规模从小型到超大型：

中等规模：com-dblp (317K节点, 1M边)
大规模：ogb-mag240m (244M节点, 1.7B边), ogbn-papers100M (111M节点, 1.6B边)
其他：com-friendster, wiki-en21等

评价指标

误差度量： $\log \|D^{-1}(π̂-π)\|_∞$
效率度量：操作次数、运行时间
加速比：相对于基线方法的性能提升

对比方法

APPR：标准近似个性化PageRank算法
APPR-opt：使用最优步长的APPR
LOCGD：局部梯度下降
ASPR：加速稀疏个性化PageRank
FISTA：快速迭代收缩阈值算法

实现细节

阻尼因子：α = 0.01, 0.1
精度阈值：ε = 10⁻⁶
随机选择5个源节点进行测试
Python实现，使用numba加速

AESP-LOCAPPR表现最佳，得益于在线坐标更新
早期加速：AESP方法在早期阶段实现比基线方法更快的收敛
操作数减少：相比APPR减少2-10倍操作数

α依赖性分析

当α较小时，AESP显著加速标准局部方法：

α ∈ 10⁻³, 10⁻¹范围内测试
加速比随α减小而增大，验证了√α依赖性
运行时间和操作数均显著降低

初始化策略比较

三种初始化策略z_t^(0)的比较：

冷启动：z_t^(0) = 0
前一估计：z_t^(0) = x^(t-1)
动量初始化：z_t^(0) = y^(t-1) (推荐)

动量初始化策略表现最佳，需要最少的外循环迭代次数。

消融实验

常数R的分析

在19个图上R保持为小常数(1.0-1.4)
R对图大小和条件数不敏感
验证了理论分析中R有界假设的合理性

理论突破：首次实现了PPR计算的可证明局部加速，时间复杂度从O(1/α)改进到O(1/√α)
实用性：当ε ≥ 1/√m时，算法复杂度与图大小无关
通用性：框架可扩展到变分形式和其他相关问题

局限性

常数R界限：无法用图大小或输入参数普遍界定R
ε²依赖性：当ε < 1/√m时，局部界限退化为O(m/√α)
理论与实践差距：ε_t的保守估计可能导致次优界限

未来方向

改进界限：探索是否能达到猜想的O(1/(√αε))复杂度
消除R依赖：通过约束或自适应重启消除常数R
扩展应用：将技术应用到双向PPR、单源PPR估计等问题

深度评价

优点

理论贡献显著：解决了文献中的开放猜想，建立了严格的理论保证
方法创新性强：巧妙结合Catalyst框架与局部演化集合过程
实验充分：在19个不同规模图上验证，从小型到超大型图
写作清晰：数学推导严谨，算法描述详细

不足

实用性限制：当ε很小时优势不明显，R的界定问题影响实际应用
实现复杂度：嵌套结构和参数调节增加了实现难度
对比不够全面：缺少与最新加速方法的详细比较

影响力

学术价值：为图算法加速提供了新思路，理论意义重大
实用价值：在大规模图分析、推荐系统等领域有应用潜力
可复现性：代码公开，实验设置详细

适用场景

大规模图分析：特别是当精度要求不极高时(ε ≥ 1/√m)
实时推荐系统：需要快速计算局部重要性分数
图神经网络：作为预处理步骤计算节点重要性

参考文献

本文引用了52篇相关文献，涵盖了PPR计算、加速优化、局部算法等多个领域的重要工作，为研究提供了坚实的理论基础。

总体评价：这是一篇高质量的理论与实践并重的论文，在PPR计算加速这一重要问题上取得了显著进展。虽然存在一些理论局限，但其创新性和实用性使其成为该领域的重要贡献。