Accelerated Evolving Set Processes for Local PageRank Computation
Huang, Luo, Xiao et al.
This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $ε$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtα)$ such linear systems, where $α$ is the damping factor. When $1/ε^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtαε^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.
academic
Ускоренные эволюционирующие процессы множеств для локального вычисления PageRank
В данной работе предложена новая структура, основанная на вложенных эволюционирующих процессах множеств (nested evolving set processes), для ускорения вычисления персонализованного PageRank (PPR). На каждом этапе используется локализованная неточная итерация проксимального оператора для решения упрощённой линейной системы. Исследование показывает, что верхняя граница временной сложности таких локализованных методов составляет min{O~(R2/ε2),O~(m)} для получения ε-приближения вектора PPR, где m обозначает количество рёбер в графе, а R — константа, определённая через вложенные эволюционирующие процессы множеств. Алгоритм, индуцированный данной структурой, требует решения только O~(1/α) таких линейных систем, где α — коэффициент затухания. Когда 1/ε2≪m, это означает существование алгоритма, вычисляющего ε-приближение вектора PPR с общей временной сложностью O~(R2/(αε2)), независимой от размера базового графа.
Вектор персонализованного PageRank π ∈ ℝⁿ определяется как:
(I - (1-α)(I + AD⁻¹)/2)π = αeₛ
где eₛ — стандартный базисный вектор, соответствующий исходному узлу s, α ∈ (0,1) — коэффициент затухания, A и D — матрица смежности и матрица степеней неориентированного графа G(V,E) соответственно.
Значимость: PPR является основным инструментом анализа графов, широко применяется в локальной кластеризации, моделировании процессов диффузии, графовых нейронных сетях и других областях
Существующие ограничения:
Стандартные методы, такие как APPR, имеют временную сложность O(1/(αε))
Ускоренные методы сталкиваются с проблемой нарушения монотонности остатка членами импульса
Существующие ускоренные методы могут обращаться ко всему графу, что приводит к временной сложности O(m/√α)
Открытый вопрос: Существует ли локальный ускоренный метод с временной сложностью, зависящей от 1/√α вместо 1/α?
Структура AESP: Предложена структура ускоренных эволюционирующих процессов множеств (AESP), использующая O~(1/α) коротких эволюционирующих процессов вместо одного длинного процесса
Теоретические гарантии: Установлена временная сложность O~(vol(St)/(αγt)), соответствующая гипотезе об ускоренных границах в существующей литературе
Гарантии локальности: Доказана верхняя граница vol(St)/γt равная min{O(R2/ε2),2m}, достигающая сложности, независимой от размера графа, когда 1/ε2≪m
Экспериментальная проверка: Метод верифицирован на крупномасштабных реальных графах, демонстрирующий значительное ускорение на ранних этапах
Для заданного параметра точности ε разработать локальный алгоритм, вычисляющий ε-приближение π̂, удовлетворяющее ∥D−1(π^−π)∥∞≤ε, избегая при этом обращения ко всему графу.
На внешней итерации цикла t локальный решатель M поддерживает последовательность активных множеств {S_t^(k)}_{k≥0} на внутренних итерациях цикла k, обновления ограничены узлами в активном множестве.
Сохранение монотонности: Путём решения регуляризованной линейной системы PPR с числом обусловленности, равным константе, обеспечивается монотонное убывание ℓ₁-нормы D^{1/2}-масштабированного градиента
Контроль локальности: Введена константа R для ограничения отношения градиентов в процессе вложенного ESP
Баланс ускорения и локальности: Достигнут компромисс между зависимостью от числа обусловленности 1/α и временной сложностью каждого раунда O(R²/ε²)
Работа цитирует 52 соответствующих источника, охватывающих вычисление PPR, ускоренную оптимизацию, локальные алгоритмы и другие области, обеспечивая прочную теоретическую базу для исследования.
Общая оценка: Это высококачественная работа, сочетающая теорию и практику, достигающая значительного прогресса в важной задаче ускорения вычисления PPR. Несмотря на некоторые теоретические ограничения, её инновационность и практичность делают её значительным вкладом в данную область.