Accelerated Evolving Set Processes for Local PageRank Computation
Huang, Luo, Xiao et al.
This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $ε$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtα)$ such linear systems, where $α$ is the damping factor. When $1/ε^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtαε^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.
academic
Procesos de Conjuntos Evolutivos Acelerados para el Cálculo de PageRank Local
Este artículo propone un nuevo marco basado en procesos de conjuntos evolutivos anidados (nested evolving set processes) para acelerar el cálculo del PageRank personalizado (PPR). En cada etapa, se emplean iteraciones de puntos aproximados no exactas localizadas para resolver sistemas lineales simplificados. La investigación demuestra que el límite superior de la complejidad temporal de tales métodos localizados es min{O~(R2/ε2),O~(m)} para obtener una ε-aproximación del vector PPR, donde m representa el número de aristas en el grafo y R es una constante definida mediante procesos de conjuntos evolutivos anidados. El algoritmo inducido por el marco requiere resolver solo O~(1/α) sistemas lineales de este tipo, donde α es el factor de amortiguamiento. Cuando 1/ε2≪m, esto implica la existencia de un algoritmo que calcula la ε-aproximación del vector PPR con una complejidad temporal total de O~(R2/(αε2)), independiente del tamaño del grafo subyacente.
El vector de PageRank personalizado (PPR) π ∈ ℝⁿ se define como:
(I - (1-α)(I + AD⁻¹)/2)π = αeₛ
donde eₛ es el vector base estándar correspondiente al nodo fuente s, α ∈ (0,1) es el factor de amortiguamiento, y A y D son respectivamente la matriz de adyacencia y la matriz de grados del grafo no dirigido G(V,E).
Importancia: PPR es una herramienta central en análisis de grafos, ampliamente aplicada en agrupamiento local, modelado de procesos de difusión, redes neuronales de grafos y otros campos
Limitaciones Existentes:
Los métodos estándar como APPR tienen complejidad temporal O(1/(αε))
Los métodos acelerados enfrentan el desafío de que los términos de momento destruyen la monotonía de los residuos
Los métodos acelerados existentes pueden acceder a todo el grafo, resultando en complejidad temporal O(m/√α)
Problema Abierto: ¿Existe un método local acelerado con complejidad temporal que dependa de 1/√α en lugar de 1/α?
Marco AESP: Se propone el marco de Procesos de Conjuntos Evolutivos Acelerados (AESP), que utiliza O~(1/α) procesos de conjuntos evolutivos cortos en lugar de un único proceso largo
Garantías Teóricas: Se establece una complejidad temporal de O~(vol(St)/(αγt)), coincidiendo con la conjetura de límite acelerado en la literatura existente
Garantías de Localidad: Se demuestra que el límite superior de vol(St)/γt es min{O(R2/ε2),2m}, logrando complejidad independiente del tamaño del grafo cuando 1/ε2≪m
Verificación Experimental: Se valida la efectividad del método en grafos reales a gran escala, demostrando aceleración significativa en etapas tempranas
Dado un parámetro de precisión ε, diseñar un algoritmo local que calcule una ε-aproximación π̂ satisfaciendo ∥D−1(π^−π)∥∞≤ε, evitando simultáneamente acceder a todo el grafo.
En la iteración externa t, el solucionador local M mantiene una secuencia de conjuntos activos {S_t^(k)}_{k≥0} sobre iteraciones internas k, con actualizaciones limitadas a nodos dentro del conjunto activo.
Preservación de Monotonía: Al resolver sistemas lineales PPR regularizados con número de condición constante, se garantiza que la norma ℓ₁ del gradiente escalado por D^{1/2} disminuye monótonamente
Control de Localidad: Se introduce una constante R para acotar la razón de gradientes en procesos ESP anidados
Equilibrio entre Aceleración y Localidad: Se logra un equilibrio entre la dependencia del número de condición 1/α y la complejidad temporal por ronda O(R²/ε²)
Este artículo cita 52 referencias relacionadas, abarcando múltiples campos incluyendo cálculo de PPR, optimización acelerada, algoritmos locales, proporcionando base teórica sólida para la investigación.
Evaluación General: Este es un artículo de alta calidad que equilibra teoría y práctica, logrando progreso significativo en el importante problema de aceleración de cálculo de PPR. Aunque presenta algunas limitaciones teóricas, su innovación y practicidad lo convierten en una contribución importante en este campo.