Accelerated Evolving Set Processes for Local PageRank Computation
Huang, Luo, Xiao et al.
This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $ε$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtα)$ such linear systems, where $α$ is the damping factor. When $1/ε^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtαε^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.
academic
Processus d'Ensembles Évolutifs Accélérés pour le Calcul du PageRank Local
Cet article propose un nouveau cadre basé sur les processus d'ensembles évolutifs imbriqués (nested evolving set processes) pour accélérer le calcul du PageRank personnalisé (PPR). À chaque étape, une itération de point proximal inexacte localisée est utilisée pour résoudre un système linéaire simplifié. L'étude montre que la borne supérieure de la complexité temporelle de ces méthodes localisées est min{O~(R2/ε2),O~(m)} pour obtenir une ε-approximation du vecteur PPR, où m représente le nombre d'arêtes du graphe et R est une constante définie par le processus d'ensembles évolutifs imbriqués. L'algorithme induit par le cadre ne nécessite que la résolution de O~(1/α) systèmes linéaires, où α est le facteur d'amortissement. Lorsque 1/ε2≪m, cela implique l'existence d'un algorithme capable de calculer une ε-approximation du vecteur PPR avec une complexité temporelle totale de O~(R2/(αε2)), indépendante de la taille du graphe sous-jacent.
Le vecteur PageRank personnalisé (PPR) π ∈ ℝⁿ est défini comme :
(I - (1-α)(I + AD⁻¹)/2)π = αeₛ
où eₛ est le vecteur de base standard correspondant au nœud source s, α ∈ (0,1) est le facteur d'amortissement, et A et D sont respectivement la matrice d'adjacence et la matrice de degré du graphe non orienté G(V,E).
Importance: Le PPR est un outil fondamental pour l'analyse de graphes, largement appliqué au clustering local, à la modélisation des processus de diffusion, aux réseaux de neurones graphiques, etc.
Limitations existantes:
Les méthodes standard comme APPR ont une complexité temporelle de O(1/(αε))
Les méthodes accélérées font face au défi de la rupture de la monotonie des résidus par les termes de momentum
Les méthodes d'accélération existantes peuvent accéder à l'ensemble du graphe, entraînant une complexité temporelle de O(m/√α)
Question ouverte: Existe-t-il une méthode d'accélération locale avec une complexité temporelle dépendant de 1/√α plutôt que de 1/α ?
Cadre AESP: Propose le cadre des Processus d'Ensembles Évolutifs Accélérés (AESP), utilisant O~(1/α) processus d'ensembles évolutifs courts plutôt qu'un seul processus long
Garanties théoriques: Établit une complexité temporelle de O~(vol(St)/(αγt)), correspondant à la conjecture de limite d'accélération dans la littérature existante
Garanties de localité: Prouve que la borne supérieure de vol(St)/γt est min{O(R2/ε2),2m}, réalisant une complexité indépendante de la taille du graphe lorsque 1/ε2≪m
Vérification expérimentale: Valide l'efficacité de la méthode sur de grands graphes réels, démontrant une accélération significative aux étapes précoces
Étant donné un paramètre de précision ε, concevoir un algorithme local pour calculer une ε-approximation π̂ satisfaisant ∥D−1(π^−π)∥∞≤ε, tout en évitant d'accéder à l'ensemble du graphe.
À l'itération externe t, le solveur local M maintient une séquence d'ensembles actifs {S_t^(k)}_{k≥0} sur les itérations internes k, avec les mises à jour limitées aux nœuds de l'ensemble actif.
Préservation de la monotonie: En résolvant un système linéaire PPR régularisé avec un nombre de conditions constant, garantit la décroissance monotone de la norme ℓ₁ du gradient mis à l'échelle par D^{1/2}
Contrôle de la localité: Introduit une constante R pour borner la ratio de gradients dans le processus d'ensembles évolutifs imbriqués
Équilibre entre accélération et localité: Réalise un compromis entre la dépendance du nombre de conditions 1/α et la complexité temporelle par tour O(R²/ε²)
Percée théorique: Première réalisation d'une accélération locale prouvable pour le calcul du PPR, améliorant la complexité temporelle de O(1/α) à O(1/√α)
Praticité: Lorsque ε ≥ 1/√m, la complexité de l'algorithme est indépendante de la taille du graphe
Généralité: Le cadre peut s'étendre à la forme variationnelle et à d'autres problèmes connexes
Cet article cite 52 références connexes, couvrant plusieurs domaines importants du calcul du PPR, de l'optimisation accélérée et des algorithmes locaux, fournissant une base théorique solide à la recherche.
Évaluation Globale: Ceci est un article de haute qualité combinant théorie et pratique, réalisant des progrès significatifs sur le problème important de l'accélération du calcul du PPR. Bien qu'il présente certaines limitations théoriques, son innovation et sa praticité en font une contribution importante dans ce domaine.