Accelerated Evolving Set Processes for Local PageRank Computation
Huang, Luo, Xiao et al.
This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $ε$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtα)$ such linear systems, where $α$ is the damping factor. When $1/ε^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtαε^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.
academic
Beschleunigte evolvierende Mengenprozesse zur lokalen PageRank-Berechnung
Dieses Paper präsentiert einen neuen Rahmen basierend auf verschachtelten evolvierenden Mengenprozessen (nested evolving set processes) zur Beschleunigung der Berechnung von personalisiertem PageRank (PPR). In jeder Phase wird eine lokalisierte inexakte proximale Punkt-Iteration zur Lösung vereinfachter linearer Systeme eingesetzt. Die Forschung zeigt, dass die Zeitkomplexität solcher lokalisierter Methoden durch min{O~(R2/ε2),O~(m)} begrenzt ist, um eine ε-Approximation des PPR-Vektors zu erhalten, wobei m die Anzahl der Kanten im Graphen darstellt und R eine durch verschachtelte evolvierende Mengenprozesse definierte Konstante ist. Der durch den Rahmen induzierte Algorithmus erfordert nur die Lösung von O~(1/α) solcher linearen Systeme, wobei α der Dämpfungsfaktor ist. Wenn 1/ε2≪m, bedeutet dies, dass ein Algorithmus existiert, der eine ε-Approximation des PPR-Vektors mit einer Gesamtzeitkomplexität von O~(R2/(αε2)) berechnet, unabhängig von der Größe des zugrunde liegenden Graphen.
Der personalisierte PageRank-Vektor (PPR) π ∈ ℝⁿ ist definiert als:
(I - (1-α)(I + AD⁻¹)/2)π = αeₛ
wobei eₛ der Standardbasisvektor des Quellknotens s ist, α ∈ (0,1) der Dämpfungsfaktor ist, und A und D jeweils die Adjazenzmatrix und Gradmatrix des ungerichteten Graphen G(V,E) sind.
Bedeutung: PPR ist ein Kernwerkzeug der Graphenanalyse mit breiter Anwendung in lokaler Clusterung, Diffusionsprozessmodellierung und Graphenneuralen Netzen
Bestehende Einschränkungen:
Standardmethoden wie APPR haben Zeitkomplexität O(1/(αε))
Beschleunigte Methoden sehen sich der Herausforderung gegenüber, dass Momentumterme die Residuenmonotonie zerstören
Bestehende beschleunigte Methoden können den gesamten Graphen durchsuchen, was zu O(m/√α) Zeitkomplexität führt
Offene Fragen: Existiert eine lokale beschleunigte Methode mit Zeitkomplexität abhängig von 1/√α statt 1/α?
AESP-Rahmen: Präsentation des Rahmens für beschleunigte evolvierende Mengenprozesse (AESP), der O~(1/α) kurze evolvierende Mengenprozesse statt eines einzelnen langen Prozesses verwendet
Theoretische Garantien: Etablierung der Zeitkomplexität O~(vol(St)/(αγt)), die die Vermutung über beschleunigte Grenzen in der bestehenden Literatur erfüllt
Lokalisierungsgarantien: Beweis, dass die Obergrenze von vol(St)/γt gleich min{O(R2/ε2),2m} ist, was bei 1/ε2≪m eine von der Graphengröße unabhängige Komplexität erreicht
Experimentelle Validierung: Verifikation der Methodeneffektivität auf großen realen Graphen mit signifikanter Beschleunigung in frühen Phasen
Gegeben ein Genauigkeitsparameter ε, entwerfen Sie einen lokalen Algorithmus zur Berechnung einer ε-Approximation π̂, die ∥D−1(π^−π)∥∞≤ε erfüllt, während der Zugriff auf den gesamten Graphen vermieden wird.
In der äußeren Schleifenwiederholung t verwaltet der lokale Solver M eine Sequenz aktiver Mengen {S_t^(k)}_{k≥0} über innere Schleifenwiederholungen k, wobei Aktualisierungen auf Knoten in der aktiven Menge beschränkt sind.
Monotonie-Erhaltung: Durch Lösung von regularisierten PPR-Linearsystemen mit konstanter Konditionszahl wird die Monotonie der ℓ₁-Norm des D^{1/2}-skalierten Gradienten gewährleistet
Lokalisierungskontrolle: Einführung einer Konstanten R zur Begrenzung der Gradienten-Verhältnisse in verschachtelten ESP-Prozessen
Ausgleich zwischen Beschleunigung und Lokalisierung: Erreichung eines Kompromisses zwischen der Abhängigkeit von der Konditionszahl 1/α und der Zeitkomplexität pro Runde O(R²/ε²)
Dieses Paper zitiert 52 relevante Arbeiten, die wichtige Arbeiten in mehreren Bereichen wie PPR-Berechnung, beschleunigte Optimierung und lokale Algorithmen abdecken und eine solide theoretische Grundlage für die Forschung bieten.
Gesamtbewertung: Dies ist ein hochqualitatives Paper mit Schwerpunkt auf Theorie und Praxis, das signifikante Fortschritte beim wichtigen Problem der PPR-Berechnungsbeschleunigung erzielt. Obwohl einige theoretische Einschränkungen bestehen, machen seine Innovativität und Praktikabilität es zu einem wichtigen Beitrag auf diesem Gebiet.