Accelerated Evolving Set Processes for Local PageRank Computation
Huang, Luo, Xiao et al.
This work proposes a novel framework based on nested evolving set processes to accelerate Personalized PageRank (PPR) computation. At each stage of the process, we employ a localized inexact proximal point iteration to solve a simplified linear system. We show that the time complexity of such localized methods is upper bounded by $\min\{\tilde{\mathcal{O}}(R^2/ε^2), \tilde{\mathcal{O}}(m)\}$ to obtain an $ε$-approximation of the PPR vector, where $m$ denotes the number of edges in the graph and $R$ is a constant defined via nested evolving set processes. Furthermore, the algorithms induced by our framework require solving only $\tilde{\mathcal{O}}(1/\sqrtα)$ such linear systems, where $α$ is the damping factor. When $1/ε^2\ll m$, this implies the existence of an algorithm that computes an $\ epsilon $-approximation of the PPR vector with an overall time complexity of $\tilde{\mathcal{O}}\left(R^2 / (\sqrtαε^2)\right)$, independent of the underlying graph size. Our result resolves an open conjecture from existing literature. Experimental results on real-world graphs validate the efficiency of our methods, demonstrating significant convergence in the early stages.
academic
Processi di Insiemi Evolutivi Accelerati per il Calcolo del PageRank Locale
Questo articolo propone un nuovo framework basato su processi di insiemi evolutivi annidati (nested evolving set processes) per accelerare il calcolo del PageRank personalizzato (PPR). In ogni fase, viene adottata un'iterazione approssimata inesatta localizzata per risolvere sistemi lineari semplificati. La ricerca dimostra che il limite superiore della complessità temporale di tali metodi localizzati è min{O~(R2/ε2),O~(m)} per ottenere un'approssimazione ε del vettore PPR, dove m rappresenta il numero di archi nel grafo e R è una costante definita dal processo di insiemi evolutivi annidati. L'algoritmo indotto dal framework richiede solo di risolvere O~(1/α) sistemi lineari di questo tipo, dove α è il fattore di smorzamento. Quando 1/ε2≪m, ciò implica l'esistenza di un algoritmo che calcola un'approssimazione ε del vettore PPR con una complessità temporale totale di O~(R2/(αε2)), indipendente dalla dimensione del grafo sottostante.
Il vettore PageRank personalizzato (PPR) π ∈ ℝⁿ è definito come:
(I - (1-α)(I + AD⁻¹)/2)π = αeₛ
dove eₛ è il vettore di base standard corrispondente al nodo sorgente s, α ∈ (0,1) è il fattore di smorzamento, e A e D sono rispettivamente la matrice di adiacenza e la matrice dei gradi del grafo non orientato G(V,E).
Importanza: PPR è uno strumento fondamentale nell'analisi dei grafi, ampiamente applicato nel clustering locale, nella modellazione dei processi di diffusione, nelle reti neurali grafiche e in altri campi
Limitazioni Esistenti:
I metodi standard come APPR hanno complessità temporale O(1/(αε))
I metodi accelerati affrontano la sfida della rottura della monotonicità dei residui da parte dei termini di momento
I metodi accelerati esistenti potrebbero accedere all'intero grafo, risultando in una complessità temporale O(m/√α)
Problema Aperto: Esiste un metodo locale accelerato con complessità temporale dipendente da 1/√α anziché da 1/α?
Framework AESP: Propone il framework dei Processi di Insiemi Evolutivi Accelerati (AESP), che utilizza O~(1/α) processi di insiemi evolutivi brevi anziché un singolo processo lungo
Garanzie Teoriche: Stabilisce una complessità temporale di O~(vol(St)/(αγt)), corrispondente alla congettura del limite di accelerazione nella letteratura esistente
Garanzie di Località: Dimostra che il limite superiore di vol(St)/γt è min{O(R2/ε2),2m}, realizzando una complessità indipendente dalla dimensione del grafo quando 1/ε2≪m
Verifica Sperimentale: Verifica l'efficacia del metodo su grafi reali su larga scala, dimostrando significativi effetti di accelerazione nelle fasi iniziali
Dato un parametro di precisione ε, progettare un algoritmo locale per calcolare un'approssimazione ε π̂ che soddisfi ∥D−1(π^−π)∥∞≤ε, evitando al contempo di accedere all'intero grafo.
Nel ciclo esterno all'iterazione t, il risolutore locale M mantiene una sequenza di insiemi attivi {S_t^(k)}_{k≥0} sulle iterazioni del ciclo interno k, con aggiornamenti limitati ai nodi nell'insieme attivo.
Preservazione della Monotonicità: Risolvendo sistemi lineari PPR regolarizzati con numero di condizionamento costante, garantisce la diminuzione monotona della norma ℓ₁ del gradiente scalato D^{1/2}
Controllo della Località: Introduce una costante R per limitare la limitatezza del rapporto dei gradienti nel processo ESP annidato
Equilibrio tra Accelerazione e Località: Realizza un compromesso tra la dipendenza dal numero di condizionamento 1/α e la complessità temporale per round O(R²/ε²)
Avanzamento Teorico: Realizza per la prima volta un'accelerazione locale provabilmente corretta nel calcolo del PPR, migliorando la complessità temporale da O(1/α) a O(1/√α)
Praticità: Quando ε ≥ 1/√m, la complessità dell'algoritmo è indipendente dalla dimensione del grafo
Generalità: Il framework è estensibile a forme variazionali e altri problemi correlati
Limitazioni di Praticità: Quando ε è molto piccolo, i vantaggi non sono evidenti; il problema della limitazione di R influisce sulle applicazioni pratiche
Complessità di Implementazione: La struttura annidata e la regolazione dei parametri aumentano la difficoltà di implementazione
Confronti Incompleti: Mancano confronti dettagliati con i metodi accelerati più recenti
Questo articolo cita 52 lavori correlati, coprendo importanti ricerche in più campi inclusi il calcolo del PPR, l'ottimizzazione accelerata e gli algoritmi locali, fornendo una base teorica solida per la ricerca.
Valutazione Complessiva: Questo è un articolo di alta qualità che equilibra teoria e pratica, realizzando progressi significativi nel problema importante dell'accelerazione del calcolo del PPR. Sebbene esistano alcune limitazioni teoriche, la sua innovazione e praticità lo rendono un contributo importante nel campo.