Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Î(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers.
However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's.
In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Î(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path.
In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic
Dérandomisation sans perte pour les chemins les plus courts à source unique non orientés et les oracles de distance approximatifs
Cet article étudie un problème fondamental dans les algorithmes de chemins les plus courts sur graphes non orientés : comment sélectionner un sous-ensemble de sommets comme centres et cultiver des boules à partir de chaque sommet jusqu'à atteindre un centre, dans le but de minimiser la taille des boules. L'algorithme aléatoire peut échantillonner uniformément r centres pour atteindre la taille de boule optimale attendue Θ(n/r), mais les méthodes de dérandomisation traditionnelles introduisent un facteur supplémentaire O(log n), ce qui représente un coût prohibitif dans certaines applications. En exploitant le fait que la taille des boules peut être choisie de manière adaptative par l'algorithme, cet article propose un algorithme déterministe simple qui atteint la taille de boule optimale Θ(n/r) en moyenne et s'étend à des fonctions de coût de taille polynomiale arbitraire. Cette technique est appliquée avec succès à la dérandomisation de l'algorithme de chemin le plus court à source unique O(m√(log n log log n)) de DMSY23 et de l'oracle de distance approximatif classique de Thorup-Zwick, sans perte de complexité temporelle/spatiale.
Le problème fondamental résolu dans cet article est le problème de frappe des boules cultivables (Hitting Growable Balls). Dans de nombreux algorithmes de graphes, particulièrement pour les chemins les plus courts, les oracles de distance et les algorithmes de sous-graphes creux, on rencontre le motif suivant :
Sélectionner un sous-ensemble de sommets R comme centres
Cultiver une boule B(v) à partir de chaque sommet v jusqu'à atteindre un centre
Les performances de l'algorithme dépendent de la taille de |R| et de la somme des tailles de toutes les boules
Ce problème occupe une position fondamentale dans les algorithmes de graphes, affectant l'efficacité de plusieurs algorithmes importants :
Chemin le plus court à source unique : L'algorithme DMSY23 franchit pour la première fois la limite O(m + n log n) de l'algorithme de Dijkstra sur les graphes creux
Oracle de distance : L'oracle de Thorup-Zwick est une structure de données classique pour les requêtes de distance approximative
Sparsification de graphes : Des techniques similaires sont également utilisées dans la construction de sous-graphes creux
Les méthodes de dérandomisation traditionnelles présentent des défauts critiques :
Coût de la méthode folklorique : L'utilisation de l'algorithme d'approximation O(log n) pour le problème de couverture d'ensemble introduit un facteur supplémentaire O(log n)
Perte de performance grave : Pour l'algorithme DMSY23, ce facteur supplémentaire fait dégénérer la complexité temporelle de O(m√(log n log log n)) à O(m log n √(log log n)), ce qui est surpassé par l'algorithme de Dijkstra
Hypothèse de taille de boule fixe : Les méthodes traditionnelles supposent que la taille des boules est fixée par l'entrée, ne pouvant pas exploiter l'adaptabilité de l'algorithme
L'intuition clé de cet article est : la taille des boules peut être choisie de manière adaptative par l'algorithme, plutôt que d'être fixée par l'entrée. Cela ouvre de nouvelles possibilités pour concevoir des algorithmes de dérandomisation plus efficaces.
Proposition d'un algorithme déterministe pour frapper les boules cultivables : Conception de l'Algorithme 1, capable d'atteindre la taille de boule optimale Θ(n/r) en moyenne, sans introduire de facteur logarithmique supplémentaire
Dérandomisation sans perte de l'algorithme DMSY23 : Conversion de l'algorithme aléatoire de chemin le plus court O(m√(log n log log n)) en un algorithme déterministe de même complexité
Dérandomisation de l'oracle de distance de Thorup-Zwick : Suppression du facteur O(log n) des méthodes de dérandomisation précédentes, atteignant le même temps de prétraitement O(kn^(1/k)(m + n log n)) que la version aléatoire
Fourniture d'un cadre théorique général : La méthode s'étend à des fonctions de coût de taille polynomiale arbitraire, avec une large applicabilité
La définition formelle du problème de frappe des boules cultivables est la suivante :
Entrée : n sommets, m boules initialement vides, paramètre r ∈ 1,n, fonction de coût f(·)
Opération : L'algorithme peut sélectionner une boule et demander à l'adversaire d'y ajouter un nouveau sommet
Objectif : Sélectionner r sommets comme centres de sorte que chaque boule soit frappée (contienne au moins un centre), minimisant le coût total ∑f(|Bi|)
L'Algorithme 1 est la contribution principale de cet article :
Algorithme 1 : Frappe des boules cultivables
Entrée : nombre de sommets n, nombre de boules m, nombre de centres cible r, paramètre de coût p
Sortie : au plus r centres frappant toutes les boules
1 : Initialiser toutes les boules comme vides, aucun centre sélectionné
2 : b ← ⌈2^(p+2)n/r⌉
3 : Cultiver chaque boule à la taille min{b, n}
4 : while pas toutes les boules ne sont frappées do
5 : m' ← nombre de boules non frappées
6 : Répéter la sélection du nouveau centre frappant le plus de boules non frappées,
jusqu'à ce que le nombre de boules non frappées ≤ m'/2^(p+1)
7 : b ← 2b
8 : Cultiver chaque boule non frappée à la taille min{b, n}
9 : return tous les centres sélectionnés
Stratégie de décroissance exponentielle : À la i-ème itération, utiliser seulement O(r/2^i) centres, mais permettre aux boules de croître à 2^i n/r
Équilibre des compromis : Bien que les boules soient plus grandes dans les itérations ultérieures, le nombre de boules non frappées décroît exponentiellement
Croissance adaptative : Ajuster dynamiquement la taille des boules selon la situation actuelle des boules non frappées
Cet article est principalement un travail théorique, vérifiant la correction et les limites de complexité de l'algorithme par des preuves mathématiques rigoureuses.
L'article cite des travaux connexes abondants, incluant principalement :
DMSY23 : Algorithme aléatoire de chemin le plus court à source unique de Duan et al.
TZ05 : Travail original de l'oracle de distance approximatif de Thorup-Zwick
RTZ05 : Améliorations de dérandomisation de Roditty et al.
Dij59 : Algorithme classique de chemin le plus court de Dijkstra
FT87 : Travaux connexes sur les tas de Fibonacci
Cet article apporte une contribution importante au domaine de l'informatique théorique, particulièrement dans la dérandomisation des algorithmes de graphes. Bien qu'il manque de vérification expérimentale, sa valeur théorique et ses perspectives d'application potentielles en font un progrès important dans ce domaine.