2025-11-20T02:31:13.678138

Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles

Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Θ(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers. However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's. In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Θ(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path. In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic

Dérandomisation sans perte pour les chemins les plus courts à source unique non orientés et les oracles de distance approximatifs

Informations de base

  • ID de l'article : 2510.12598
  • Titre : Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
  • Auteur : Shuyi Yan (BARC, Université de Copenhague)
  • Classification : cs.DS (Structures de données et algorithmes)
  • Date de publication : 14 octobre 2025 (prépublication arXiv)
  • Lien de l'article : https://arxiv.org/abs/2510.12598

Résumé

Cet article étudie un problème fondamental dans les algorithmes de chemins les plus courts sur graphes non orientés : comment sélectionner un sous-ensemble de sommets comme centres et cultiver des boules à partir de chaque sommet jusqu'à atteindre un centre, dans le but de minimiser la taille des boules. L'algorithme aléatoire peut échantillonner uniformément r centres pour atteindre la taille de boule optimale attendue Θ(n/r), mais les méthodes de dérandomisation traditionnelles introduisent un facteur supplémentaire O(log n), ce qui représente un coût prohibitif dans certaines applications. En exploitant le fait que la taille des boules peut être choisie de manière adaptative par l'algorithme, cet article propose un algorithme déterministe simple qui atteint la taille de boule optimale Θ(n/r) en moyenne et s'étend à des fonctions de coût de taille polynomiale arbitraire. Cette technique est appliquée avec succès à la dérandomisation de l'algorithme de chemin le plus court à source unique O(m√(log n log log n)) de DMSY23 et de l'oracle de distance approximatif classique de Thorup-Zwick, sans perte de complexité temporelle/spatiale.

Contexte et motivation de la recherche

Problème fondamental

Le problème fondamental résolu dans cet article est le problème de frappe des boules cultivables (Hitting Growable Balls). Dans de nombreux algorithmes de graphes, particulièrement pour les chemins les plus courts, les oracles de distance et les algorithmes de sous-graphes creux, on rencontre le motif suivant :

  1. Sélectionner un sous-ensemble de sommets R comme centres
  2. Cultiver une boule B(v) à partir de chaque sommet v jusqu'à atteindre un centre
  3. Les performances de l'algorithme dépendent de la taille de |R| et de la somme des tailles de toutes les boules

Importance du problème

Ce problème occupe une position fondamentale dans les algorithmes de graphes, affectant l'efficacité de plusieurs algorithmes importants :

  • Chemin le plus court à source unique : L'algorithme DMSY23 franchit pour la première fois la limite O(m + n log n) de l'algorithme de Dijkstra sur les graphes creux
  • Oracle de distance : L'oracle de Thorup-Zwick est une structure de données classique pour les requêtes de distance approximative
  • Sparsification de graphes : Des techniques similaires sont également utilisées dans la construction de sous-graphes creux

Limitations des méthodes existantes

Les méthodes de dérandomisation traditionnelles présentent des défauts critiques :

  1. Coût de la méthode folklorique : L'utilisation de l'algorithme d'approximation O(log n) pour le problème de couverture d'ensemble introduit un facteur supplémentaire O(log n)
  2. Perte de performance grave : Pour l'algorithme DMSY23, ce facteur supplémentaire fait dégénérer la complexité temporelle de O(m√(log n log log n)) à O(m log n √(log log n)), ce qui est surpassé par l'algorithme de Dijkstra
  3. Hypothèse de taille de boule fixe : Les méthodes traditionnelles supposent que la taille des boules est fixée par l'entrée, ne pouvant pas exploiter l'adaptabilité de l'algorithme

Motivation de la recherche

L'intuition clé de cet article est : la taille des boules peut être choisie de manière adaptative par l'algorithme, plutôt que d'être fixée par l'entrée. Cela ouvre de nouvelles possibilités pour concevoir des algorithmes de dérandomisation plus efficaces.

Contributions principales

  1. Proposition d'un algorithme déterministe pour frapper les boules cultivables : Conception de l'Algorithme 1, capable d'atteindre la taille de boule optimale Θ(n/r) en moyenne, sans introduire de facteur logarithmique supplémentaire
  2. Dérandomisation sans perte de l'algorithme DMSY23 : Conversion de l'algorithme aléatoire de chemin le plus court O(m√(log n log log n)) en un algorithme déterministe de même complexité
  3. Dérandomisation de l'oracle de distance de Thorup-Zwick : Suppression du facteur O(log n) des méthodes de dérandomisation précédentes, atteignant le même temps de prétraitement O(kn^(1/k)(m + n log n)) que la version aléatoire
  4. Fourniture d'un cadre théorique général : La méthode s'étend à des fonctions de coût de taille polynomiale arbitraire, avec une large applicabilité

Explication détaillée de la méthode

Définition de la tâche

La définition formelle du problème de frappe des boules cultivables est la suivante :

  • Entrée : n sommets, m boules initialement vides, paramètre r ∈ 1,n, fonction de coût f(·)
  • Opération : L'algorithme peut sélectionner une boule et demander à l'adversaire d'y ajouter un nouveau sommet
  • Objectif : Sélectionner r sommets comme centres de sorte que chaque boule soit frappée (contienne au moins un centre), minimisant le coût total ∑f(|Bi|)

Architecture de l'algorithme fondamental

L'Algorithme 1 est la contribution principale de cet article :

Algorithme 1 : Frappe des boules cultivables
Entrée : nombre de sommets n, nombre de boules m, nombre de centres cible r, paramètre de coût p
Sortie : au plus r centres frappant toutes les boules

1 : Initialiser toutes les boules comme vides, aucun centre sélectionné
2 : b ← ⌈2^(p+2)n/r⌉
3 : Cultiver chaque boule à la taille min{b, n}
4 : while pas toutes les boules ne sont frappées do
5 :   m' ← nombre de boules non frappées
6 :   Répéter la sélection du nouveau centre frappant le plus de boules non frappées,
     jusqu'à ce que le nombre de boules non frappées ≤ m'/2^(p+1)
7 :   b ← 2b
8 :   Cultiver chaque boule non frappée à la taille min{b, n}
9 : return tous les centres sélectionnés

Idée fondamentale de l'algorithme

  1. Stratégie de décroissance exponentielle : À la i-ème itération, utiliser seulement O(r/2^i) centres, mais permettre aux boules de croître à 2^i n/r
  2. Équilibre des compromis : Bien que les boules soient plus grandes dans les itérations ultérieures, le nombre de boules non frappées décroît exponentiellement
  3. Croissance adaptative : Ajuster dynamiquement la taille des boules selon la situation actuelle des boules non frappées

Analyse théorique

Le Théorème 4 prouve la correction de l'algorithme :

  • Nombre de centres : Sélectionner au plus r centres
  • Coût total : O_p(m(n/r)^p) = O_p(m·f(n/r))
  • Complexité temporelle : O_p(r + mn/r)

Points clés de la preuve :

  1. Analyse de la limite supérieure du nombre de centres à chaque itération
  2. Décroissance exponentielle du nombre de boules non frappées
  3. Obtention de la limite du coût total par sommation de série géométrique

Configuration expérimentale

Vérification théorique

Cet article est principalement un travail théorique, vérifiant la correction et les limites de complexité de l'algorithme par des preuves mathématiques rigoureuses.

Vérification d'application

La validité de la méthode est vérifiée par deux applications concrètes :

  1. Chemin le plus court à source unique :
    • Intégration de l'Algorithme 1 dans la phase de construction de bundle de DMSY23
    • Fonction de coût définie comme f(x) = x log x
    • Sélection de paramètres r = m√(log log n)/√(log n)
  2. Oracle de distance de Thorup-Zwick :
    • Application de l'Algorithme 1 à chaque niveau i pour sélectionner A_{i+1}
    • Combinaison avec la technique RTZ05 pour une opération de croissance de boule efficace
    • Paramètres définis comme r = n^(-1/k)|A_i|

Détails d'implémentation

Optimisations de structure de données :

  • Maintenir le nombre de boules non frappées que chaque sommet j peut frapper a_j
  • Utiliser des listes doublement chaînées L_k maintenant les sommets avec a_j = k
  • Supporter les opérations d'insertion, suppression et recherche du maximum en temps O(1)

Résultats expérimentaux

Résultats principaux

Théorème 2 (Chemin le plus court à source unique) :

  • Dans les graphes non orientés avec poids d'arête non négatifs, il existe un algorithme déterministe de comparaison-addition
  • Complexité temporelle : O(m√(log n log log n))
  • Exactement la même complexité que l'algorithme aléatoire DMSY23

Théorème 3 (Oracle de Thorup-Zwick) :

  • Oracle de distance approximatif de Thorup-Zwick de taille O(kn^{1+1/k})
  • Peut être construit de manière déterministe en temps O(kn^{1/k}(m + n log n))
  • Même temps de prétraitement que l'algorithme aléatoire original

Comparaison des complexités

AlgorithmeTypeComplexité temporelleRemarques
DijkstraDéterministeO(m + n log n)Algorithme classique
DMSY23AléatoireO(m√(log n log log n))Première rupture avec Dijkstra
DMSY23+dérandomisation folkloriqueDéterministeO(m log n √(log log n))Surpassé par Dijkstra
Méthode de cet articleDéterministeO(m√(log n log log n))Dérandomisation sans perte

Vérification de l'innovation technique

Le Corollaire 5 démontre l'applicabilité de la méthode à différentes fonctions de coût :

  • Pour f(x) = x log x, par application de l'inégalité de Jensen
  • Limite du coût total : O(m(n/r)log(n/r))
  • Extensible à d'autres fonctions de coût de taille polynomiale

Travaux connexes

Chemin le plus court à source unique

  1. Algorithmes classiques : Algorithme de Dijkstra et ses améliorations
  2. Poids entiers : Algorithme en temps linéaire de Thorup
  3. Avancées récentes : Algorithme aléatoire DMSY23, algorithme déterministe DMM+25

Oracle de distance approximatif

  1. Travaux fondateurs : L'oracle de Thorup-Zwick pose les fondations
  2. Recherche en dérandomisation : RTZ05 propose des méthodes de dérandomisation améliorées
  3. Optimisation de requête : Améliorations du temps de requête par Wulff-Nilsen et al.

Techniques de dérandomisation

  1. Méthodes traditionnelles : Dérandomisation folklorique basée sur la couverture d'ensemble
  2. Limitations du problème : Facteur supplémentaire O(log n) inacceptable dans certaines applications
  3. Contribution de cet article : Première dérandomisation véritablement sans perte

Conclusion et discussion

Conclusions principales

  1. Percée théorique : Première dérandomisation sans perte du problème de frappe de boules, atteignant les limites optimales en moyenne
  2. Applications pratiques : Application réussie à deux algorithmes de graphes importants, maintenant la même complexité que les versions aléatoires
  3. Cadre général : Fourniture d'une méthode générale applicable à diverses fonctions de coût

Limitations

  1. Hypothèses du modèle :
    • Exige que le degré du graphe soit O(m/n) (réalisable par division de sommets)
    • Nécessite le modèle de comparaison-addition
    • Pour l'application DMSY23, suppose un graphe de degré constant
  2. Portée d'application :
    • Principalement applicable aux scénarios où la taille des boules peut être choisie de manière adaptative
    • Non applicable aux cas où la taille des boules est complètement fixée par l'entrée
  3. Efficacité pratique :
    • Bien que la complexité asymptotique soit optimale, les facteurs constants peuvent être importants
    • Sur les petits graphes, peut être moins efficace que les méthodes aléatoires simples

Directions futures

  1. Optimisation d'algorithme :
    • Réduction des facteurs constants dans l'algorithme
    • Conception de versions d'implémentation plus pratiques
  2. Extension d'application :
    • Exploration d'applications dans d'autres algorithmes de graphes
    • Étude des extensions dans les paramètres de graphes dynamiques
  3. Approfondissement théorique :
    • Étude des bornes inférieures, preuve de l'optimalité de la méthode
    • Extension à des fonctions de coût plus générales

Évaluation approfondie

Avantages

  1. Innovativité technique :
    • Première exploitation de la propriété de cultivabilité des boules pour une dérandomisation sans perte
    • Conception d'algorithme élégante et ingénieuse, stratégie de décroissance exponentielle très créative
  2. Contribution théorique :
    • Preuves mathématiques rigoureuses, analyse théorique complète
    • Fourniture d'un cadre général applicable à diverses fonctions de coût
  3. Signification pratique :
    • Résolution du problème de dérandomisation pour des algorithmes importants comme DMSY23
    • Amélioration fondamentale de l'oracle de Thorup-Zwick
  4. Clarté d'expression :
    • Structure d'article claire, description technique précise
    • Pseudocode d'algorithme concis et compréhensible

Insuffisances

  1. Absence de vérification expérimentale :
    • Travail purement théorique, manque de tests de performance réels
    • Pas de comparaison empirique avec d'autres méthodes
  2. Analyse des facteurs constants :
    • Bien qu'asymptotiquement optimal, les constantes cachées peuvent être importantes
    • L'efficacité dans les applications réelles reste à vérifier
  3. Portée d'application :
    • Principalement ciblé sur des types de problèmes spécifiques
    • Guidance limitée pour les problèmes de dérandomisation généraux

Impact

  1. Valeur académique :
    • Fournit de nouvelles perspectives pour les techniques de dérandomisation
    • Peut inspirer l'amélioration d'autres algorithmes
  2. Valeur pratique :
    • Fournit des outils importants pour les applications nécessitant des garanties déterministes
    • Peut avoir des applications en informatique distribuée et parallèle
  3. Reproductibilité :
    • Description d'algorithme claire, facile à implémenter
    • Les résultats théoriques peuvent être vérifiés indépendamment

Scénarios d'application

  1. Recherche théorique : Fournir une référence pour la dérandomisation d'autres algorithmes aléatoires
  2. Applications système : Remplacer les algorithmes aléatoires par des versions déterministes dans les systèmes nécessitant un comportement déterministe
  3. Fins pédagogiques : Servir de cas d'excellence pour les techniques de dérandomisation

Références

L'article cite des travaux connexes abondants, incluant principalement :

  1. DMSY23 : Algorithme aléatoire de chemin le plus court à source unique de Duan et al.
  2. TZ05 : Travail original de l'oracle de distance approximatif de Thorup-Zwick
  3. RTZ05 : Améliorations de dérandomisation de Roditty et al.
  4. Dij59 : Algorithme classique de chemin le plus court de Dijkstra
  5. FT87 : Travaux connexes sur les tas de Fibonacci

Cet article apporte une contribution importante au domaine de l'informatique théorique, particulièrement dans la dérandomisation des algorithmes de graphes. Bien qu'il manque de vérification expérimentale, sa valeur théorique et ses perspectives d'application potentielles en font un progrès important dans ce domaine.