2025-11-20T02:31:13.678138

Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles

Yan

A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Î(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers. However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's. In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Î(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path. In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.

academic

Verlustfreie Derandomisierung für ungerichtete Single-Source-Kürzestpfade und approximative Distanz-Orakel

Grundinformationen

Paper-ID: 2510.12598
Titel: Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
Autor: Shuyi Yan (BARC, Universität Kopenhagen)
Klassifikation: cs.DS (Datenstrukturen und Algorithmen)
Veröffentlichungsdatum: 14. Oktober 2025 (arXiv-Preprint)
Paper-Link: https://arxiv.org/abs/2510.12598

Zusammenfassung

Diese Arbeit untersucht ein Kernproblem in Algorithmen für Kürzestpfade in ungerichteten Graphen: Wie wählt man eine Teilmenge von Knoten als Mittelpunkte aus und lässt von jedem Knoten eine Kugel wachsen, bis sie einen Mittelpunkt erreicht, mit dem Ziel, die Kugelgröße so klein wie möglich zu halten. Randomisierte Algorithmen können r Mittelpunkte gleichmäßig samplen, um die optimale erwartete Kugelgröße Θ(n/r) zu erreichen. Jedoch führen traditionelle Derandomisierungsmethoden einen zusätzlichen Faktor O(log n) ein, was in bestimmten Anwendungen zu kostspielig ist. Diese Arbeit nutzt die Tatsache, dass die Kugelgröße vom Algorithmus adaptiv gewählt werden kann, und schlägt einen einfachen deterministischen Algorithmus vor, der im Durchschnitt die optimale Kugelgröße Θ(n/r) erreicht und auf beliebige polynomiale Kostenfunktionen erweiterbar ist. Die Technik wird erfolgreich auf die Derandomisierung des O(m√(log n log log n)) Single-Source-Kürzestpfad-Algorithmus von DMSY23 und des klassischen Thorup-Zwick-Approximations-Distanz-Orakels angewendet, ohne Zeit-/Raumkomplexität zu verlieren.

Forschungshintergrund und Motivation

Kernproblem

Das Kernproblem dieser Arbeit ist das Treffer-Problem für wachsende Kugeln (Hitting Growable Balls). In vielen Graphalgorithmen, besonders bei Kürzestpfaden, Distanz-Orakeln und Sparse-Subgraph-Algorithmen, tritt folgendes Muster auf:

Wähle eine Teilmenge von Knoten R als Mittelpunkte
Lasse von jedem Knoten v eine Kugel B(v) wachsen, bis sie einen Mittelpunkt erreicht
Die Algorithmusleistung hängt von der Größe von |R| und der Gesamtgröße aller Kugeln ab

Bedeutung des Problems

Dieses Problem hat eine grundlegende Stellung in Graphalgorithmen und beeinflusst die Effizienz mehrerer wichtiger Algorithmen:

Single-Source-Kürzestpfade: Der DMSY23-Algorithmus durchbricht erstmals die O(m + n log n)-Schranke von Dijkstra auf dünnen Graphen
Distanz-Orakel: Das Thorup-Zwick-Orakel ist eine klassische Datenstruktur für approximative Distanzabfragen
Graphverdünnung: Ähnliche Techniken werden auch bei der Konstruktion von Sparse Subgraphs verwendet

Einschränkungen bestehender Methoden

Traditionelle Derandomisierungsmethoden haben kritische Mängel:

Kosten der Folklore-Methode: Die Verwendung eines O(log n)-Approximationsalgorithmus für das Set-Cover-Problem zur Derandomisierung führt einen zusätzlichen Faktor O(log n) ein
Schwerwiegender Leistungsverlust: Für den DMSY23-Algorithmus würde dieser zusätzliche Faktor die Zeitkomplexität von O(m√(log n log log n)) auf O(m log n √(log log n)) verschlechtern, wodurch Dijkstra wieder überlegen wird
Annahme fester Kugelgröße: Traditionelle Methoden gehen davon aus, dass die Kugelgröße durch die Eingabe festgelegt ist und können die Adaptivität des Algorithmus nicht nutzen

Forschungsmotivation

Die Schlüsseleinsicht dieser Arbeit ist: Die Kugelgröße kann vom Algorithmus adaptiv gewählt werden, nicht von der Eingabe festgelegt. Dies eröffnet neue Möglichkeiten für den Entwurf besserer Derandomisierungsalgorithmen.

Kernbeiträge

Deterministischer Algorithmus für das Treffer-Problem wachsender Kugeln: Entwurf von Algorithmus 1, der im Durchschnitt die optimale Kugelgröße Θ(n/r) erreicht, ohne zusätzliche logarithmische Faktoren einzuführen
Verlustfreie Derandomisierung des DMSY23-Algorithmus: Umwandlung des randomisierten O(m√(log n log log n)) Single-Source-Kürzestpfad-Algorithmus in einen deterministischen Algorithmus mit gleicher Komplexität
Derandomisierung des Thorup-Zwick-Distanz-Orakels: Entfernung des O(log n)-Faktors aus früheren Derandomisierungsmethoden, Erreichen der gleichen O(kn^(1/k)(m + n log n)) Vorverarbeitungszeit wie die randomisierte Version
Bereitstellung eines allgemeinen theoretischen Rahmens: Die Methode ist auf beliebige polynomiale Kostenfunktionen erweiterbar und hat breite Anwendbarkeit

Methodische Details

Aufgabendefinition

Die formale Definition des Treffer-Problems für wachsende Kugeln ist wie folgt:

Eingabe: n Knoten, m anfangs leere Kugeln, Parameter r ∈ 1,n, Kostenfunktion f(·)
Operationen: Der Algorithmus kann eine Kugel wählen und den Gegner auffordern, einen neuen Knoten hinzuzufügen
Ziel: Wähle r Knoten als Mittelpunkte, sodass jede Kugel getroffen wird (mindestens einen Mittelpunkt enthält), minimiere die Gesamtkosten ∑f(|Bi|)

Kernalgorithmus-Architektur

Algorithmus 1 ist der Kernbeitrag dieser Arbeit:

Algorithmus 1: Treffer wachsender Kugeln
Eingabe: Knotenzahl n, Kugelzahl m, Zielanzahl Mittelpunkte r, Kostenparameter p
Ausgabe: Höchstens r Mittelpunkte, die alle Kugeln treffen

1: Initialisiere alle Kugeln als leer, keine Mittelpunkte gewählt
2: b ← ⌈2^(p+2)n/r⌉
3: Lasse jede Kugel bis zur Größe min{b, n} wachsen
4: while nicht alle Kugeln getroffen sind do
5:   m' ← Anzahl ungetroffener Kugeln
6:   Wähle wiederholt neue Mittelpunkte, die die meisten ungetroffenen Kugeln treffen,
     bis Anzahl ungetroffener Kugeln ≤ m'/2^(p+1)
7:   b ← 2b
8:   Lasse jede ungetroffene Kugel bis zur Größe min{b, n} wachsen
9: return Alle gewählten Mittelpunkte

Kernideen des Algorithmus

Exponentiell abnehmende Strategie: In Runde i werden nur O(r/2^i) Mittelpunkte verwendet, aber die Kugelgröße darf auf 2^i n/r wachsen
Ausgewogene Abwägung: Obwohl Kugeln in späteren Runden größer sind, nimmt die Anzahl ungetroffener Kugeln exponentiell ab
Adaptives Wachstum: Die Kugelgröße wird dynamisch basierend auf der aktuellen Situation ungetroffener Kugeln angepasst

Theoretische Analyse

Theorem 4 beweist die Korrektheit des Algorithmus:

Anzahl Mittelpunkte: Wählt höchstens r Mittelpunkte
Gesamtkosten: O_p(m(n/r)^p) = O_p(m·f(n/r))
Zeitkomplexität: O_p(r + mn/r)

Schlüsselpunkte des Beweises:

Analyse der oberen Schranke für die Anzahl der Mittelpunkte pro Runde
Exponentieller Rückgang der Anzahl ungetroffener Kugeln
Gesamtkostengrenze durch Summation geometrischer Reihen

Experimentelle Einrichtung

Theoretische Verifikation

Diese Arbeit ist hauptsächlich theoretisch und verifiziert die Korrektheit und Komplexitätsgrenzen des Algorithmus durch rigorose mathematische Beweise.

Anwendungsverifikation

Die Wirksamkeit der Methode wird durch zwei konkrete Anwendungen verifiziert:

Single-Source-Kürzestpfade:
- Integration von Algorithmus 1 in die Bundle-Construction-Phase von DMSY23
- Kostenfunktion gesetzt als f(x) = x log x
- Parameterauswahl r = m√(log log n)/√(log n)
Thorup-Zwick-Distanz-Orakel:
- Anwendung von Algorithmus 1 in jeder Ebene i zur Auswahl von A_{i+1}
- Kombination mit RTZ05-Techniken für effizientes Kugelwachstum
- Parametereinstellung r = n^(-1/k)|A_i|

Implementierungsdetails

Datenstruktur-Optimierungen:

Verwaltung der Anzahl ungetroffener Kugeln, die jeder Knoten j treffen kann
Verwendung bidirektionaler Listen L_k zur Verwaltung von Knoten mit a_j = k
Unterstützung von O(1)-Zeit-Operationen für Einfügen, Löschen und Finden des Maximums

Experimentelle Ergebnisse

Hauptergebnisse

Theorem 2 (Single-Source-Kürzestpfade):

Existenz eines deterministischen Vergleichs-Additions-Algorithmus für ungerichtete Graphen mit nicht-negativen Kantengewichten
Zeitkomplexität: O(m√(log n log log n))
Identisch mit der Komplexität des randomisierten DMSY23-Algorithmus

Theorem 3 (Thorup-Zwick-Orakel):

Thorup-Zwick-Approximations-Distanz-Orakel der Größe O(kn^{1+1/k})
Kann in O(kn^{1/k}(m + n log n)) Zeit deterministisch konstruiert werden
Identisch mit der Vorverarbeitungszeit des ursprünglichen randomisierten Algorithmus

Komplexitätsvergleich

Algorithmus	Typ	Zeitkomplexität	Bemerkung
Dijkstra	Deterministisch	O(m + n log n)	Klassischer Algorithmus
DMSY23	Randomisiert	O(m√(log n log log n))	Durchbricht erstmals Dijkstra
DMSY23+Folklore-Derandomisierung	Deterministisch	O(m log n √(log log n))	Von Dijkstra übertroffen
Diese Arbeit	Deterministisch	O(m√(log n log log n))	Verlustfreie Derandomisierung

Verifikation technischer Innovationen

Corollary 5 zeigt die Anwendbarkeit der Methode auf verschiedene Kostenfunktionen:

Für f(x) = x log x durch Anwendung der Jensen-Ungleichung
Gesamtkostengrenze: O(m(n/r)log(n/r))
Erweiterbar auf andere polynomiale Kostenfunktionen

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Theoretischer Durchbruch: Erste verlustfreie Derandomisierung des Kugeltreff-Problems, Erreichen optimaler Grenzen im Durchschnitt
Praktische Anwendungen: Erfolgreiche Anwendung auf zwei wichtige Graphalgorithmen mit gleicher Komplexität wie randomisierte Versionen
Allgemeiner Rahmen: Bereitstellung einer universellen Methode für verschiedene Kostenfunktionen

Einschränkungen

Modellannahmen:
- Erfordert Graphgrad O(m/n) (durch Knotenaufteilung erreichbar)
- Benötigt Vergleichs-Additions-Modell
- Für DMSY23-Anwendung Annahme konstanten Grades
Anwendungsbereich:
- Hauptsächlich anwendbar auf Szenarien, in denen Kugelgröße adaptiv gewählt werden kann
- Nicht anwendbar, wenn Kugelgröße vollständig durch Eingabe festgelegt ist
Praktische Effizienz:
- Obwohl asymptotisch optimal, können versteckte Konstanten groß sein
- Auf kleinen Graphen möglicherweise nicht besser als einfache Randomisierungsmethoden

Zukünftige Richtungen

Algorithmus-Optimierung:
- Reduzierung von Konstanten im Algorithmus
- Entwurf praktischerer Implementierungsversionen
Anwendungserweiterung:
- Erkundung von Anwendungen in anderen Graphalgorithmen
- Untersuchung von Erweiterungen auf dynamische Grapheinstellungen
Theoretische Vertiefung:
- Untersuchung von Untergrenzen, Beweis der Optimalität der Methode
- Erweiterung auf allgemeinere Kostenfunktionen

Tiefgreifende Bewertung

Stärken

Technische Innovativität:
- Erste Nutzung der Wachstumseigenschaft von Kugeln für verlustfreie Derandomisierung
- Eleganter und einfacher Algorithmusentwurf, kreative exponentielle Abnahmestrategie
Theoretische Beiträge:
- Rigorose mathematische Beweise, vollständige theoretische Analyse
- Bereitstellung eines universellen Rahmens für verschiedene Kostenfunktionen
Praktische Bedeutung:
- Lösung des Derandomisierungsproblems wichtiger Algorithmen wie DMSY23
- Grundlegende Verbesserung des Thorup-Zwick-Orakels
Klare Darstellung:
- Klare Papierstruktur, präzise technische Beschreibung
- Prägnanter und verständlicher Algorithmus-Pseudocode

Mängel

Fehlende experimentelle Verifikation:
- Rein theoretische Arbeit ohne praktische Leistungstests
- Keine empirischen Vergleiche mit anderen Methoden
Konstanten-Faktor-Analyse:
- Obwohl asymptotisch optimal, können versteckte Konstanten groß sein
- Praktische Effizienz in realen Anwendungen bedarf Verifikation
Anwendungsbereich:
- Hauptsächlich auf spezifische Problemtypen ausgerichtet
- Begrenzte Orientierungshilfe für allgemeine Derandomisierungsprobleme

Einfluss

Akademischer Wert:
- Bietet neue Perspektiven für Derandomisierungstechniken
- Kann Verbesserungen anderer Algorithmen inspirieren
Praktischer Wert:
- Bietet wichtiges Werkzeug für Anwendungen, die deterministische Garantien benötigen
- Mögliche Anwendungen in verteiltem und parallelem Computing
Reproduzierbarkeit:
- Klare Algorithmusbeschreibung, leicht zu implementieren
- Theoretische Ergebnisse können unabhängig verifiziert werden

Anwendungsszenarien

Theoretische Forschung: Referenz für Derandomisierung anderer randomisierter Algorithmen
Systemanwendungen: Ersatz randomisierter Algorithmen in Systemen, die deterministisches Verhalten erfordern
Lehrzwecke: Ausgezeichnetes Fallbeispiel für Derandomisierungstechniken

Literaturverzeichnis

Das Papier zitiert umfangreiche verwandte Arbeiten, hauptsächlich:

DMSY23: Duan et al. randomisierter Single-Source-Kürzestpfad-Algorithmus
TZ05: Thorup-Zwick Approximations-Distanz-Orakel Originalarbeit
RTZ05: Roditty et al. Derandomisierungsverbesserungen
Dij59: Dijkstras klassischer Kürzestpfad-Algorithmus
FT87: Verwandte Arbeiten zu Fibonacci-Heaps

Diese Arbeit leistet wichtige Beiträge im Bereich der theoretischen Informatik, besonders in der Derandomisierung von Graphalgorithmen. Obwohl experimentelle Verifikation fehlt, machen ihr theoretischer Wert und zukünftiges Anwendungspotenzial sie zu einem wichtigen Fortschritt in diesem Forschungsgebiet.