2025-11-20T02:31:13.678138

Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles

Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Θ(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers. However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's. In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Θ(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path. In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic

Verlustfreie Derandomisierung für ungerichtete Single-Source-Kürzestpfade und approximative Distanz-Orakel

Grundinformationen

  • Paper-ID: 2510.12598
  • Titel: Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
  • Autor: Shuyi Yan (BARC, Universität Kopenhagen)
  • Klassifikation: cs.DS (Datenstrukturen und Algorithmen)
  • Veröffentlichungsdatum: 14. Oktober 2025 (arXiv-Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.12598

Zusammenfassung

Diese Arbeit untersucht ein Kernproblem in Algorithmen für Kürzestpfade in ungerichteten Graphen: Wie wählt man eine Teilmenge von Knoten als Mittelpunkte aus und lässt von jedem Knoten eine Kugel wachsen, bis sie einen Mittelpunkt erreicht, mit dem Ziel, die Kugelgröße so klein wie möglich zu halten. Randomisierte Algorithmen können r Mittelpunkte gleichmäßig samplen, um die optimale erwartete Kugelgröße Θ(n/r) zu erreichen. Jedoch führen traditionelle Derandomisierungsmethoden einen zusätzlichen Faktor O(log n) ein, was in bestimmten Anwendungen zu kostspielig ist. Diese Arbeit nutzt die Tatsache, dass die Kugelgröße vom Algorithmus adaptiv gewählt werden kann, und schlägt einen einfachen deterministischen Algorithmus vor, der im Durchschnitt die optimale Kugelgröße Θ(n/r) erreicht und auf beliebige polynomiale Kostenfunktionen erweiterbar ist. Die Technik wird erfolgreich auf die Derandomisierung des O(m√(log n log log n)) Single-Source-Kürzestpfad-Algorithmus von DMSY23 und des klassischen Thorup-Zwick-Approximations-Distanz-Orakels angewendet, ohne Zeit-/Raumkomplexität zu verlieren.

Forschungshintergrund und Motivation

Kernproblem

Das Kernproblem dieser Arbeit ist das Treffer-Problem für wachsende Kugeln (Hitting Growable Balls). In vielen Graphalgorithmen, besonders bei Kürzestpfaden, Distanz-Orakeln und Sparse-Subgraph-Algorithmen, tritt folgendes Muster auf:

  1. Wähle eine Teilmenge von Knoten R als Mittelpunkte
  2. Lasse von jedem Knoten v eine Kugel B(v) wachsen, bis sie einen Mittelpunkt erreicht
  3. Die Algorithmusleistung hängt von der Größe von |R| und der Gesamtgröße aller Kugeln ab

Bedeutung des Problems

Dieses Problem hat eine grundlegende Stellung in Graphalgorithmen und beeinflusst die Effizienz mehrerer wichtiger Algorithmen:

  • Single-Source-Kürzestpfade: Der DMSY23-Algorithmus durchbricht erstmals die O(m + n log n)-Schranke von Dijkstra auf dünnen Graphen
  • Distanz-Orakel: Das Thorup-Zwick-Orakel ist eine klassische Datenstruktur für approximative Distanzabfragen
  • Graphverdünnung: Ähnliche Techniken werden auch bei der Konstruktion von Sparse Subgraphs verwendet

Einschränkungen bestehender Methoden

Traditionelle Derandomisierungsmethoden haben kritische Mängel:

  1. Kosten der Folklore-Methode: Die Verwendung eines O(log n)-Approximationsalgorithmus für das Set-Cover-Problem zur Derandomisierung führt einen zusätzlichen Faktor O(log n) ein
  2. Schwerwiegender Leistungsverlust: Für den DMSY23-Algorithmus würde dieser zusätzliche Faktor die Zeitkomplexität von O(m√(log n log log n)) auf O(m log n √(log log n)) verschlechtern, wodurch Dijkstra wieder überlegen wird
  3. Annahme fester Kugelgröße: Traditionelle Methoden gehen davon aus, dass die Kugelgröße durch die Eingabe festgelegt ist und können die Adaptivität des Algorithmus nicht nutzen

Forschungsmotivation

Die Schlüsseleinsicht dieser Arbeit ist: Die Kugelgröße kann vom Algorithmus adaptiv gewählt werden, nicht von der Eingabe festgelegt. Dies eröffnet neue Möglichkeiten für den Entwurf besserer Derandomisierungsalgorithmen.

Kernbeiträge

  1. Deterministischer Algorithmus für das Treffer-Problem wachsender Kugeln: Entwurf von Algorithmus 1, der im Durchschnitt die optimale Kugelgröße Θ(n/r) erreicht, ohne zusätzliche logarithmische Faktoren einzuführen
  2. Verlustfreie Derandomisierung des DMSY23-Algorithmus: Umwandlung des randomisierten O(m√(log n log log n)) Single-Source-Kürzestpfad-Algorithmus in einen deterministischen Algorithmus mit gleicher Komplexität
  3. Derandomisierung des Thorup-Zwick-Distanz-Orakels: Entfernung des O(log n)-Faktors aus früheren Derandomisierungsmethoden, Erreichen der gleichen O(kn^(1/k)(m + n log n)) Vorverarbeitungszeit wie die randomisierte Version
  4. Bereitstellung eines allgemeinen theoretischen Rahmens: Die Methode ist auf beliebige polynomiale Kostenfunktionen erweiterbar und hat breite Anwendbarkeit

Methodische Details

Aufgabendefinition

Die formale Definition des Treffer-Problems für wachsende Kugeln ist wie folgt:

  • Eingabe: n Knoten, m anfangs leere Kugeln, Parameter r ∈ 1,n, Kostenfunktion f(·)
  • Operationen: Der Algorithmus kann eine Kugel wählen und den Gegner auffordern, einen neuen Knoten hinzuzufügen
  • Ziel: Wähle r Knoten als Mittelpunkte, sodass jede Kugel getroffen wird (mindestens einen Mittelpunkt enthält), minimiere die Gesamtkosten ∑f(|Bi|)

Kernalgorithmus-Architektur

Algorithmus 1 ist der Kernbeitrag dieser Arbeit:

Algorithmus 1: Treffer wachsender Kugeln
Eingabe: Knotenzahl n, Kugelzahl m, Zielanzahl Mittelpunkte r, Kostenparameter p
Ausgabe: Höchstens r Mittelpunkte, die alle Kugeln treffen

1: Initialisiere alle Kugeln als leer, keine Mittelpunkte gewählt
2: b ← ⌈2^(p+2)n/r⌉
3: Lasse jede Kugel bis zur Größe min{b, n} wachsen
4: while nicht alle Kugeln getroffen sind do
5:   m' ← Anzahl ungetroffener Kugeln
6:   Wähle wiederholt neue Mittelpunkte, die die meisten ungetroffenen Kugeln treffen,
     bis Anzahl ungetroffener Kugeln ≤ m'/2^(p+1)
7:   b ← 2b
8:   Lasse jede ungetroffene Kugel bis zur Größe min{b, n} wachsen
9: return Alle gewählten Mittelpunkte

Kernideen des Algorithmus

  1. Exponentiell abnehmende Strategie: In Runde i werden nur O(r/2^i) Mittelpunkte verwendet, aber die Kugelgröße darf auf 2^i n/r wachsen
  2. Ausgewogene Abwägung: Obwohl Kugeln in späteren Runden größer sind, nimmt die Anzahl ungetroffener Kugeln exponentiell ab
  3. Adaptives Wachstum: Die Kugelgröße wird dynamisch basierend auf der aktuellen Situation ungetroffener Kugeln angepasst

Theoretische Analyse

Theorem 4 beweist die Korrektheit des Algorithmus:

  • Anzahl Mittelpunkte: Wählt höchstens r Mittelpunkte
  • Gesamtkosten: O_p(m(n/r)^p) = O_p(m·f(n/r))
  • Zeitkomplexität: O_p(r + mn/r)

Schlüsselpunkte des Beweises:

  1. Analyse der oberen Schranke für die Anzahl der Mittelpunkte pro Runde
  2. Exponentieller Rückgang der Anzahl ungetroffener Kugeln
  3. Gesamtkostengrenze durch Summation geometrischer Reihen

Experimentelle Einrichtung

Theoretische Verifikation

Diese Arbeit ist hauptsächlich theoretisch und verifiziert die Korrektheit und Komplexitätsgrenzen des Algorithmus durch rigorose mathematische Beweise.

Anwendungsverifikation

Die Wirksamkeit der Methode wird durch zwei konkrete Anwendungen verifiziert:

  1. Single-Source-Kürzestpfade:
    • Integration von Algorithmus 1 in die Bundle-Construction-Phase von DMSY23
    • Kostenfunktion gesetzt als f(x) = x log x
    • Parameterauswahl r = m√(log log n)/√(log n)
  2. Thorup-Zwick-Distanz-Orakel:
    • Anwendung von Algorithmus 1 in jeder Ebene i zur Auswahl von A_{i+1}
    • Kombination mit RTZ05-Techniken für effizientes Kugelwachstum
    • Parametereinstellung r = n^(-1/k)|A_i|

Implementierungsdetails

Datenstruktur-Optimierungen:

  • Verwaltung der Anzahl ungetroffener Kugeln, die jeder Knoten j treffen kann
  • Verwendung bidirektionaler Listen L_k zur Verwaltung von Knoten mit a_j = k
  • Unterstützung von O(1)-Zeit-Operationen für Einfügen, Löschen und Finden des Maximums

Experimentelle Ergebnisse

Hauptergebnisse

Theorem 2 (Single-Source-Kürzestpfade):

  • Existenz eines deterministischen Vergleichs-Additions-Algorithmus für ungerichtete Graphen mit nicht-negativen Kantengewichten
  • Zeitkomplexität: O(m√(log n log log n))
  • Identisch mit der Komplexität des randomisierten DMSY23-Algorithmus

Theorem 3 (Thorup-Zwick-Orakel):

  • Thorup-Zwick-Approximations-Distanz-Orakel der Größe O(kn^{1+1/k})
  • Kann in O(kn^{1/k}(m + n log n)) Zeit deterministisch konstruiert werden
  • Identisch mit der Vorverarbeitungszeit des ursprünglichen randomisierten Algorithmus

Komplexitätsvergleich

AlgorithmusTypZeitkomplexitätBemerkung
DijkstraDeterministischO(m + n log n)Klassischer Algorithmus
DMSY23RandomisiertO(m√(log n log log n))Durchbricht erstmals Dijkstra
DMSY23+Folklore-DerandomisierungDeterministischO(m log n √(log log n))Von Dijkstra übertroffen
Diese ArbeitDeterministischO(m√(log n log log n))Verlustfreie Derandomisierung

Verifikation technischer Innovationen

Corollary 5 zeigt die Anwendbarkeit der Methode auf verschiedene Kostenfunktionen:

  • Für f(x) = x log x durch Anwendung der Jensen-Ungleichung
  • Gesamtkostengrenze: O(m(n/r)log(n/r))
  • Erweiterbar auf andere polynomiale Kostenfunktionen

Verwandte Arbeiten

Single-Source-Kürzestpfade

  1. Klassische Algorithmen: Dijkstra-Algorithmus und seine Verbesserungen
  2. Ganzzahlige Gewichte: Thorups linearer Zeitalgorithmus
  3. Neueste Durchbrüche: DMSY23 randomisierter Algorithmus, DMM+25 deterministischer Algorithmus

Approximative Distanz-Orakel

  1. Grundlegende Arbeiten: Thorup-Zwick-Orakel legt den Grundstein
  2. Derandomisierungsforschung: RTZ05 schlägt verbesserte Derandomisierungsmethoden vor
  3. Abfrageoptimierung: Verbesserungen der Abfragezeit durch Wulff-Nilsen und andere

Derandomisierungstechniken

  1. Traditionelle Methoden: Folklore-Derandomisierung basierend auf Set-Cover
  2. Problembeschränkungen: Zusätzlicher O(log n)-Faktor in bestimmten Anwendungen inakzeptabel
  3. Beitrag dieser Arbeit: Erste echte verlustfreie Derandomisierung

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Theoretischer Durchbruch: Erste verlustfreie Derandomisierung des Kugeltreff-Problems, Erreichen optimaler Grenzen im Durchschnitt
  2. Praktische Anwendungen: Erfolgreiche Anwendung auf zwei wichtige Graphalgorithmen mit gleicher Komplexität wie randomisierte Versionen
  3. Allgemeiner Rahmen: Bereitstellung einer universellen Methode für verschiedene Kostenfunktionen

Einschränkungen

  1. Modellannahmen:
    • Erfordert Graphgrad O(m/n) (durch Knotenaufteilung erreichbar)
    • Benötigt Vergleichs-Additions-Modell
    • Für DMSY23-Anwendung Annahme konstanten Grades
  2. Anwendungsbereich:
    • Hauptsächlich anwendbar auf Szenarien, in denen Kugelgröße adaptiv gewählt werden kann
    • Nicht anwendbar, wenn Kugelgröße vollständig durch Eingabe festgelegt ist
  3. Praktische Effizienz:
    • Obwohl asymptotisch optimal, können versteckte Konstanten groß sein
    • Auf kleinen Graphen möglicherweise nicht besser als einfache Randomisierungsmethoden

Zukünftige Richtungen

  1. Algorithmus-Optimierung:
    • Reduzierung von Konstanten im Algorithmus
    • Entwurf praktischerer Implementierungsversionen
  2. Anwendungserweiterung:
    • Erkundung von Anwendungen in anderen Graphalgorithmen
    • Untersuchung von Erweiterungen auf dynamische Grapheinstellungen
  3. Theoretische Vertiefung:
    • Untersuchung von Untergrenzen, Beweis der Optimalität der Methode
    • Erweiterung auf allgemeinere Kostenfunktionen

Tiefgreifende Bewertung

Stärken

  1. Technische Innovativität:
    • Erste Nutzung der Wachstumseigenschaft von Kugeln für verlustfreie Derandomisierung
    • Eleganter und einfacher Algorithmusentwurf, kreative exponentielle Abnahmestrategie
  2. Theoretische Beiträge:
    • Rigorose mathematische Beweise, vollständige theoretische Analyse
    • Bereitstellung eines universellen Rahmens für verschiedene Kostenfunktionen
  3. Praktische Bedeutung:
    • Lösung des Derandomisierungsproblems wichtiger Algorithmen wie DMSY23
    • Grundlegende Verbesserung des Thorup-Zwick-Orakels
  4. Klare Darstellung:
    • Klare Papierstruktur, präzise technische Beschreibung
    • Prägnanter und verständlicher Algorithmus-Pseudocode

Mängel

  1. Fehlende experimentelle Verifikation:
    • Rein theoretische Arbeit ohne praktische Leistungstests
    • Keine empirischen Vergleiche mit anderen Methoden
  2. Konstanten-Faktor-Analyse:
    • Obwohl asymptotisch optimal, können versteckte Konstanten groß sein
    • Praktische Effizienz in realen Anwendungen bedarf Verifikation
  3. Anwendungsbereich:
    • Hauptsächlich auf spezifische Problemtypen ausgerichtet
    • Begrenzte Orientierungshilfe für allgemeine Derandomisierungsprobleme

Einfluss

  1. Akademischer Wert:
    • Bietet neue Perspektiven für Derandomisierungstechniken
    • Kann Verbesserungen anderer Algorithmen inspirieren
  2. Praktischer Wert:
    • Bietet wichtiges Werkzeug für Anwendungen, die deterministische Garantien benötigen
    • Mögliche Anwendungen in verteiltem und parallelem Computing
  3. Reproduzierbarkeit:
    • Klare Algorithmusbeschreibung, leicht zu implementieren
    • Theoretische Ergebnisse können unabhängig verifiziert werden

Anwendungsszenarien

  1. Theoretische Forschung: Referenz für Derandomisierung anderer randomisierter Algorithmen
  2. Systemanwendungen: Ersatz randomisierter Algorithmen in Systemen, die deterministisches Verhalten erfordern
  3. Lehrzwecke: Ausgezeichnetes Fallbeispiel für Derandomisierungstechniken

Literaturverzeichnis

Das Papier zitiert umfangreiche verwandte Arbeiten, hauptsächlich:

  1. DMSY23: Duan et al. randomisierter Single-Source-Kürzestpfad-Algorithmus
  2. TZ05: Thorup-Zwick Approximations-Distanz-Orakel Originalarbeit
  3. RTZ05: Roditty et al. Derandomisierungsverbesserungen
  4. Dij59: Dijkstras klassischer Kürzestpfad-Algorithmus
  5. FT87: Verwandte Arbeiten zu Fibonacci-Heaps

Diese Arbeit leistet wichtige Beiträge im Bereich der theoretischen Informatik, besonders in der Derandomisierung von Graphalgorithmen. Obwohl experimentelle Verifikation fehlt, machen ihr theoretischer Wert und zukünftiges Anwendungspotenzial sie zu einem wichtigen Fortschritt in diesem Forschungsgebiet.