2025-11-20T02:31:13.678138

Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles

Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Θ(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers. However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's. In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Θ(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path. In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic

Derandomizzazione Senza Perdita per Cammini Minimi da Singola Sorgente in Grafi Non Orientati e Oracoli di Distanza Approssimati

Informazioni Fondamentali

  • ID Articolo: 2510.12598
  • Titolo: Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
  • Autore: Shuyi Yan (BARC, Università di Copenaghen)
  • Classificazione: cs.DS (Strutture Dati e Algoritmi)
  • Data di Pubblicazione: 14 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.12598

Riassunto

Questo articolo affronta un problema centrale negli algoritmi di cammini minimi per grafi non orientati: come selezionare un sottoinsieme di vertici come centri e far crescere sfere da ogni vertice fino al raggiungimento di un centro, minimizzando la dimensione totale delle sfere. Gli algoritmi randomizzati possono campionare uniformemente r centri per ottenere una dimensione media ottimale delle sfere pari a Θ(n/r), ma i metodi tradizionali di derandomizzazione introducono un fattore aggiuntivo O(log n), che rappresenta un costo eccessivo in alcune applicazioni. Questo articolo sfrutta il fatto che la dimensione delle sfere può essere scelta adattivamente dall'algoritmo, proponendo un semplice algoritmo deterministico che raggiunge la dimensione ottimale delle sfere Θ(n/r) in media, estendibile a funzioni di costo di dimensione polinomiale arbitraria. La tecnica viene applicata con successo alla derandomizzazione dell'algoritmo di cammini minimi da singola sorgente O(m√(log n log log n)) di DMSY23 e dell'oracolo di distanza approssimato classico di Thorup-Zwick, senza perdita di complessità temporale/spaziale.

Contesto di Ricerca e Motivazione

Problema Centrale

Il problema centrale affrontato è il Problema dell'Intersezione di Sfere Crescenti (Hitting Growable Balls). In molti algoritmi su grafi, in particolare per cammini minimi, oracoli di distanza e algoritmi di sottografi sparsi, si incontra il seguente schema:

  1. Selezionare un sottoinsieme di vertici R come centri
  2. Far crescere una sfera B(v) da ogni vertice v fino al raggiungimento di un centro
  3. Le prestazioni dell'algoritmo dipendono dalla dimensione di |R| e dalla somma totale delle dimensioni di tutte le sfere

Importanza del Problema

Questo problema occupa una posizione fondamentale negli algoritmi su grafi, influenzando l'efficienza di molteplici algoritmi importanti:

  • Cammini Minimi da Singola Sorgente: L'algoritmo DMSY23 supera per la prima volta il limite di Dijkstra di O(m + n log n) su grafi sparsi
  • Oracoli di Distanza: L'oracolo di Thorup-Zwick è una struttura dati classica per interrogazioni di distanza approssimata
  • Sparsificazione di Grafi: Tecniche simili vengono utilizzate nella costruzione di sottografi sparsi

Limitazioni dei Metodi Esistenti

I metodi tradizionali di derandomizzazione presentano difetti critici:

  1. Costo del Metodo Folkloristico: L'utilizzo dell'algoritmo di approssimazione O(log n) per il problema della copertura di insiemi nella derandomizzazione introduce un fattore aggiuntivo O(log n)
  2. Perdita di Prestazioni Significativa: Per l'algoritmo DMSY23, questo fattore aggiuntivo degrada la complessità temporale da O(m√(log n log log n)) a O(m log n √(log log n)), venendo nuovamente superato dall'algoritmo di Dijkstra
  3. Assunzione di Dimensione Fissa delle Sfere: I metodi tradizionali presuppongono che la dimensione delle sfere sia fissata dall'input, senza sfruttare l'adattività dell'algoritmo

Motivazione della Ricerca

L'intuizione chiave di questo articolo è: la dimensione delle sfere può essere scelta adattivamente dall'algoritmo, piuttosto che essere fissata dall'input. Ciò apre nuove possibilità per la progettazione di algoritmi di derandomizzazione più efficienti.

Contributi Principali

  1. Propone un algoritmo deterministico per l'intersezione di sfere crescenti: Progetta l'Algoritmo 1, che raggiunge la dimensione media ottimale delle sfere Θ(n/r) senza introdurre fattori logaritmici aggiuntivi
  2. Realizza la derandomizzazione senza perdita dell'algoritmo DMSY23: Trasforma l'algoritmo randomizzato di cammini minimi da singola sorgente O(m√(log n log log n)) in un algoritmo deterministico con la stessa complessità
  3. Derandomizza l'oracolo di distanza di Thorup-Zwick: Elimina il fattore O(log n) dai precedenti metodi di derandomizzazione, raggiungendo il tempo di preprocessing O(kn^(1/k)(m + n log n)) identico alla versione randomizzata
  4. Fornisce un framework teorico generale: Il metodo è estendibile a funzioni di costo di dimensione polinomiale arbitraria, con ampia applicabilità

Spiegazione Dettagliata del Metodo

Definizione del Compito

La definizione formale del Problema dell'Intersezione di Sfere Crescenti è la seguente:

  • Input: n vertici, m sfere inizialmente vuote, parametro r ∈ 1,n, funzione di costo f(·)
  • Operazioni: L'algoritmo può selezionare una sfera e richiedere all'avversario di aggiungere un nuovo vertice in essa
  • Obiettivo: Selezionare r vertici come centri in modo che ogni sfera sia intersecata (contenga almeno un centro), minimizzando il costo totale ∑f(|Bi|)

Architettura dell'Algoritmo Principale

L'Algoritmo 1 è il contributo principale di questo articolo:

Algoritmo 1: Intersezione di Sfere Crescenti
Input: numero di vertici n, numero di sfere m, numero di centri target r, parametro di costo p
Output: al massimo r centri che intersecano tutte le sfere

1: Inizializzare tutte le sfere come vuote, nessun centro selezionato
2: b ← ⌈2^(p+2)n/r⌉
3: Far crescere ogni sfera fino alla dimensione min{b, n}
4: while non tutte le sfere sono intersecate do
5:   m' ← numero di sfere non intersecate
6:   Ripetere la selezione di nuovi centri che intersecano il massimo numero di sfere non intersecate,
     fino a quando il numero di sfere non intersecate ≤ m'/2^(p+1)
7:   b ← 2b
8:   Far crescere ogni sfera non intersecata fino alla dimensione min{b, n}
9: return tutti i centri selezionati

Idea Centrale dell'Algoritmo

  1. Strategia di Decremento Esponenziale: Nel round i-esimo, vengono utilizzati solo O(r/2^i) centri, ma le sfere possono crescere fino a 2^i n/r
  2. Equilibrio dei Compromessi: Sebbene i round successivi abbiano sfere più grandi, il numero di sfere non intersecate decresce esponenzialmente
  3. Crescita Adattiva: La dimensione delle sfere viene regolata dinamicamente in base alla situazione corrente delle sfere non intersecate

Analisi Teorica

Il Teorema 4 dimostra la correttezza dell'algoritmo:

  • Numero di Centri: Seleziona al massimo r centri
  • Costo Totale: O_p(m(n/r)^p) = O_p(m·f(n/r))
  • Complessità Temporale: O_p(r + mn/r)

Punti Chiave della Dimostrazione:

  1. Analisi del limite superiore del numero di centri per round
  2. Decremento esponenziale del numero di sfere non intersecate
  3. Somma di serie geometriche per ottenere il limite del costo totale

Configurazione Sperimentale

Verifica Teorica

Questo articolo è principalmente un lavoro teorico, verificando la correttezza dell'algoritmo e i limiti di complessità attraverso rigorose dimostrazioni matematiche.

Verifica dell'Applicazione

L'efficacia del metodo viene verificata attraverso due applicazioni concrete:

  1. Cammini Minimi da Singola Sorgente:
    • Integrazione dell'Algoritmo 1 nella fase di bundle construction di DMSY23
    • Funzione di costo impostata come f(x) = x log x
    • Scelta dei parametri r = m√(log log n)/√(log n)
  2. Oracolo di Distanza di Thorup-Zwick:
    • Applicazione dell'Algoritmo 1 a ogni livello i per selezionare A_{i+1}
    • Combinazione con la tecnica RTZ05 per operazioni efficienti di crescita delle sfere
    • Impostazione dei parametri r = n^(-1/k)|A_i|

Dettagli di Implementazione

Ottimizzazioni delle Strutture Dati:

  • Mantenimento del numero di sfere non intersecate che ogni vertice j può intersecate a_j
  • Utilizzo di liste bidirezionali L_k per mantenere vertici con a_j = k
  • Supporto di operazioni di inserimento, cancellazione e ricerca del massimo in tempo O(1)

Risultati Sperimentali

Risultati Principali

Teorema 2 (Cammini Minimi da Singola Sorgente):

  • In grafi non orientati con pesi degli archi non negativi, esiste un algoritmo deterministico di confronto-addizione
  • Complessità Temporale: O(m√(log n log log n))
  • Identica alla complessità dell'algoritmo randomizzato DMSY23

Teorema 3 (Oracolo di Thorup-Zwick):

  • Oracolo di distanza approssimato di Thorup-Zwick di dimensione O(kn^{1+1/k})
  • Costruibile deterministicamente in tempo O(kn^{1/k}(m + n log n))
  • Identico al tempo di preprocessing dell'algoritmo randomizzato originale

Confronto di Complessità

AlgoritmoTipoComplessità TemporaleNote
DijkstraDeterministicoO(m + n log n)Algoritmo classico
DMSY23RandomizzatoO(m√(log n log log n))Primo a superare Dijkstra
DMSY23+Derandomizzazione FolkloristicaDeterministicoO(m log n √(log log n))Superato da Dijkstra
Metodo di questo ArticoloDeterministicoO(m√(log n log log n))Derandomizzazione senza perdita

Verifica dell'Innovazione Tecnica

Il Corollario 5 dimostra l'applicabilità del metodo a diverse funzioni di costo:

  • Per f(x) = x log x, attraverso l'applicazione della disuguaglianza di Jensen
  • Limite del costo totale: O(m(n/r)log(n/r))
  • Estendibile ad altre funzioni di costo di dimensione polinomiale

Lavori Correlati

Cammini Minimi da Singola Sorgente

  1. Algoritmi Classici: Algoritmo di Dijkstra e suoi miglioramenti
  2. Pesi Interi: Algoritmo di tempo lineare di Thorup
  3. Progressi Recenti: Algoritmo randomizzato DMSY23, algoritmo deterministico DMM+25

Oracoli di Distanza Approssimata

  1. Lavori Fondamentali: L'oracolo di Thorup-Zwick ha gettato le basi
  2. Ricerca sulla Derandomizzazione: RTZ05 ha proposto metodi di derandomizzazione migliorati
  3. Ottimizzazione delle Interrogazioni: Miglioramenti del tempo di interrogazione di Wulff-Nilsen e altri

Tecniche di Derandomizzazione

  1. Metodi Tradizionali: Derandomizzazione folkloristica basata sulla copertura di insiemi
  2. Limitazioni del Problema: Il fattore aggiuntivo O(log n) è inaccettabile in alcune applicazioni
  3. Contributo di questo Articolo: Prima derandomizzazione veramente senza perdita

Conclusioni e Discussione

Conclusioni Principali

  1. Avanzamento Teorico: Prima derandomizzazione senza perdita del problema dell'intersezione di sfere, raggiungendo il limite ottimale in media
  2. Applicazioni Pratiche: Applicazione riuscita a due importanti algoritmi su grafi, mantenendo la stessa complessità della versione randomizzata
  3. Framework Generale: Fornisce un metodo generale applicabile a diverse funzioni di costo

Limitazioni

  1. Assunzioni del Modello:
    • Richiede che il grado del grafo sia O(m/n) (realizzabile attraverso suddivisione di vertici)
    • Necessita del modello di confronto-addizione
    • Per l'applicazione DMSY23, assume grafi di grado costante
  2. Ambito di Applicabilità:
    • Principalmente applicabile a scenari in cui la dimensione delle sfere può essere scelta adattivamente
    • Non applicabile quando la dimensione delle sfere è completamente fissata dall'input
  3. Efficienza Pratica:
    • Sebbene la complessità asintotica sia ottimale, i fattori costanti potrebbero essere significativi
    • Su grafi di piccole dimensioni potrebbe non essere superiore ai semplici metodi randomizzati

Direzioni Future

  1. Ottimizzazione dell'Algoritmo:
    • Riduzione dei fattori costanti nell'algoritmo
    • Progettazione di versioni di implementazione più pratiche
  2. Estensione delle Applicazioni:
    • Esplorazione di applicazioni in altri algoritmi su grafi
    • Ricerca di estensioni in impostazioni di grafi dinamici
  3. Approfondimento Teorico:
    • Ricerca di limiti inferiori, provando l'ottimalità del metodo
    • Estensione a funzioni di costo più generali

Valutazione Approfondita

Punti di Forza

  1. Innovazione Tecnica:
    • Prima derandomizzazione senza perdita sfruttando la proprietà di crescita delle sfere
    • Progettazione dell'algoritmo elegante e ingegnosa, strategia di decremento esponenziale molto creativa
  2. Contributi Teorici:
    • Dimostrazioni matematiche rigorose, analisi teorica completa
    • Fornisce un framework generale, applicabile a diverse funzioni di costo
  3. Significato Pratico:
    • Risolve il problema della derandomizzazione di importanti algoritmi come DMSY23
    • Il miglioramento dell'oracolo di Thorup-Zwick ha valore fondamentale
  4. Chiarezza Espositiva:
    • Struttura dell'articolo chiara, descrizione tecnica accurata
    • Pseudocodice dell'algoritmo conciso e comprensibile

Insufficienze

  1. Mancanza di Verifica Sperimentale:
    • Lavoro puramente teorico, senza test di prestazioni pratiche
    • Nessun confronto empirico con altri metodi
  2. Analisi dei Fattori Costanti:
    • Sebbene asintoticamente ottimale, le costanti nascoste potrebbero essere significative
    • L'efficienza in applicazioni pratiche rimane da verificare
  3. Ambito di Applicazione:
    • Principalmente orientato a tipi specifici di problemi
    • Significato guida limitato per problemi generali di derandomizzazione

Impatto

  1. Valore Accademico:
    • Fornisce nuove prospettive per le tecniche di derandomizzazione
    • Potrebbe ispirare miglioramenti di altri algoritmi
  2. Valore Pratico:
    • Fornisce strumenti importanti per applicazioni che richiedono garanzie deterministiche
    • Potenziali applicazioni in computazione distribuita e parallela
  3. Riproducibilità:
    • Descrizione dell'algoritmo chiara, facile da implementare
    • I risultati teorici possono essere verificati indipendentemente

Scenari di Applicazione

  1. Ricerca Teorica: Fornisce riferimenti per la derandomizzazione di altri algoritmi randomizzati
  2. Applicazioni di Sistema: Sostituzione di algoritmi randomizzati con versioni deterministiche in sistemi che richiedono comportamento deterministico
  3. Scopi Didattici: Eccellente caso di studio per le tecniche di derandomizzazione

Bibliografia

L'articolo cita ampi lavori correlati, principalmente includenti:

  1. DMSY23: Algoritmo randomizzato di cammini minimi da singola sorgente di Duan et al.
  2. TZ05: Lavoro originale dell'oracolo di distanza approssimato di Thorup-Zwick
  3. RTZ05: Miglioramenti della derandomizzazione di Roditty et al.
  4. Dij59: Algoritmo classico di cammini minimi di Dijkstra
  5. FT87: Lavori correlati agli heap di Fibonacci

Questo articolo fornisce contributi importanti nel campo dell'informatica teorica, in particolare nella derandomizzazione degli algoritmi su grafi. Sebbene manchi di verifica sperimentale, il suo valore teorico e le prospettive di applicazione lo rendono un progresso significativo in questo campo.