2025-11-20T02:31:13.678138

Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles

Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Θ(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers. However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's. In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Θ(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path. In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic

Desaleatorización sin Pérdidas para Caminos Más Cortos de Fuente Única en Grafos No Dirigidos y Oráculos de Distancia Aproximada

Información Básica

  • ID del Artículo: 2510.12598
  • Título: Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
  • Autor: Shuyi Yan (BARC, Universidad de Copenhague)
  • Clasificación: cs.DS (Estructuras de Datos y Algoritmos)
  • Fecha de Publicación: 14 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.12598

Resumen

Este artículo investiga un problema fundamental en algoritmos de caminos más cortos en grafos no dirigidos: cómo seleccionar un subconjunto de vértices como centros y hacer crecer bolas desde cada vértice hasta alcanzar un centro, con el objetivo de minimizar el tamaño total de las bolas. Los algoritmos aleatorios pueden muestrear uniformemente r centros para lograr un tamaño esperado óptimo de bolas Θ(n/r), pero los métodos tradicionales de desaleatorización introducen un factor adicional O(log n), que es prohibitivo en algunas aplicaciones. Este artículo aprovecha el hecho de que el tamaño de las bolas puede ser elegido adaptativamente por el algoritmo, y propone un algoritmo determinista simple que logra el tamaño óptimo de bolas Θ(n/r) en promedio, extensible a funciones de costo de tamaño polinomial arbitrario. La técnica se aplica exitosamente a la desaleatorización del algoritmo de camino más corto de fuente única O(m√(log n log log n)) de DMSY23 y el clásico oráculo de distancia aproximada de Thorup-Zwick, sin pérdida de complejidad de tiempo/espacio.

Antecedentes y Motivación de la Investigación

Problema Central

El problema central que aborda este artículo es el Problema de Golpear Bolas Crecientes (Hitting Growable Balls). En muchos algoritmos de grafos, particularmente en caminos más cortos, oráculos de distancia y algoritmos de subgrafos dispersos, se encuentra el siguiente patrón:

  1. Seleccionar un subconjunto de vértices R como centros
  2. Hacer crecer bolas B(v) desde cada vértice v hasta alcanzar algún centro
  3. El rendimiento del algoritmo depende del tamaño de |R| y la suma total de tamaños de todas las bolas

Importancia del Problema

Este problema ocupa una posición fundamental en algoritmos de grafos, afectando la eficiencia de múltiples algoritmos importantes:

  • Camino Más Corto de Fuente Única: El algoritmo DMSY23 es el primero en superar el límite O(m + n log n) de Dijkstra en grafos dispersos
  • Oráculo de Distancia: El oráculo de Thorup-Zwick es una estructura de datos clásica para consultas de distancia aproximada
  • Esparsificación de Grafos: Se utilizan técnicas similares en la construcción de subgrafos dispersos

Limitaciones de Métodos Existentes

Los métodos tradicionales de desaleatorización tienen deficiencias críticas:

  1. Costo del Método Folclórico: Usar el algoritmo de aproximación O(log n) para el problema de cobertura de conjuntos en la desaleatorización introduce un factor adicional O(log n)
  2. Pérdida de Rendimiento Severa: Para el algoritmo DMSY23, este factor adicional degrada la complejidad de tiempo de O(m√(log n log log n)) a O(m log n √(log log n)), siendo nuevamente superado por el algoritmo de Dijkstra
  3. Suposición de Tamaño Fijo de Bolas: Los métodos tradicionales asumen que el tamaño de las bolas está fijo por la entrada, sin poder aprovechar la adaptabilidad del algoritmo

Motivación de la Investigación

La idea clave de este artículo es: el tamaño de las bolas puede ser elegido adaptativamente por el algoritmo, en lugar de estar fijo por la entrada. Esto proporciona nuevas posibilidades para diseñar algoritmos de desaleatorización más eficientes.

Contribuciones Principales

  1. Propone un algoritmo determinista para golpear bolas crecientes: Diseña el Algoritmo 1, que logra el tamaño óptimo de bolas Θ(n/r) en promedio sin introducir factores logarítmicos adicionales
  2. Realiza desaleatorización sin pérdidas del algoritmo DMSY23: Convierte el algoritmo aleatorio de camino más corto de fuente única O(m√(log n log log n)) en un algoritmo determinista con la misma complejidad
  3. Desaleatoriza el oráculo de distancia de Thorup-Zwick: Elimina el factor O(log n) de métodos de desaleatorización anteriores, logrando el mismo tiempo de preprocesamiento O(kn^(1/k)(m + n log n)) que la versión aleatoria
  4. Proporciona un marco teórico general: El método es extensible a funciones de costo de tamaño polinomial arbitrario, con amplia aplicabilidad

Explicación Detallada del Método

Definición de la Tarea

La definición formalizada del Problema de Golpear Bolas Crecientes es la siguiente:

  • Entrada: n vértices, m bolas inicialmente vacías, parámetro r ∈ 1,n, función de costo f(·)
  • Operaciones: El algoritmo puede seleccionar una bola y solicitar al adversario que agregue un nuevo vértice en ella
  • Objetivo: Seleccionar r vértices como centros de modo que cada bola sea golpeada (contenga al menos un centro), minimizando el costo total ∑f(|Bi|)

Arquitectura del Algoritmo Central

El Algoritmo 1 es la contribución central de este artículo:

Algoritmo 1: Golpear Bolas Crecientes
Entrada: número de vértices n, número de bolas m, número objetivo de centros r, 
         parámetro de costo p
Salida: a lo sumo r centros que golpean todas las bolas

1: Inicializar todas las bolas como vacías, ningún centro seleccionado
2: b ← ⌈2^(p+2)n/r⌉
3: Hacer crecer cada bola hasta tamaño min{b, n}
4: mientras no todas las bolas sean golpeadas hacer
5:   m' ← número de bolas no golpeadas
6:   Repetidamente seleccionar nuevos centros que golpeen el máximo número 
     de bolas no golpeadas, hasta que el número de bolas no golpeadas ≤ m'/2^(p+1)
7:   b ← 2b
8:   Hacer crecer cada bola no golpeada hasta tamaño min{b, n}
9: devolver todos los centros seleccionados

Ideas Clave del Algoritmo

  1. Estrategia de Decrecimiento Exponencial: En la ronda i, se utilizan solo O(r/2^i) centros, pero se permite que las bolas crezcan hasta 2^i n/r
  2. Equilibrio de Compensaciones: Aunque las bolas posteriores son más grandes, el número de bolas no golpeadas decrece exponencialmente
  3. Crecimiento Adaptativo: Ajusta dinámicamente el tamaño de las bolas según la situación actual de bolas no golpeadas

Análisis Teórico

El Teorema 4 prueba la corrección del algoritmo:

  • Cantidad de Centros: Selecciona a lo sumo r centros
  • Costo Total: O_p(m(n/r)^p) = O_p(m·f(n/r))
  • Complejidad de Tiempo: O_p(r + mn/r)

Puntos Clave de la Prueba:

  1. Análisis del límite superior del número de centros en cada ronda
  2. Decrecimiento exponencial del número de bolas no golpeadas
  3. Obtención del límite de costo total mediante suma de series geométricas

Configuración Experimental

Verificación Teórica

Este es principalmente un trabajo teórico, verificando la corrección del algoritmo y los límites de complejidad mediante pruebas matemáticas rigurosas.

Verificación de Aplicaciones

Se verifica la efectividad del método mediante dos aplicaciones concretas:

  1. Camino Más Corto de Fuente Única:
    • Integrar el Algoritmo 1 en la fase de construcción de paquetes de DMSY23
    • Establecer la función de costo como f(x) = x log x
    • Selección de parámetros r = m√(log log n)/√(log n)
  2. Oráculo de Distancia de Thorup-Zwick:
    • Aplicar el Algoritmo 1 en cada nivel i para seleccionar A_{i+1}
    • Combinar con la técnica RTZ05 para implementar operaciones eficientes de crecimiento de bolas
    • Configuración de parámetros r = n^(-1/k)|A_i|

Detalles de Implementación

Optimizaciones de Estructuras de Datos:

  • Mantener el número de bolas no golpeadas que cada vértice j puede golpear a_j
  • Usar listas doblemente enlazadas L_k para mantener vértices con a_j = k
  • Soportar operaciones de inserción, eliminación y búsqueda del máximo en tiempo O(1)

Resultados Experimentales

Resultados Principales

Teorema 2 (Camino Más Corto de Fuente Única):

  • En grafos no dirigidos con pesos de aristas no negativos, existe un algoritmo determinista de comparación-adición
  • Complejidad de Tiempo: O(m√(log n log log n))
  • Exactamente la misma complejidad que el algoritmo aleatorio DMSY23

Teorema 3 (Oráculo de Thorup-Zwick):

  • Oráculo de distancia aproximada de Thorup-Zwick de tamaño O(kn^{1+1/k})
  • Puede construirse determinísticamente en tiempo O(kn^{1/k}(m + n log n))
  • Igual al tiempo de preprocesamiento del algoritmo aleatorio original

Comparación de Complejidad

AlgoritmoTipoComplejidad de TiempoObservaciones
DijkstraDeterministaO(m + n log n)Algoritmo clásico
DMSY23AleatorioO(m√(log n log log n))Supera por primera vez a Dijkstra
DMSY23+Desaleatorización FolclóricaDeterministaO(m log n √(log log n))Superado nuevamente por Dijkstra
Método de Este ArtículoDeterministaO(m√(log n log log n))Desaleatorización sin pérdidas

Verificación de Innovación Técnica

El Corolario 5 demuestra la aplicabilidad del método a diferentes funciones de costo:

  • Para f(x) = x log x, mediante la aplicación de la desigualdad de Jensen
  • Límite de costo total: O(m(n/r)log(n/r))
  • Extensible a otras funciones de costo de tamaño polinomial

Trabajo Relacionado

Camino Más Corto de Fuente Única

  1. Algoritmos Clásicos: Algoritmo de Dijkstra y sus mejoras
  2. Pesos Enteros: Algoritmo de tiempo lineal de Thorup
  3. Avances Recientes: Algoritmo aleatorio DMSY23, algoritmo determinista DMM+25

Oráculo de Distancia Aproximada

  1. Trabajo Fundacional: El oráculo de Thorup-Zwick establece la base
  2. Investigación en Desaleatorización: RTZ05 propone métodos de desaleatorización mejorados
  3. Optimización de Consultas: Mejoras en tiempo de consulta de Wulff-Nilsen y otros

Técnicas de Desaleatorización

  1. Métodos Tradicionales: Desaleatorización folclórica basada en cobertura de conjuntos
  2. Limitaciones del Problema: El factor adicional O(log n) es inaceptable en algunas aplicaciones
  3. Contribución de Este Artículo: Primera desaleatorización verdaderamente sin pérdidas

Conclusiones y Discusión

Conclusiones Principales

  1. Avance Teórico: Primera desaleatorización sin pérdidas del problema de golpear bolas, logrando límites óptimos en promedio
  2. Aplicaciones Prácticas: Aplicación exitosa a dos algoritmos de grafos importantes, manteniendo la misma complejidad que las versiones aleatorias
  3. Marco General: Proporciona un método general aplicable a múltiples funciones de costo

Limitaciones

  1. Suposiciones del Modelo:
    • Requiere que el grado del grafo sea O(m/n) (realizable mediante división de vértices)
    • Necesita el modelo de comparación-adición
    • Para la aplicación DMSY23, asume grafos de grado constante
  2. Rango de Aplicabilidad:
    • Principalmente aplicable a escenarios donde el tamaño de las bolas puede ser elegido adaptativamente
    • No aplicable cuando el tamaño de las bolas está completamente fijo por la entrada
  3. Eficiencia Práctica:
    • Aunque la complejidad asintótica es óptima, los factores constantes pueden ser grandes
    • En grafos pequeños, puede no ser tan eficiente como métodos aleatorios simples

Direcciones Futuras

  1. Optimización de Algoritmos:
    • Reducir los factores constantes en el algoritmo
    • Diseñar versiones de implementación más prácticas
  2. Extensión de Aplicaciones:
    • Explorar aplicaciones en otros algoritmos de grafos
    • Investigar extensiones en configuraciones de grafos dinámicos
  3. Profundización Teórica:
    • Investigar límites inferiores, probando la optimalidad del método
    • Extender a funciones de costo más generales

Evaluación Profunda

Fortalezas

  1. Innovación Técnica:
    • Primera utilización de la propiedad de crecimiento de bolas para lograr desaleatorización sin pérdidas
    • Diseño de algoritmo elegante y ingenioso, con estrategia de decrecimiento exponencial muy creativa
  2. Contribución Teórica:
    • Pruebas matemáticas rigurosas, análisis teórico completo
    • Proporciona un marco general, aplicable a múltiples funciones de costo
  3. Significado Práctico:
    • Resuelve el problema de desaleatorización de algoritmos importantes como DMSY23
    • Las mejoras al oráculo de distancia de Thorup-Zwick tienen valor fundamental
  4. Claridad de Expresión:
    • Estructura clara del artículo, descripción técnica precisa
    • Pseudocódigo del algoritmo conciso y fácil de entender

Deficiencias

  1. Falta de Verificación Experimental:
    • Trabajo puramente teórico, sin pruebas de rendimiento práctico
    • Sin comparación empírica con otros métodos
  2. Análisis de Factores Constantes:
    • Aunque es óptimo asintóticamente, las constantes ocultas pueden ser grandes
    • La eficiencia en aplicaciones prácticas requiere verificación
  3. Rango de Aplicaciones:
    • Principalmente dirigido a tipos específicos de problemas
    • Orientación limitada para desaleatorización general de problemas

Impacto

  1. Valor Académico:
    • Proporciona nuevas perspectivas para técnicas de desaleatorización
    • Puede inspirar mejoras en otros algoritmos
  2. Valor Práctico:
    • Proporciona herramientas importantes para aplicaciones que requieren garantías deterministas
    • Posibles aplicaciones en computación distribuida y paralela
  3. Reproducibilidad:
    • Descripción clara del algoritmo, fácil de implementar
    • Los resultados teóricos pueden verificarse independientemente

Escenarios de Aplicabilidad

  1. Investigación Teórica: Proporciona referencia para desaleatorización de otros algoritmos aleatorios
  2. Aplicaciones de Sistemas: Reemplaza algoritmos aleatorios en sistemas que requieren comportamiento determinista
  3. Propósitos Educativos: Excelente caso de estudio de técnicas de desaleatorización

Referencias

El artículo cita abundante trabajo relacionado, incluyendo principalmente:

  1. DMSY23: Algoritmo aleatorio de camino más corto de fuente única de Duan et al.
  2. TZ05: Trabajo original del oráculo de distancia aproximada de Thorup-Zwick
  3. RTZ05: Mejoras de desaleatorización de Roditty et al.
  4. Dij59: Algoritmo clásico de camino más corto de Dijkstra
  5. FT87: Trabajo relacionado con montículos de Fibonacci

Este artículo realiza contribuciones importantes en el campo de la informática teórica, particularmente en la desaleatorización de algoritmos de grafos. Aunque carece de verificación experimental, su valor teórico y perspectivas de aplicación potencial lo convierten en un progreso importante en el campo.