2025-11-20T02:31:13.678138

Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles

Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Θ(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers. However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's. In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Θ(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path. In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic

Бесстратегийная дерандомизация для неориентированных кратчайших путей из одного источника и приблизительных оракулов расстояний

Основная информация

  • ID статьи: 2510.12598
  • Название: Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
  • Автор: Shuyi Yan (BARC, Копенгагенский университет)
  • Классификация: cs.DS (Структуры данных и алгоритмы)
  • Дата публикации: 14 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.12598

Аннотация

В данной работе исследуется фундаментальная проблема в алгоритмах кратчайших путей на неориентированных графах: как выбрать подмножество вершин в качестве центров и вырастить шары из каждой вершины до достижения центра таким образом, чтобы минимизировать размер шаров. Рандомизированный алгоритм может равномерно выбрать r центров для достижения оптимального ожидаемого размера шара Θ(n/r), однако традиционные методы дерандомизации вводят дополнительный множитель O(log n), что является дорогостоящим для некоторых приложений. Используя тот факт, что размер шаров может быть адаптивно выбран алгоритмом, авторы предлагают простой детерминированный алгоритм, достигающий оптимального размера шара Θ(n/r) в среднем и расширяемый на произвольные полиномиальные функции стоимости. Данная техника успешно применена к дерандомизации алгоритма O(m√(log n log log n)) для кратчайших путей из одного источника от DMSY23 и классического оракула приблизительных расстояний Thorup-Zwick без потери временной/пространственной сложности.

Исследовательский контекст и мотивация

Основная проблема

Центральная проблема, решаемая в данной работе — это проблема попадания в растущие шары (Hitting Growable Balls). Во многих графовых алгоритмах, особенно в алгоритмах кратчайших путей, оракулах расстояний и алгоритмах разреживания графов, встречается следующая схема:

  1. Выбрать подмножество вершин R в качестве центров
  2. Из каждой вершины v вырастить шар B(v) до достижения некоторого центра
  3. Производительность алгоритма зависит от размера |R| и суммарного размера всех шаров

Значимость проблемы

Данная проблема занимает фундаментальное место в теории графовых алгоритмов, влияя на эффективность нескольких важных алгоритмов:

  • Кратчайшие пути из одного источника: Алгоритм DMSY23 впервые преодолел границу O(m + n log n) алгоритма Дейкстры на разреженных графах
  • Оракулы расстояний: Оракул Thorup-Zwick является классической структурой данных для приблизительных запросов расстояний
  • Разреживание графов: Аналогичные техники используются при построении разреженных подграфов

Ограничения существующих методов

Традиционные методы дерандомизации имеют критические недостатки:

  1. Стоимость фольклорного метода: Использование O(log n)-приближения для задачи покрытия множеств при дерандомизации вводит дополнительный множитель O(log n)
  2. Серьёзная потеря производительности: Для алгоритма DMSY23 этот дополнительный множитель деградирует временную сложность с O(m√(log n log log n)) до O(m log n √(log log n)), что вновь превосходится алгоритмом Дейкстры
  3. Предположение о фиксированном размере шара: Традиционные методы предполагают, что размер шара фиксирован входом, не используя адаптивность алгоритма

Исследовательская мотивация

Ключевое наблюдение в данной работе: размер шаров может быть адаптивно выбран алгоритмом, а не зафиксирован входом. Это открывает новые возможности для разработки более эффективных алгоритмов дерандомизации.

Основные вклады

  1. Предложен детерминированный алгоритм для попадания в растущие шары: Разработан Алгоритм 1, достигающий оптимального размера шара Θ(n/r) в среднем без введения дополнительных логарифмических множителей
  2. Реализована бесстратегийная дерандомизация алгоритма DMSY23: Преобразован рандомизированный алгоритм O(m√(log n log log n)) для кратчайших путей из одного источника в детерминированный алгоритм с той же сложностью
  3. Дерандомизирован оракул расстояний Thorup-Zwick: Устранен множитель O(log n) из предыдущих методов дерандомизации, достигнута временная сложность предварительной обработки O(kn^(1/k)(m + n log n)), совпадающая с рандомизированной версией
  4. Предоставлена универсальная теоретическая база: Метод расширяется на произвольные полиномиальные функции стоимости с широкой применимостью

Подробное описание метода

Определение задачи

Формальное определение проблемы попадания в растущие шары:

  • Вход: n вершин, m изначально пустых шаров, параметр r ∈ 1,n, функция стоимости f(·)
  • Операции: Алгоритм может выбрать шар и потребовать от противника добавить в него новую вершину
  • Цель: Выбрать r вершин в качестве центров так, чтобы каждый шар был попадён (содержал хотя бы один центр), минимизируя общую стоимость ∑f(|Bi|)

Архитектура основного алгоритма

Алгоритм 1 является основным вкладом данной работы:

Алгоритм 1: Попадание в растущие шары
Вход: количество вершин n, количество шаров m, целевое количество центров r, параметр стоимости p
Выход: не более r центров, попадающих во все шары

1: Инициализировать все шары как пустые, центры не выбраны
2: b ← ⌈2^(p+2)n/r⌉
3: Вырастить каждый шар до размера min{b, n}
4: while не все шары попадены do
5:   m' ← количество непопаданных шаров
6:   Повторно выбирать центры, попадающие в максимальное количество непопаданных шаров,
     пока количество непопаданных шаров ≤ m'/2^(p+1)
7:   b ← 2b
8:   Вырастить каждый непопаданный шар до размера min{b, n}
9: return все выбранные центры

Основная идея алгоритма

  1. Стратегия экспоненциального убывания: На i-й итерации используется O(r/2^i) центров, но размер шаров растёт до 2^i n/r
  2. Балансировка компромисса: Хотя шары в последующих итерациях больше, количество непопаданных шаров экспоненциально убывает
  3. Адаптивный рост: Размер шаров динамически корректируется в зависимости от текущего состояния непопаданных шаров

Теоретический анализ

Теорема 4 доказывает корректность алгоритма:

  • Количество центров: Выбирается не более r центров
  • Общая стоимость: O_p(m(n/r)^p) = O_p(m·f(n/r))
  • Временная сложность: O_p(r + mn/r)

Ключевые моменты доказательства:

  1. Анализ верхней границы количества центров на каждой итерации
  2. Экспоненциальное убывание количества непопаданных шаров
  3. Получение границы общей стоимости через суммирование геометрического ряда

Экспериментальная установка

Теоретическая верификация

Данная работа является преимущественно теоретической, с проверкой корректности и границ сложности алгоритма посредством строгих математических доказательств.

Верификация приложений

Эффективность метода проверена на двух конкретных приложениях:

  1. Кратчайшие пути из одного источника:
    • Интеграция Алгоритма 1 на этапе построения пучков (bundle construction) алгоритма DMSY23
    • Функция стоимости установлена как f(x) = x log x
    • Выбор параметра r = m√(log log n)/√(log n)
  2. Оракул расстояний Thorup-Zwick:
    • Применение Алгоритма 1 на каждом уровне i для выбора A_{i+1}
    • Комбинирование с техникой RTZ05 для эффективного роста шаров
    • Установка параметра r = n^(-1/k)|A_i|

Детали реализации

Оптимизация структур данных:

  • Поддержание количества непопаданных шаров, которые может попасть каждая вершина j
  • Использование двусвязных списков L_k для хранения вершин с a_j = k
  • Поддержка операций вставки, удаления и поиска максимума за O(1)

Результаты экспериментов

Основные результаты

Теорема 2 (Кратчайшие пути из одного источника):

  • На неориентированных графах с неотрицательными весами рёбер существует детерминированный алгоритм в модели сравнения-сложения
  • Временная сложность: O(m√(log n log log n))
  • Полностью совпадает со сложностью рандомизированного алгоритма DMSY23

Теорема 3 (Оракул Thorup-Zwick):

  • Оракул приблизительных расстояний Thorup-Zwick размером O(kn^{1+1/k})
  • Может быть детерминированно построен за время O(kn^{1/k}(m + n log n))
  • Совпадает со временем предварительной обработки исходного рандомизированного алгоритма

Сравнение сложностей

АлгоритмТипВременная сложностьПримечание
ДейкстраДетерминированныйO(m + n log n)Классический алгоритм
DMSY23РандомизированныйO(m√(log n log log n))Впервые превосходит Дейкстру
DMSY23 + фольклорная дерандомизацияДетерминированныйO(m log n √(log log n))Превосходится Дейкстрой
Данный методДетерминированныйO(m√(log n log log n))Бесстратегийная дерандомизация

Верификация технических инноваций

Следствие 5 демонстрирует применимость метода к различным функциям стоимости:

  • Для f(x) = x log x через применение неравенства Йенсена
  • Граница общей стоимости: O(m(n/r)log(n/r))
  • Расширяется на другие полиномиальные функции стоимости

Связанные работы

Кратчайшие пути из одного источника

  1. Классические алгоритмы: Алгоритм Дейкстры и его улучшения
  2. Целочисленные веса: Линейный алгоритм Thorup
  3. Последние прорывы: Рандомизированный алгоритм DMSY23, детерминированный алгоритм DMM+25

Приблизительные оракулы расстояний

  1. Основополагающие работы: Оракул Thorup-Zwick заложил основы
  2. Исследования дерандомизации: RTZ05 предложил улучшенный метод дерандомизации
  3. Оптимизация запросов: Улучшения времени запроса от Wulff-Nilsen и др.

Техники дерандомизации

  1. Традиционные методы: Фольклорная дерандомизация на основе покрытия множеств
  2. Ограничения проблемы: Дополнительный множитель O(log n) неприемлем для некоторых приложений
  3. Вклад данной работы: Впервые реализована истинная бесстратегийная дерандомизация

Заключение и обсуждение

Основные выводы

  1. Теоретический прорыв: Впервые реализована бесстратегийная дерандомизация проблемы попадания в шары, достигнута оптимальная граница в среднем
  2. Практические приложения: Успешное применение к двум важным графовым алгоритмам с сохранением сложности рандомизированных версий
  3. Универсальная база: Предоставлен универсальный метод, применимый к различным функциям стоимости

Ограничения

  1. Предположения модели:
    • Требуется степень графа O(m/n) (достижимо через разделение вершин)
    • Необходима модель сравнения-сложения
    • Для приложения DMSY23 предполагается граф с постоянной степенью
  2. Область применения:
    • Применимо в основном к сценариям, где размер шаров может быть адаптивно выбран
    • Неприменимо, когда размер шаров полностью зафиксирован входом
  3. Практическая эффективность:
    • Хотя асимптотическая сложность оптимальна, скрытые константы могут быть велики
    • На малых графах может быть менее эффективно, чем простые рандомизированные методы

Направления будущих исследований

  1. Оптимизация алгоритмов:
    • Снижение постоянных множителей в алгоритме
    • Разработка более практичных версий реализации
  2. Расширение приложений:
    • Исследование применения в других графовых алгоритмах
    • Изучение расширения на динамические графы
  3. Углубление теории:
    • Исследование нижних границ, доказательство оптимальности метода
    • Расширение на более общие функции стоимости

Глубокая оценка

Преимущества

  1. Техническая инновативность:
    • Впервые использована свойство растущести шаров для реализации бесстратегийной дерандомизации
    • Дизайн алгоритма прост и остроумен, стратегия экспоненциального убывания творческая
  2. Теоретический вклад:
    • Строгие математические доказательства, полный теоретический анализ
    • Предоставлена универсальная база, применимая к различным функциям стоимости
  3. Практическое значение:
    • Решена проблема дерандомизации важных алгоритмов, таких как DMSY23
    • Улучшение оракула Thorup-Zwick имеет фундаментальную ценность
  4. Ясность изложения:
    • Структура статьи ясна, техническое описание точно
    • Псевдокод алгоритма лаконичен и понятен

Недостатки

  1. Отсутствие экспериментальной верификации:
    • Чисто теоретическая работа без практических тестов производительности
    • Нет эмпирического сравнения с другими методами
  2. Анализ постоянных множителей:
    • Хотя асимптотически оптимально, скрытые константы могут быть велики
    • Практическая эффективность требует верификации
  3. Область применения:
    • Применимо в основном к специфическому типу задач
    • Ограниченное руководство для дерандомизации общих проблем

Влияние

  1. Академическая ценность:
    • Предоставляет новые идеи для техник дерандомизации
    • Может вдохновить улучшения других алгоритмов
  2. Практическая ценность:
    • Предоставляет важный инструмент для приложений, требующих детерминированных гарантий
    • Потенциальные приложения в распределённых и параллельных вычислениях
  3. Воспроизводимость:
    • Ясное описание алгоритма, легко реализуется
    • Теоретические результаты могут быть независимо проверены

Сценарии применения

  1. Теоретические исследования: Служит ориентиром для дерандомизации других рандомизированных алгоритмов
  2. Системные приложения: Замена рандомизированных алгоритмов в системах, требующих детерминированного поведения
  3. Образовательные цели: Отличный пример техники дерандомизации

Библиография

Статья ссылается на богатый набор связанных работ, включая:

  1. DMSY23: Рандомизированный алгоритм кратчайших путей из одного источника от Duan et al.
  2. TZ05: Исходная работа оракула приблизительных расстояний Thorup-Zwick
  3. RTZ05: Улучшенная дерандомизация от Roditty et al.
  4. Dij59: Классический алгоритм кратчайших путей Дейкстры
  5. FT87: Связанные работы по кучам Фибоначчи

Данная работа вносит значительный вклад в область теоретической информатики, особенно в дерандомизацию графовых алгоритмов. Хотя ей не хватает экспериментальной верификации, её теоретическая ценность и потенциальные перспективы применения делают её важным прогрессом в данной области.