Lossless Derandomization for Undirected Single-Source Shortest Paths and Approximate Distance Oracles
Yan
A common step in algorithms related to shortest paths in undirected graphs is that, we select a subset of vertices as centers, then grow a ball around each vertex until a center is reached. We want the balls to be as small as possible. A randomized algorithm can uniformly sample $r$ centers to achieve the optimal (expected) ball size of $Î(n/r)$. A folklore derandomization is to use the $O(\log n)$ approximation for the set cover problem in the hitting set version where we want to hit all the balls with the centers.
However, the extra $O(\log n)$ factor is sometimes too expensive. For example, the recent $O(m\sqrt{\log n\log\log n})$ undirected single-source shortest path algorithm [DMSY23] beats Dijkstra's algorithm in sparse graphs, but the folklore derandomization would make it dominated by Dijkstra's.
In this paper, we exploit the fact that the sizes of these balls can be adaptively chosen by the algorithm instead of fixed by the input. We propose a simple deterministic algorithm achieving the optimal ball size of $Î(n/r)$ on average. Furthermore, given any polynomially large cost function of the ball size, we can still achieve the optimal cost on average. It allows us to derandomize [DMSY23], resulting in a deterministic $O(m\sqrt{\log n\log\log n})$ algorithm for undirected single-source shortest path.
In addition, we show that the same technique can also be used to derandomize the seminal Thorup-Zwick approximate distance oracle [TZ05], also without any loss in the time/space complexity.
academic
Бесстратегийная дерандомизация для неориентированных кратчайших путей из одного источника и приблизительных оракулов расстояний
В данной работе исследуется фундаментальная проблема в алгоритмах кратчайших путей на неориентированных графах: как выбрать подмножество вершин в качестве центров и вырастить шары из каждой вершины до достижения центра таким образом, чтобы минимизировать размер шаров. Рандомизированный алгоритм может равномерно выбрать r центров для достижения оптимального ожидаемого размера шара Θ(n/r), однако традиционные методы дерандомизации вводят дополнительный множитель O(log n), что является дорогостоящим для некоторых приложений. Используя тот факт, что размер шаров может быть адаптивно выбран алгоритмом, авторы предлагают простой детерминированный алгоритм, достигающий оптимального размера шара Θ(n/r) в среднем и расширяемый на произвольные полиномиальные функции стоимости. Данная техника успешно применена к дерандомизации алгоритма O(m√(log n log log n)) для кратчайших путей из одного источника от DMSY23 и классического оракула приблизительных расстояний Thorup-Zwick без потери временной/пространственной сложности.
Центральная проблема, решаемая в данной работе — это проблема попадания в растущие шары (Hitting Growable Balls). Во многих графовых алгоритмах, особенно в алгоритмах кратчайших путей, оракулах расстояний и алгоритмах разреживания графов, встречается следующая схема:
Выбрать подмножество вершин R в качестве центров
Из каждой вершины v вырастить шар B(v) до достижения некоторого центра
Производительность алгоритма зависит от размера |R| и суммарного размера всех шаров
Традиционные методы дерандомизации имеют критические недостатки:
Стоимость фольклорного метода: Использование O(log n)-приближения для задачи покрытия множеств при дерандомизации вводит дополнительный множитель O(log n)
Серьёзная потеря производительности: Для алгоритма DMSY23 этот дополнительный множитель деградирует временную сложность с O(m√(log n log log n)) до O(m log n √(log log n)), что вновь превосходится алгоритмом Дейкстры
Предположение о фиксированном размере шара: Традиционные методы предполагают, что размер шара фиксирован входом, не используя адаптивность алгоритма
Ключевое наблюдение в данной работе: размер шаров может быть адаптивно выбран алгоритмом, а не зафиксирован входом. Это открывает новые возможности для разработки более эффективных алгоритмов дерандомизации.
Предложен детерминированный алгоритм для попадания в растущие шары: Разработан Алгоритм 1, достигающий оптимального размера шара Θ(n/r) в среднем без введения дополнительных логарифмических множителей
Реализована бесстратегийная дерандомизация алгоритма DMSY23: Преобразован рандомизированный алгоритм O(m√(log n log log n)) для кратчайших путей из одного источника в детерминированный алгоритм с той же сложностью
Дерандомизирован оракул расстояний Thorup-Zwick: Устранен множитель O(log n) из предыдущих методов дерандомизации, достигнута временная сложность предварительной обработки O(kn^(1/k)(m + n log n)), совпадающая с рандомизированной версией
Предоставлена универсальная теоретическая база: Метод расширяется на произвольные полиномиальные функции стоимости с широкой применимостью
Алгоритм 1 является основным вкладом данной работы:
Алгоритм 1: Попадание в растущие шары
Вход: количество вершин n, количество шаров m, целевое количество центров r, параметр стоимости p
Выход: не более r центров, попадающих во все шары
1: Инициализировать все шары как пустые, центры не выбраны
2: b ← ⌈2^(p+2)n/r⌉
3: Вырастить каждый шар до размера min{b, n}
4: while не все шары попадены do
5: m' ← количество непопаданных шаров
6: Повторно выбирать центры, попадающие в максимальное количество непопаданных шаров,
пока количество непопаданных шаров ≤ m'/2^(p+1)
7: b ← 2b
8: Вырастить каждый непопаданный шар до размера min{b, n}
9: return все выбранные центры
Данная работа является преимущественно теоретической, с проверкой корректности и границ сложности алгоритма посредством строгих математических доказательств.
Статья ссылается на богатый набор связанных работ, включая:
DMSY23: Рандомизированный алгоритм кратчайших путей из одного источника от Duan et al.
TZ05: Исходная работа оракула приблизительных расстояний Thorup-Zwick
RTZ05: Улучшенная дерандомизация от Roditty et al.
Dij59: Классический алгоритм кратчайших путей Дейкстры
FT87: Связанные работы по кучам Фибоначчи
Данная работа вносит значительный вклад в область теоретической информатики, особенно в дерандомизацию графовых алгоритмов. Хотя ей не хватает экспериментальной верификации, её теоретическая ценность и потенциальные перспективы применения делают её важным прогрессом в данной области.