Distributed Thompson sampling under constrained communication
Zerefa, Ren, Ma et al.
In Bayesian optimization, a black-box function is maximized via the use of a surrogate model. We apply distributed Thompson sampling, using a Gaussian process as a surrogate model, to approach the multi-agent Bayesian optimization problem. In our distributed Thompson sampling implementation, each agent receives sampled points from neighbors, where the communication network is encoded in a graph; each agent utilizes their own Gaussian process to model the objective function. We demonstrate theoretical bounds on Bayesian average regret and Bayesian simple regret, where the bound depends on the structure of the communication graph. Unlike in batch Bayesian optimization, this bound is applicable in cases where the communication graph amongst agents is constrained. When compared to sequential single-agent Thompson sampling, our bound guarantees faster convergence with respect to time as long as the communication graph is connected. We confirm the efficacy of our algorithm with numerical simulations on traditional optimization test functions, demonstrating the significance of graph connectivity on improving regret convergence.
academic
Распределённое выборочное распределение Томпсона при ограниченной коммуникации
В данной работе исследуется задача многоагентной байесовской оптимизации при ограниченной коммуникации. Авторы предлагают распределённый алгоритм выборочного распределения Томпсона, использующий гауссовские процессы в качестве суррогатной модели. В реализации каждый агент получает точки выборки от соседей, коммуникационная сеть кодируется структурой графа; каждый агент использует собственный гауссовский процесс для моделирования целевой функции. В работе доказаны границы байесовского среднего сожаления и байесовского простого сожаления, которые зависят от структуры коммуникационного графа. В отличие от пакетной байесовской оптимизации, данная граница применима к случаям, когда коммуникационный граф между агентами ограничен. По сравнению с последовательным однопроцессорным выборочным распределением Томпсона алгоритм гарантирует более быструю сходимость по времени при условии связности коммуникационного графа.
Основная проблема, которую решает данная работа, заключается в оптимизации чёрного ящика в многоагентных системах с ограниченной коммуникацией. Конкретно:
Вызовы оптимизации чёрного ящика: Необходимо найти максимум функции в условиях, когда целевая функция не известна явно и доступна только через зашумленные оценки
Требования многоагентного сотрудничества: Несколько агентов могут параллельно выполнять выборку целевой функции, но их взаимная коммуникация может быть ограничена
Реалистичность коммуникационных ограничений: В практических приложениях (например, поиск источника многороботными системами, сенсорные сети) агенты могут не иметь доступа ко всей информации других агентов
Неприменимость централизованных подходов: Требуют центрального координатора для управления данными всех агентов, что нереально в распределённых сценариях
Чрезмерно строгие предположения пакетной байесовской оптимизации: Предполагают, что все агенты имеют доступ к одинаковой информации, что не соответствует реальности с ограниченной коммуникацией
Требовательные теоретические гарантии: Предыдущая литература по распределённой байесовской оптимизации с теоретическими гарантиями требует полностью связного коммуникационного графа
Отправной точкой авторов является разработка распределённого алгоритма байесовской оптимизации, работающего при произвольной структуре коммуникационного графа, с соответствующими теоретическими гарантиями.
Предложение распределённого алгоритма выборочного распределения Томпсона: Разработан новый алгоритм для задачи многоагентной байесовской оптимизации при ограниченной коммуникации
Установление теоретических границ:
Граница байесовского среднего сожаления: O~(Mtθ(G))
Граница байесовского простого сожаления: O~(t∣Vmax∣1)
Анализ зависимости от структуры графа: Границы зависят от числа клик графа θ(G) и размера максимального полного подграфа ∣Vmax∣
Гарантии сходимости: Доказано, что при связном коммуникационном графе алгоритм сходится быстрее, чем последовательный однопроцессорный метод
Численная верификация: Алгоритм проверен на стандартных функциях оптимизации
Для компактного множества X⊂Rd рассматривается неизвестная непрерывная функция f:X→R, целью является нахождение её максимума. Имеется M агентов, каждый из которых может запрашивать f и получать зашумленные наблюдения y=f(x)+ϵ, где ϵ∼N(0,σϵ2).
Коммуникационная сеть описывается графом G=(V,E), где ∣V∣=M, ребро (i,j)∈E означает, что агенты i и j могут обмениваться информацией. Данные, доступные агенту i в момент времени t, это Dt,i={(xτ,j,yτ,j)}j∈N(i)∪{i},τ<t.
1. Установить GP-априор для f
2. Инициализация: для i=1,...,M установить начальные данные D_{1,i} и GP_{0,i}
3. Для t=1,...,T:
Для i=1,...,M:
a) Обновить апостериорный GP_{t,i} на основе D_{t,i}
b) Выполнить выборку реализации функции: f̂_{t,i} ~ GP_{t,i}
c) Выбрать точку запроса: x_{t,i} = argmax_x f̂_{t,i}(x)
d) Получить наблюдение y_{t,i}
e) Передать соседям (x_{t,i}, y_{t,i})
f) Собрать оценки от соседей C_{t,i}
g) Обновить историю данных: D_{t+1,i} = D_{t,i} ∪ C_{t,i} ∪ {(x_{t,i}, y_{t,i})}
Конструкция без центрального координатора: Каждый агент независимо поддерживает собственную модель GP, избегая узких мест централизованного подхода
Использование структуры коммуникационного графа: Теоретический анализ умело разлагает коммуникационный граф на непересекающиеся полные подграфы и анализирует производительность каждого подграфа отдельно
Фреймворк информационно-теоретического анализа: Использует концепции информационной теории, такие как максимальный информационный прирост (MIG), для ограничения производительности алгоритма
Теорема 3.1 (Граница байесовского среднего сожаления):
Пусть {Gk}k∈{1,...,n} — множество n непересекающихся полных подграфов коммуникационного графа G, тогда байесовское среднее сожаление после t шагов удовлетворяет:
RAB(t)≤M1∑k=1n∣Vk∣(t∣Vk∣C1+t∣Vk∣C2ξ∣Vk∣βtΨt∣Vk∣)
Следствие 3.2: Выбирая n как число клик графа G — θ(G), получаем:
RAB(t)=O~(Mtθ(G))
Данная работа впервые предоставляет теоретические гарантии для распределённой байесовской оптимизации при ограниченной коммуникации (не полностью связный граф), заполняя важный пробел в этой области.
Значительный теоретический вклад: Впервые предоставлены теоретические гарантии для распределённой байесовской оптимизации при ограниченной коммуникации
Практическая постановка задачи: Рассматривается важная проблема коммуникационных ограничений в реальности
Строгий анализ: Теоретические доказательства имеют чёткую структуру, используются инструменты информационной теории для глубокого анализа
Достаточная экспериментальная поддержка: Численные эксперименты хорошо верифицируют теоретические предсказания
Задачи параллельной оптимизации с ограниченной пропускной способностью коммуникации
Общая оценка: Это высококачественная статья с важным теоретическим вкладом в область распределённой байесовской оптимизации. Авторы умело объединили теорию графов, информационную теорию и байесовскую оптимизацию, предоставив теоретические гарантии для практически важного сценария с ограниченной коммуникацией. Хотя в практическом применении есть место для улучшений, её теоретическая ценность и руководящее значение для будущих исследований значительны.