Regret Analysis for Randomized Gaussian Process Upper Confidence Bound
Takeno, Inatsu, Karasuyama
Gaussian process upper confidence bound (GP-UCB) is a theoretically established algorithm for Bayesian optimization (BO), where we assume the objective function $f$ follows a GP. One notable drawback of GP-UCB is that the theoretical confidence parameter $β$ increases along with the iterations and is too large. To alleviate this drawback, this paper analyzes the randomized variant of GP-UCB called improved randomized GP-UCB (IRGP-UCB), which uses the confidence parameter generated from the shifted exponential distribution. We analyze the expected regret and conditional expected regret, where the expectation and the probability are taken respectively with $f$ and noise and with the randomness of the BO algorithm. In both regret analyses, IRGP-UCB achieves a sub-linear regret upper bound without increasing the confidence parameter if the input domain is finite. Furthermore, we show that randomization plays a key role in avoiding an increase in confidence parameter by showing that GP-UCB using a constant confidence parameter can incur linearly growing expected cumulative regret. Finally, we show numerical experiments using synthetic and benchmark functions and real-world emulators.
academic
Анализ сожаления для рандомизированной верхней доверительной границы гауссовского процесса
В данной работе исследуется теоретическое улучшение алгоритма GP-UCB в байесовской оптимизации. Основной недостаток классического GP-UCB заключается в том, что теоретический параметр доверия β растёт с числом итераций (βt ∝ log t), что приводит к чрезмерному исследованию в практических приложениях. Авторы предлагают улучшенный рандомизированный GP-UCB (IRGP-UCB), использующий сдвинутое экспоненциальное распределение для генерации параметров доверия. На конечной входной области IRGP-UCB достигает сублинейной верхней границы сожаления без необходимости увеличения параметра доверия. Доказав, что использование постоянного параметра доверия в GP-UCB приводит к линейному сожалению, авторы обосновывают необходимость рандомизации. Экспериментальная проверка подтверждает практическую эффективность метода.
Байесовская оптимизация (BO) направлена на оптимизацию дорогостоящих чёрных ящиков функций с минимальным числом вычислений функции. GP-UCB является одним из алгоритмов BO с наиболее сильными теоретическими гарантиями, однако существует серьёзный разрыв между теорией и практикой:
Проблема чрезмерного параметра доверия:
Теоретический анализ требует βt = Θ(log t), что в практических приложениях приводит к:
Чрезмерно широким доверительным интервалам
Чрезмерному исследованию алгоритмом
Медленной скорости сходимости
Ограничения существующих методов:
RGP-UCB, предложенный Berk et al. (2020), использует рандомизацию гамма-распределением, но его анализ содержит технические проблемы
Даже после исправления всё ещё требуется, чтобы βt рос со временем
Частотные методы (например, Chowdhury & Gopalan 2017) основаны на других предположениях, чем байесовская постановка
Теоретическое значение: Заполнение пробела в теории байесовской оптимизации без необходимости роста параметра доверия
Практическая ценность: Решение проблемы чрезмерного исследования GP-UCB в приложениях материаловедения, автоматического машинного обучения и разработки лекарств
Методологический вклад: Доказательство критической роли рандомизации в избежании роста параметра доверия
Ключевое неравенство:
Для любого заданного Dt-1,
Et[f(x∗)]≤Et[maxx∈Xμt−1(x)+ζt1/2σt−1(x)]
Схема доказательства (инновационная техника):
Начиная с леммы 4.1 (граница с высокой вероятностью на конечной области):
Pt(f(x)≤μt−1(x)+βδ1/2σt−1(x),∀x)≥1−δ
где βδ = 2log(|X|/(2δ))
Использование обратной функции CDF:
Ft−1(1−δ)≤maxxμt−1(x)+βδ1/2σt−1(x)
Ключевой шаг: Подстановка U ~ Uni(0,1) в δ, взятие ожидания:
EU[Ft−1(1−U)]≤EU[maxxμt−1(x)+βU1/2σt−1(x)]
Трюк обратного преобразования: F_t^{-1}(U) имеет то же распределение, что и f(x*), и:
βU=2log(∣X∣/2)−2log(U)
точно следует сдвинутому экспоненциальному распределению (так как -2log(U) ~ Exp(1/2))
Инновационное значение:
Прямое ограничение Ef(x*), избегание традиционных методов объединённых границ
Стоимость чрезмерного исследования: GP-UCB, RGP-UCB, TS показывают плохие результаты на поздних этапах, подтверждая негативное влияние чрезмерного βt
Чувствительность к размерности: На высоких размерностях (d=4,5) методы, основанные на максимуме выборочных путей (TS/JES), показывают снижение производительности
Согласованность теории и практики: Теоретически оптимальный IRGP-UCB также оптимален на практике — редкое единство теории и практики
Робастность: IRGP-UCB показывает хорошие результаты на различных типах функций (гладкие синтетические, многомодальные эталонные, шумные реальные данные)
LSE (Gotovos et al. 2013): классификация дорогостоящих функций чёрного ящика.
Рандомизированная LSE (Inatsu et al. 2024b): вдохновлена данной работой, аналогично избегает роста параметра.
Элегантность леммы 4.2: Естественное выведение сдвинутого экспоненциального распределения через обратное преобразование, избегание сложных объединённых границ традиционных методов
Многоуровневый анализ: ожидаемое сожаление → условное ожидаемое сожаление → граница с высокой вероятностью, полное покрытие
Доказательство нижней границы: теорема 4.6 заполняет пробел в доказательстве необходимости, логика полна
2. Техническая глубина (★★★★★)
Применение теории мартингалов: анализ условного ожидаемого сожаления использует неравенство Азумы, высокая техническая сложность
Концентрация липшицевых функций: предложение B.3 доказывает условную субгауссовость, детали строги
Построение контрпримера: проектирование двухточечной области в теореме 4.6 просто и мощно
3. Достаточность экспериментов (★★★★☆)
Охват синтетических, эталонных и реальных данных трёх типов
Сравнение с 7 основными методами
Отчёт о статистической значимости (полосы ошибок)
Недостаток: отсутствие крупномасштабных высокомерных экспериментов (d>5)
4. Ясность написания (★★★★★)
Чёткая структура: контекст → метод → теория → эксперименты
Ясная мотивация: каждая теорема имеет указанную цель перед ней
Читаемость доказательств: основные теоремы имеют схему доказательства в основном тексте, детали в приложении
Согласованность символов: Dt-1, μt-1 и т.д. унифицированы
Srinivas et al. (2010): "Gaussian process optimization in the bandit setting: No regret and experimental design" — оригинальная статья GP-UCB
Russo & Van Roy (2014): "Learning to optimize via posterior sampling" — байесовский анализ TS
Berk et al. (2020): "Randomised Gaussian process upper confidence bound for Bayesian optimisation" — RGP-UCB
Kandasamy et al. (2018): "Parallelised Bayesian optimisation via Thompson sampling" — граница MIG для TS
Takeno et al. (2023): конференц-версия данной работы (ICML 2023)
Liang et al. (2021): "Benchmarking the performance of Bayesian optimization across multiple experimental materials science domains" — наборы данных материалов
Данная работа достигает важного прорыва в теории байесовской оптимизации. Благодаря элегантной технике обратного преобразования (лемма 4.2), естественно выведено сдвинутое экспоненциальное распределение, достигнута первая сублинейная граница сожаления на конечной области без роста параметра доверия. Многоуровневый теоретический анализ (ожидаемое, условное ожидаемое, высокая вероятность) и доказательство необходимости (теорема 4.6) составляют полную теоретическую систему. Экспериментальная проверка подтверждает согласованность теории и практики, особенно демонстрируя практическую ценность в приложениях материаловедения.
Основные ограничения заключаются в том, что непрерывная область всё ещё требует роста параметра, граница с высокой вероятностью не полностью решает проблему, а эксперименты имеют ограниченную размерность. Тем не менее, данная работа открывает новое направление исследований GP-UCB, её техники (обратное преобразование, анализ мартингалов) имеют методологическую ценность и, как ожидается, повлияют на последующие исследования в BO и связанных областях (например, LSE). Для практических приложений с конечной областью, низкой размерностью и дорогостоящими оценками IRGP-UCB является одним из вариантов с наиболее сильными теоретическими гарантиями.