Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
Hofstadler, Latuszynski, Roberts et al.
We consider adaptive increasingly rare Markov chain Monte Carlo (MCMC) algorithms, which are adaptive MCMC methods, where the adaptation concerning the "past'' happens less and less frequently over time. Under a contraction assumption with respect to a Wasserstein-like function we deduce upper bounds of the convergence rate of Monte Carlo sums taking a renormalisation factor into account that is "almost'' the one that appears in a law of the iterated logarithm. We demonstrate the applicability of our results by considering different settings, among which are those of simultaneous geometric and uniform ergodicity. All proofs are carried out on an augmented state space, including the classical non-augmented setting as a special case. In contrast to other adaptive MCMC limit theory, some technical assumptions, like diminishing adaptation, are not needed.
academic
Почти достоверные скорости сходимости адаптивного всё более редкого Марковского цепного метода Монте-Карло
Название: Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
Авторы: Julian Hofstadler (University of Bath), Krzysztof Latuszyński (University of Warwick), Gareth O. Roberts (University of Warwick), Daniel Rudolf (University of Passau)
В данной работе исследуется алгоритм адаптивного всё более редкого Марковского цепного метода Монте-Карло (AIR MCMC), представляющий собой класс адаптивных методов MCMC, в которых адаптация к «прошлому» становится всё более редкой с течением времени. При предположениях о сжатии относительно функций типа Вассерштейна авторы выводят верхние границы скорости сходимости для сумм Монте-Карло, которые учитывают нормирующие множители, «почти» появляющиеся в законе повторного логарифма. Статья демонстрирует применимость результатов, рассматривая различные условия, такие как одновременная геометрическая эргодичность и равномерная эргодичность. Все доказательства проводятся в расширенном пространстве состояний, включая классическую неасширенную постановку как частный случай. По сравнению с другими предельными теориями адаптивного MCMC не требуются некоторые технические предположения, такие как убывающая адаптация.
В вычислительной статистике повсеместной задачей является аппроксимация математических ожиданий:
ν(f)=∫Xf(x)ν(dx)
где ν — целевое распределение, f:X→R — интегрируемая функция интереса.
Сложность прямого семплирования: Когда прямое семплирование из ν невозможно или вычислительно неосуществимо (например, плотность содержит неизвестную нормирующую константу), требуются альтернативные методы.
Вызовы адаптивного MCMC: Традиционные методы адаптивного MCMC обновляют механизм переходов одного шага, рассматривая всю историю, что приводит к немарковским процессам и усложняет математический анализ.
Необходимость упрощения технических предположений: Существующая теория адаптивного MCMC обычно требует технических условий (таких как убывающая адаптация), ограничивающих применимость методов.
Предложение теоретической базы AIR MCMC: Установлена теория почти достоверных скоростей сходимости для алгоритмов AIR при предположениях о сжатии Вассерштейна.
Улучшенные скорости сходимости: Получены скорости сходимости вида r(n)=n(logn)1/2+ε или r(n)=n1/2+ε, близкие к оптимальным скоростям закона повторного логарифма.
Упрощение технических предположений: Не требуется убывающая адаптация и другие традиционные технические предположения, расширяя область применения метода.
Анализ в расширенном пространстве состояний: Анализ проводится в расширенном пространстве состояний Y=X×Φ, включая классическую неасширенную постановку как частный случай.
Широкая применимость: Результаты применимы к различным условиям, включая одновременную геометрическую эргодичность и равномерную эргодичность.
Ключевое преимущество алгоритма AIR состоит в том, что большинство сложных членов в остаточном члене Rm взаимно сокращаются, обеспечивая:
∣Rm∣≤n1/(1+β)⋅константа
Ссылка на численные эксперименты из CLR18, демонстрирующие, что алгоритм AIR при β∈[1,2] показывает производительность, сравнимую с чистыми адаптивными методами.