2025-11-16T12:28:12.323029

Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo

Hofstadler, Latuszynski, Roberts et al.

We consider adaptive increasingly rare Markov chain Monte Carlo (MCMC) algorithms, which are adaptive MCMC methods, where the adaptation concerning the "past'' happens less and less frequently over time. Under a contraction assumption with respect to a Wasserstein-like function we deduce upper bounds of the convergence rate of Monte Carlo sums taking a renormalisation factor into account that is "almost'' the one that appears in a law of the iterated logarithm. We demonstrate the applicability of our results by considering different settings, among which are those of simultaneous geometric and uniform ergodicity. All proofs are carried out on an augmented state space, including the classical non-augmented setting as a special case. In contrast to other adaptive MCMC limit theory, some technical assumptions, like diminishing adaptation, are not needed.

academic

적응형 점점 희소 마르코프 연쇄 몬테카를로의 거의 확실한 수렴 속도

기본 정보

논문 ID: 2402.12122
제목: Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
저자: Julian Hofstadler (University of Bath), Krzysztof Latuszyński (University of Warwick), Gareth O. Roberts (University of Warwick), Daniel Rudolf (University of Passau)
분류: math.NA cs.NA math.PR math.ST stat.TH
발표 시간: 2025년 10월 14일 (arXiv 버전)
논문 링크: https://arxiv.org/abs/2402.12122

초록

본 논문은 적응형 점점 희소 마르코프 연쇄 몬테카를로(AIR MCMC) 알고리즘을 연구한다. 이는 "과거"에 대한 적응이 시간이 지남에 따라 점점 희소해지는 적응형 MCMC 방법의 한 종류이다. Wasserstein 유사 함수에 대한 축약 가정 하에서, 저자들은 반복 로그 법칙에서 거의 나타나는 재정규화 인수를 고려한 몬테카를로 합의 수렴 속도 상한을 도출한다. 논문은 동시 기하 에르고딕성과 균일 에르고딕성 등 다양한 설정을 고려하여 결과의 적용 가능성을 입증한다. 모든 증명은 확대된 상태 공간에서 수행되며, 고전적 비확대 설정을 특수한 경우로 포함한다. 다른 적응형 MCMC 극한 이론과 비교하여, 감소하는 적응과 같은 일부 기술적 가정이 필요하지 않다.

연구 배경 및 동기

문제 정의

계산 통계학에서 널리 존재하는 과제는 기댓값을 근사하는 것이다: $\nu(f) = \int_X f(x)\nu(dx)$ 여기서 $\nu$ 는 목표 분포이고, $f: X \to \mathbb{R}$ 는 관심 있는 적분 가능한 함수이다.

연구 동기

직접 표본 추출의 어려움: $\nu$ 에서 직접 표본 추출이 불가능하거나 계산상 실행 불가능할 때(예: 밀도가 미지의 정규화 상수를 포함), 대체 방법이 필요하다.
적응형 MCMC의 과제: 전통적 적응형 MCMC 방법은 전체 이력을 고려하여 단계 전이 메커니즘을 업데이트하므로, 비마르코프 과정이 되어 수학적 분석이 복잡해진다.
기술적 가정 단순화의 필요성: 기존 적응형 MCMC 이론은 일반적으로 기술적 가정(예: 감소하는 적응)을 필요로 하며, 이는 방법의 적용 가능성을 제한한다.

기존 방법의 한계

적응형 MCMC의 비마르코프 특성으로 인한 복잡한 증명 기법
수렴성을 보장하기 위한 엄격한 기술적 조건 필요
재정규화 몬테카를로 합의 수렴성에 관한 결과 부족

핵심 기여

AIR MCMC 이론 프레임워크 제시: Wasserstein 축약 가정 하에서 AIR 알고리즘에 대한 거의 확실한 수렴 속도 이론을 확립한다.
개선된 수렴 속도: $r(n) = \sqrt{n}(\log n)^{1/2+\varepsilon}$ 또는 $r(n) = n^{1/2+\varepsilon}$ 형태의 수렴 속도를 획득하며, 이는 반복 로그 법칙의 최적 속도에 근접한다.
기술적 가정 단순화: 감소하는 적응 등 전통적 기술적 가정이 필요하지 않으며, 방법의 적용 범위를 확대한다.
확대된 상태 공간 분석: $Y = X \times \Phi$ 설정을 통해 확대된 상태 공간에서 분석을 수행하며, 고전적 비확대 설정을 특수한 경우로 포함한다.
광범위한 적용 가능성: 동시 기하 에르고딕성과 균일 에르고딕성 등 다양한 설정에 적용 가능한 결과를 제공한다.

방법론 상세 설명

AIR MCMC 알고리즘 정의

매개변수 $\beta > 0$ 이 주어졌을 때, $k_j = \lceil j^\beta \rceil$ 로 설정하고 특정 시점에서만 적응을 수행한다: $T_m = \sum_{j=1}^m k_j$

핵심 관찰: 임의의 $\beta > 0$ 에 대해, 다음을 만족하는 상수 $c_\beta, C_\beta$ 가 존재한다: $c_\beta m^{1+\beta} \leq T_m \leq C_\beta m^{1+\beta}$

이는 적응 빈도가 감소함을 의미한다.

핵심 기술 프레임워크

1. Wasserstein 유사 함수

거리 유사 함수 $d: Y \times Y \to \mathbb{R}_+$ 에 대해, 다음과 같이 정의한다: $W(\mu_1, \mu_2) := \inf_{\xi \in C(\mu_1,\mu_2)} \int_{Y^2} d(x,y)\xi(dx,dy)$

2. 주요 가정 (가정 3.1)

각 $\gamma \in I$ 에 대해, 다음을 가정한다:

$\pi_\gamma$ 는 $P_\gamma$ 의 불변 분포
$\tau(P_\gamma) \leq M$ 이고 $\tau(P_\gamma^{k_0}) \leq \tau$ 여기서 $M \in [1,\infty)$ , $\tau \in [0,1)$ , $k_0 \in \mathbb{N}$ 는 $\gamma$ 와 무관하다.