Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
Hofstadler, Latuszynski, Roberts et al.
We consider adaptive increasingly rare Markov chain Monte Carlo (MCMC) algorithms, which are adaptive MCMC methods, where the adaptation concerning the "past'' happens less and less frequently over time. Under a contraction assumption with respect to a Wasserstein-like function we deduce upper bounds of the convergence rate of Monte Carlo sums taking a renormalisation factor into account that is "almost'' the one that appears in a law of the iterated logarithm. We demonstrate the applicability of our results by considering different settings, among which are those of simultaneous geometric and uniform ergodicity. All proofs are carried out on an augmented state space, including the classical non-augmented setting as a special case. In contrast to other adaptive MCMC limit theory, some technical assumptions, like diminishing adaptation, are not needed.
academic
Fast sichere Konvergenzraten von adaptiven zunehmend seltenen Markov-Ketten-Monte-Carlo
Titel: Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
Autoren: Julian Hofstadler (University of Bath), Krzysztof Latuszyński (University of Warwick), Gareth O. Roberts (University of Warwick), Daniel Rudolf (University of Passau)
Dieses Papier untersucht den adaptiven zunehmend seltenen Markov-Ketten-Monte-Carlo-Algorithmus (AIR MCMC), eine Klasse adaptiver MCMC-Methoden, bei denen die Anpassungen an die „Vergangenheit" mit der Zeit zunehmend seltener werden. Unter Kontraktionsannahmen bezüglich Wasserstein-ähnlicher Funktionen leiten die Autoren obere Schranken für die Konvergenzrate von Monte-Carlo-Summen ab, die einen „fast" im iterierten Logarithmusgesetz auftretenden Renormalisierungsfaktor berücksichtigen. Das Papier demonstriert die Anwendbarkeit der Ergebnisse durch die Betrachtung verschiedener Einstellungen wie gleichzeitige geometrische Ergodizität und gleichmäßige Ergodizität. Alle Beweise werden im erweiterten Zustandsraum durchgeführt und beinhalten klassische nicht-erweiterte Einstellungen als Spezialfälle. Im Vergleich zu anderen Grenzwerttheorien für adaptive MCMC werden einige technische Annahmen wie abnehmende Anpassung nicht benötigt.
Eine weit verbreitete Herausforderung in der Computationalstatistik besteht darin, Erwartungswerte zu approximieren:
ν(f)=∫Xf(x)ν(dx)
wobei ν die Zielverteilung ist und f:X→R eine interessierende integrierbare Funktion.
Schwierigkeiten beim direkten Sampling: Wenn direktes Sampling aus ν unmöglich oder rechnerisch nicht durchführbar ist (z.B. wenn die Dichte eine unbekannte Normalisierungskonstante enthält), sind alternative Methoden erforderlich.
Herausforderungen bei adaptiven MCMC-Methoden: Traditionelle adaptive MCMC-Methoden aktualisieren den Einschritt-Übergangsmechanismus durch Berücksichtigung der gesamten Historie, was zu nicht-Markov-Prozessen führt und die mathematische Analyse erschwert.
Bedarf zur Vereinfachung technischer Annahmen: Bestehende Theorien für adaptive MCMC erfordern typischerweise technische Annahmen (wie abnehmende Anpassung), die die Anwendbarkeit der Methoden einschränken.
Theoretischer Rahmen für AIR MCMC: Etablierung einer Theorie fast sicherer Konvergenzraten für AIR-Algorithmen unter Wasserstein-Kontraktionsannahmen.
Verbesserte Konvergenzraten: Erreichung von Konvergenzraten der Form r(n)=n(logn)1/2+ε oder r(n)=n1/2+ε, die sich der optimalen Rate des iterierten Logarithmusgesetzes nähern.
Vereinfachung technischer Annahmen: Keine Notwendigkeit für traditionelle technische Annahmen wie abnehmende Anpassung, was den Anwendungsbereich der Methode erweitert.
Analyse im erweiterten Zustandsraum: Durchführung der Analyse im erweiterten Zustandsraum Y=X×Φ, wobei klassische nicht-erweiterte Einstellungen als Spezialfälle enthalten sind.
Breite Anwendbarkeit: Ergebnisse gelten für verschiedene Einstellungen wie gleichzeitige geometrische Ergodizität und gleichmäßige Ergodizität.
Verweis auf numerische Experimente aus CLR18, die zeigen, dass der AIR-Algorithmus bei β∈[1,2] eine ähnliche Leistung wie rein adaptive Methoden aufweist.
Abschwächung von Gleichmäßigkeitsannahmen: Unter dem Rahmen stochastischer Approximationsalgorithmen könnte Assumption 3.1 möglicherweise gelockert werden
Erweiterung auf reine Anpassung: Verwendung von Techniken aus SV10 zur Behandlung des Falls β=0
Verbesserung des kleinen β-Regimes: Entwicklung von Techniken zur Behandlung von β∈(0,1) ohne zusätzliche Annahmen