Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
Hofstadler, Latuszynski, Roberts et al.
We consider adaptive increasingly rare Markov chain Monte Carlo (MCMC) algorithms, which are adaptive MCMC methods, where the adaptation concerning the "past'' happens less and less frequently over time. Under a contraction assumption with respect to a Wasserstein-like function we deduce upper bounds of the convergence rate of Monte Carlo sums taking a renormalisation factor into account that is "almost'' the one that appears in a law of the iterated logarithm. We demonstrate the applicability of our results by considering different settings, among which are those of simultaneous geometric and uniform ergodicity. All proofs are carried out on an augmented state space, including the classical non-augmented setting as a special case. In contrast to other adaptive MCMC limit theory, some technical assumptions, like diminishing adaptation, are not needed.
academic
Vitesses de convergence presque sûre de la chaîne de Markov Monte Carlo adaptative de plus en plus rare
Titre: Almost sure convergence rates of adaptive increasingly rare Markov chain Monte Carlo
Auteurs: Julian Hofstadler (University of Bath), Krzysztof Latuszyński (University of Warwick), Gareth O. Roberts (University of Warwick), Daniel Rudolf (University of Passau)
Cet article étudie l'algorithme de chaîne de Markov Monte Carlo adaptative de plus en plus rare (AIR MCMC), une classe de méthodes MCMC adaptatives où les adaptations au « passé » deviennent progressivement plus rares au fil du temps. Sous des hypothèses de contraction concernant des fonctions de type Wasserstein, les auteurs déduisent des bornes de vitesse de convergence pour les sommes Monte Carlo, lesquelles tiennent compte de facteurs de renormalisation apparaissant « presque » dans la loi du logarithme itéré. L'article démontre l'applicabilité des résultats en considérant différents cadres, notamment l'ergodicité géométrique et l'ergodicité uniforme simultanées. Toutes les preuves sont menées sur l'espace d'état augmenté, incluant le cadre classique non augmenté comme cas particulier. Comparativement à d'autres théories limites MCMC adaptatives, certaines hypothèses techniques, telles que l'adaptation décroissante, ne sont pas requises.
En statistique computationnelle, un défi omniprésent consiste à approximer les espérances:
ν(f)=∫Xf(x)ν(dx)
où ν est la distribution cible et f:X→R est une fonction intégrable d'intérêt.
Difficultés d'échantillonnage direct: Lorsque l'échantillonnage direct de ν est impossible ou numériquement infaisable (par exemple, lorsque la densité contient une constante de normalisation inconnue), des méthodes alternatives sont nécessaires.
Défis des MCMC adaptatifs: Les méthodes MCMC adaptatives traditionnelles mettent à jour le mécanisme de transition d'une étape en considérant l'historique complet, ce qui produit un processus non-Markovien et complique l'analyse mathématique.
Besoin de simplification des hypothèses techniques: La théorie MCMC adaptative existante nécessite généralement des hypothèses techniques (telles que l'adaptation décroissante), limitant l'applicabilité des méthodes.
Cadre théorique AIR MCMC proposé: Établissement d'une théorie de vitesse de convergence presque sûre pour les algorithmes AIR sous des hypothèses de contraction Wasserstein.
Vitesses de convergence améliorées: Obtention de vitesses de convergence de la forme r(n)=n(logn)1/2+ε ou r(n)=n1/2+ε, approchant les vitesses optimales de la loi du logarithme itéré.
Simplification des hypothèses techniques: Pas besoin d'adaptation décroissante ou d'autres hypothèses techniques traditionnelles, élargissant le champ d'application des méthodes.
Analyse sur l'espace d'état augmenté: Analyse menée sur Y=X×Φ, englobant le cadre classique non augmenté comme cas particulier.
Applicabilité générale: Les résultats s'appliquent à plusieurs cadres, notamment l'ergodicité géométrique et l'ergodicité uniforme.
L'avantage clé de l'algorithme AIR est que la plupart des termes difficiles dans le terme résiduel Rm s'annulent, de sorte que:
∣Rm∣≤n1/(1+β)⋅constante
Citation des expériences numériques de CLR18, montrant que l'algorithme AIR fonctionne de manière comparable aux méthodes purement adaptatives pour β∈[1,2].
Bornes de convergence en trajectoire: Contrairement aux bornes d'erreur en espérance existantes, fournissant une convergence presque sûre en trajectoire
Cadre de contraction Wasserstein: Extension du cadre traditionnel d'ergodicité uniforme/géométrique
Vitesse proche de l'optimum: Vitesse de convergence approchant la valeur théoriquement optimale de la loi du logarithme itéré