Improved Central Limit Theorem and Bootstrap Approximations for Linear Stochastic Approximation
Butyrin, Moulines, Naumov et al.
In this paper, we refine the Berry-Esseen bounds for the multivariate normal approximation of Polyak-Ruppert averaged iterates arising from the linear stochastic approximation (LSA) algorithm with decreasing step size. We consider the normal approximation by the Gaussian distribution with covariance matrix predicted by the Polyak-Juditsky central limit theorem and establish the rate up to order $n^{-1/3}$ in convex distance, where $n$ is the number of samples used in the algorithm. We also prove a non-asymptotic validity of the multiplier bootstrap procedure for approximating the distribution of the rescaled error of the averaged LSA estimator. We establish approximation rates of order up to $1/\sqrt{n}$ for the latter distribution, which significantly improves upon the previous results obtained by Samsonov et al. (2024).
academic
Théorème Central Limite Amélioré et Approximations Bootstrap pour l'Approximation Stochastique Linéaire
Cet article améliore les bornes de Berry-Esseen pour l'approximation normale multivariée des itérées moyennées de Polyak-Ruppert dans les algorithmes d'approximation stochastique linéaire (ASL). L'étude considère l'approximation normale gaussienne de la matrice de covariance prédite par le théorème central limite de Polyak-Juditsky et établit un taux de convergence d'ordre n−1/3 au sens de la distance convexe, où n est le nombre d'échantillons utilisés par l'algorithme. Simultanément, l'article démontre la validité non-asymptotique de la procédure bootstrap multiplicatif pour l'approximation de la distribution des erreurs recentrées de l'estimateur ASL moyenné, établissant un taux d'approximation d'ordre 1/n, améliorant considérablement les résultats antérieurs de Samsonov et al. (2024).
L'algorithme d'approximation stochastique linéaire (ASL) est une méthode fondamentale en statistique et apprentissage automatique, utilisée pour approximer la solution unique de l'équation linéaire Aˉθ∗=bˉ, où Aˉ∈Rd×d est une matrice non-dégénérée. L'algorithme procède par mise à jour itérative basée sur la séquence d'observations {(A(Zk),b(Zk))}k∈N.
Précision de l'approximation distributionnelle: Les résultats d'approximation normale existants présentent des taux de convergence lents, limitant la précision de la construction d'intervalles de confiance dans les applications pratiques
Estimation de la matrice de covariance: La matrice de covariance asymptotique Σ∞ est inconnue en pratique, nécessitant des méthodes d'estimation et d'approximation efficaces
Validité du bootstrap: Les méthodes bootstrap traditionnelles font face à des défis théoriques et pratiques dans les algorithmes d'apprentissage en ligne
Bornes de Moments Améliorées: Établissement de bornes de moments d'ordre supérieur pour n(θˉn−θ∗), obtenant pour p≥2:
E1/p[∥θˉn−θ∗∥p]≲npTrΣ∞+n5/6p3/2
Amélioration des Bornes de Berry-Esseen: Établissement d'un taux d'approximation normale d'ordre n−1/3 au sens de la distance convexe, améliorant le résultat antérieur d'ordre n−1/4
Analyse Non-Asymptotique du Bootstrap Multiplicatif: Démonstration de la validité de la procédure bootstrap avec un taux d'approximation atteignant n−1/2, considérablement supérieur aux résultats existants
Innovation Technique: Contournement de l'étape de comparaison gaussienne directe par le choix d'une matrice de covariance appropriée Σn plutôt que Σ∞
Décomposition supplémentaire du terme fluctuant:
θ~k(fl)=Jk(0)+Hk(0)
où Jk(0) est le terme linéaire dominant et Hk(0) est le reste d'ordre supérieur.
Application du cadre Shao-Zhang, exprimant la statistique comme:
nΣn−1/2(θˉn−θ∗)=W+D
où W est une statistique linéaire et D est un reste non-linéaire.
Polyak, B. T., & Juditsky, A. B. (1992). Acceleration of stochastic approximation by averaging. SIAM journal on control and optimization.
Shao, Q. M., & Zhang, Z. S. (2022). Berry–Esseen bounds for multivariate nonlinear statistics with applications to M-estimators and stochastic gradient descent algorithms. Bernoulli.
Fang, Y., Xu, J., & Yang, L. (2018). Online bootstrap confidence intervals for the stochastic gradient descent estimator. Journal of Machine Learning Research.
Durmus, A., Moulines, E., Naumov, A., & Samsonov, S. (2025). Finite-time high-probability bounds for Polyak–Ruppert averaged iterates of linear stochastic approximation. Mathematics of Operations Research.