Improved Central Limit Theorem and Bootstrap Approximations for Linear Stochastic Approximation
Butyrin, Moulines, Naumov et al.
In this paper, we refine the Berry-Esseen bounds for the multivariate normal approximation of Polyak-Ruppert averaged iterates arising from the linear stochastic approximation (LSA) algorithm with decreasing step size. We consider the normal approximation by the Gaussian distribution with covariance matrix predicted by the Polyak-Juditsky central limit theorem and establish the rate up to order $n^{-1/3}$ in convex distance, where $n$ is the number of samples used in the algorithm. We also prove a non-asymptotic validity of the multiplier bootstrap procedure for approximating the distribution of the rescaled error of the averaged LSA estimator. We establish approximation rates of order up to $1/\sqrt{n}$ for the latter distribution, which significantly improves upon the previous results obtained by Samsonov et al. (2024).
본 논문은 선형 확률적 근사(LSA) 알고리즘에서 Polyak-Ruppert 평균 반복의 다변량 정규 근사에 대한 Berry-Esseen 부등식을 개선한다. 본 연구는 Polyak-Juditsky 중심극한정리에 의해 예측된 공분산 행렬의 가우스 분포 정규 근사를 고려하며, 볼록 거리 의미에서 n−1/3 차수의 수렴률을 확립한다. 여기서 n은 알고리즘이 사용하는 표본 수이다. 동시에 승수 부트스트랩 절차가 평균 LSA 추정량의 재표준화 오차 분포 근사에 대한 비점근적 유효성을 증명하며, 1/n 차수의 근사율을 확립하여 Samsonov 등(2024)의 이전 결과를 크게 개선한다.
선형 확률적 근사(LSA) 알고리즘은 통계학 및 기계학습의 기초 방법으로, 선형 방정식계 Aˉθ∗=bˉ의 유일한 해를 근사하는 데 사용된다. 여기서 Aˉ∈Rd×d는 비퇴화 행렬이다. 이 알고리즘은 관측 수열 {(A(Zk),b(Zk))}k∈N을 기반으로 반복적으로 업데이트된다.
Polyak, B. T., & Juditsky, A. B. (1992). Acceleration of stochastic approximation by averaging. SIAM journal on control and optimization.
Shao, Q. M., & Zhang, Z. S. (2022). Berry–Esseen bounds for multivariate nonlinear statistics with applications to M-estimators and stochastic gradient descent algorithms. Bernoulli.
Fang, Y., Xu, J., & Yang, L. (2018). Online bootstrap confidence intervals for the stochastic gradient descent estimator. Journal of Machine Learning Research.
Durmus, A., Moulines, E., Naumov, A., & Samsonov, S. (2025). Finite-time high-probability bounds for Polyak–Ruppert averaged iterates of linear stochastic approximation. Mathematics of Operations Research.