Improved Central Limit Theorem and Bootstrap Approximations for Linear Stochastic Approximation
Butyrin, Moulines, Naumov et al.
In this paper, we refine the Berry-Esseen bounds for the multivariate normal approximation of Polyak-Ruppert averaged iterates arising from the linear stochastic approximation (LSA) algorithm with decreasing step size. We consider the normal approximation by the Gaussian distribution with covariance matrix predicted by the Polyak-Juditsky central limit theorem and establish the rate up to order $n^{-1/3}$ in convex distance, where $n$ is the number of samples used in the algorithm. We also prove a non-asymptotic validity of the multiplier bootstrap procedure for approximating the distribution of the rescaled error of the averaged LSA estimator. We establish approximation rates of order up to $1/\sqrt{n}$ for the latter distribution, which significantly improves upon the previous results obtained by Samsonov et al. (2024).
academic
Teorema del Límite Central Mejorado y Aproximaciones Bootstrap para Aproximación Estocástica Lineal
Este artículo mejora los límites de Berry-Esseen para la aproximación normal multivariada de iteraciones promediadas de Polyak-Ruppert en algoritmos de aproximación estocástica lineal (LSA). El estudio considera la aproximación normal gaussiana de la matriz de covarianza predicha por el teorema del límite central de Polyak-Juditsky, estableciendo una tasa de convergencia de orden n−1/3 en el sentido de distancia convexa, donde n es el número de muestras utilizadas por el algoritmo. Simultáneamente, se demuestra la validez no asintótica del procedimiento bootstrap multiplicativo para la aproximación de la distribución de errores reescalados del estimador LSA promediado, estableciendo una tasa de aproximación de orden 1/n, mejorando significativamente los resultados previos de Samsonov et al. (2024).
El algoritmo de aproximación estocástica lineal (LSA) es un método fundamental en estadística y aprendizaje automático, utilizado para aproximar la solución única de la ecuación lineal Aˉθ∗=bˉ, donde Aˉ∈Rd×d es una matriz no degenerada. El algoritmo realiza actualizaciones iterativas basadas en la secuencia de observaciones {(A(Zk),b(Zk))}k∈N.
Precisión de la Aproximación de Distribuciones: Los resultados existentes de aproximación normal tienen tasas de convergencia lentas, limitando la precisión en la construcción de intervalos de confianza en aplicaciones prácticas
Estimación de Matrices de Covarianza: La matriz de covarianza asintótica Σ∞ es desconocida en la práctica, requiriendo métodos efectivos de estimación y aproximación
Validez del Bootstrap: Los métodos bootstrap tradicionales enfrentan desafíos teóricos y prácticos en algoritmos de aprendizaje en línea
Límites de Momentos Mejorados: Se establecen límites de momentos de orden superior para n(θˉn−θ∗), obteniendo para p≥2:
E1/p[∥θˉn−θ∗∥p]≲npTrΣ∞+n5/6p3/2
Mejora de los Límites de Berry-Esseen: Se establece una tasa de aproximación normal de orden n−1/3 en el sentido de distancia convexa, mejorando el resultado previo de n−1/4
Análisis No Asintótico del Bootstrap Multiplicativo: Se demuestra la validez del procedimiento bootstrap, alcanzando una tasa de aproximación de n−1/2, significativamente superior a los resultados existentes
Innovación Técnica: Mediante la selección de una matriz de covarianza apropiada Σn en lugar de Σ∞ para la aproximación, se evita el paso directo de comparación gaussiana
Se descompone aún más el término fluctuante:
θ~k(fl)=Jk(0)+Hk(0)
donde Jk(0) es el término principal lineal y Hk(0) es el término residual de orden superior.
Se aplica el marco de Shao-Zhang, expresando el estadístico como:
nΣn−1/2(θˉn−θ∗)=W+D
donde W es un estadístico lineal y D es un término residual no lineal.
Polyak, B. T., & Juditsky, A. B. (1992). Acceleration of stochastic approximation by averaging. SIAM journal on control and optimization.
Shao, Q. M., & Zhang, Z. S. (2022). Berry–Esseen bounds for multivariate nonlinear statistics with applications to M-estimators and stochastic gradient descent algorithms. Bernoulli.
Fang, Y., Xu, J., & Yang, L. (2018). Online bootstrap confidence intervals for the stochastic gradient descent estimator. Journal of Machine Learning Research.
Durmus, A., Moulines, E., Naumov, A., & Samsonov, S. (2025). Finite-time high-probability bounds for Polyak–Ruppert averaged iterates of linear stochastic approximation. Mathematics of Operations Research.