Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound
Liu, Tajbakhsh
Performance analysis of first-order algorithms with inexact oracles has gained recent attention due to various emerging applications in which obtaining exact gradients is impossible or computationally expensive. Previous research has demonstrated that the performance of accelerated first-order methods is more sensitive to gradient errors compared with non-accelerated ones. This paper investigates the nonasymptotic convergence bound of two accelerated methods with inexact gradients to solve deterministic smooth convex problems. Performance Estimation Problem (PEP) is used as the primary tool to analyze the convergence bounds of the underlying algorithms. By finding an analytical solution to PEP, we derive novel convergence bounds of Generalized Optimized Gradient Method (GOGM) and Generalized Fast Gradient Method (GFGM) with inexact gradient oracles following the absolute error bound. The derived bounds allow varying oracle inexactness along the iterations; furthermore, their accumulated error terms are independent of the initial condition and any unknown parameters. Furthermore, we analyze the tradeoff between the vanishing term and the accumulated error in the convergence bound that guides finding the optimal stepsize. Finally, we determine the optimal strategy to set the gradient inexactness along iterations (if possible in a given application), ensuring that the accumulated error remains subordinate to the vanishing term.
academic
Análisis No Asintótico de Métodos Acelerados con Oráculo Inexacto Bajo Cota de Error Absoluto
Este artículo investiga las cotas de convergencia no asintótica de métodos de primer orden acelerados bajo un oráculo de gradiente inexacto. Dado que en muchas aplicaciones emergentes es imposible o computacionalmente costoso obtener gradientes exactos, el análisis de rendimiento de algoritmos de primer orden bajo oráculos inexactos ha recibido amplia atención. Investigaciones previas han demostrado que los métodos de primer orden acelerados son más sensibles a los errores de gradiente en comparación con métodos no acelerados. Este artículo utiliza el Problema de Estimación de Rendimiento (PEP) como herramienta analítica principal, derivando nuevas cotas de convergencia para el Método de Gradiente Generalizado Optimizado (GOGM) y el Método de Gradiente Rápido Generalizado (GFGM) bajo cotas de error absoluto mediante la búsqueda de soluciones analíticas del PEP.
Este artículo considera el problema de optimización:
min_{x∈R^d} f(x)
donde f es una función convexa con gradiente Lipschitz continuo. En aplicaciones prácticas, solo se pueden obtener estimaciones de gradiente inexactas:
Necesidad Práctica: En optimización de dos niveles, optimización combinatoria, optimización de orden cero y otras aplicaciones, es difícil o costoso obtener gradientes exactos
Deficiencias Teóricas: Los análisis existentes dependen de supuestos fuertes (como dominios factibles acotados) o contienen términos no cuantificables
Limitaciones de Métodos: Los métodos acelerados son más sensibles a errores de gradiente, requiriendo análisis más refinados
Avance Teórico: Derivación de cotas de convergencia cuantificadas para iGOGM e iGFGM bajo condiciones de error absoluto (AE), eliminando la dependencia de parámetros desconocidos
Innovación Metodológica: Búsqueda de soluciones analíticas factibles mediante técnica PEP, proporcionando términos de error acumulado independientes de condiciones iniciales
Orientación Práctica: Análisis del compromiso entre tasa de convergencia y error acumulado, proporcionando estrategias de selección de tamaño de paso óptimo
Programación Óptima: Determinación de estrategias óptimas de configuración para la inexactitud del gradiente, minimizando el costo computacional total
Primera provisión de cotas de convergencia cuantificadas e independientes de parámetros desconocidos para métodos acelerados bajo condiciones de error absoluto
El término de error acumulado es independiente de la condición inicial, dependiendo solo de la constante de Lipschitz y del tamaño de paso
La programación óptima de errores puede reducir significativamente la complejidad computacional total
Este artículo proporciona una base teórica importante para optimización acelerada bajo oráculos inexactos, con significado orientador para campos de aplicación como optimización de dos niveles y optimización combinatoria. La aplicación de la técnica PEP también proporciona nueva metodología para análisis relacionados.
Las referencias clave incluyen la teoría fundamental de PEP de Drori & Teboulle 18, el método OGM de Kim & Fessler 32,33, y el análisis de oráculo inexacto de Devolder et al. 12.