Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound
Liu, Tajbakhsh
Performance analysis of first-order algorithms with inexact oracles has gained recent attention due to various emerging applications in which obtaining exact gradients is impossible or computationally expensive. Previous research has demonstrated that the performance of accelerated first-order methods is more sensitive to gradient errors compared with non-accelerated ones. This paper investigates the nonasymptotic convergence bound of two accelerated methods with inexact gradients to solve deterministic smooth convex problems. Performance Estimation Problem (PEP) is used as the primary tool to analyze the convergence bounds of the underlying algorithms. By finding an analytical solution to PEP, we derive novel convergence bounds of Generalized Optimized Gradient Method (GOGM) and Generalized Fast Gradient Method (GFGM) with inexact gradient oracles following the absolute error bound. The derived bounds allow varying oracle inexactness along the iterations; furthermore, their accumulated error terms are independent of the initial condition and any unknown parameters. Furthermore, we analyze the tradeoff between the vanishing term and the accumulated error in the convergence bound that guides finding the optimal stepsize. Finally, we determine the optimal strategy to set the gradient inexactness along iterations (if possible in a given application), ensuring that the accumulated error remains subordinate to the vanishing term.
academic
Analisi Non-Asintotica dei Metodi Accelerati con Oracle Inesatto sotto Vincolo di Errore Assoluto
Questo articolo studia i limiti di convergenza non-asintotici dei metodi del primo ordine accelerati sotto oracle di gradiente inesatto. Poiché l'acquisizione di gradienti esatti è impossibile o computazionalmente costosa in molte applicazioni emergenti, l'analisi delle prestazioni degli algoritmi del primo ordine con oracle inesatto ha ricevuto ampia attenzione. Ricerche precedenti hanno dimostrato che i metodi del primo ordine accelerati sono più sensibili agli errori di gradiente rispetto ai metodi non accelerati. Questo articolo utilizza il Problema di Stima delle Prestazioni (PEP) come principale strumento di analisi e, trovando soluzioni analitiche del PEP, deriva nuovi limiti di convergenza per il Metodo Generalizzato di Gradiente Ottimizzato (GOGM) e il Metodo Generalizzato di Gradiente Veloce (GFGM) sotto vincoli di errore assoluto.
Esigenze Pratiche: In ottimizzazione bilivello, ottimizzazione combinatoria, ottimizzazione del primo ordine, l'acquisizione di gradienti esatti è difficile o costosa
Carenze Teoriche: L'analisi esistente dipende da ipotesi forti (come domini fattibili limitati) o contiene termini non quantificabili
Limitazioni dei Metodi: I metodi accelerati sono più sensibili agli errori di gradiente, richiedendo analisi più raffinate
Avanzamento Teorico: Derivazione di limiti di convergenza quantificati per iGOGM e iGFGM sotto condizioni di errore assoluto (AE), eliminando la dipendenza da parametri sconosciuti
Innovazione Metodologica: Attraverso la tecnica PEP, trovamento di soluzioni analitiche fattibili, fornendo termini di errore cumulativo indipendenti dalle condizioni iniziali
Guida Pratica: Analisi del compromesso tra tasso di convergenza ed errore cumulativo, fornendo strategie di scelta del passo ottimale
Pianificazione Ottimale: Determinazione della strategia di configurazione ottimale dell'inesattezza del gradiente, minimizzando il costo computazionale totale
Primo lavoro a fornire limiti di convergenza quantificati e indipendenti da parametri sconosciuti per metodi accelerati sotto condizioni di errore assoluto
Il termine di errore cumulativo è indipendente dalle condizioni iniziali, dipendendo solo dalla costante di Lipschitz e dal passo
La pianificazione dell'errore ottimale può ridurre significativamente la complessità computazionale totale
Questo articolo fornisce una base teorica importante per l'ottimizzazione accelerata con oracle inesatto, con significative implicazioni per applicazioni in ottimizzazione bilivello, ottimizzazione combinatoria e altri campi correlati. L'applicazione della tecnica PEP fornisce anche una nuova metodologia per analisi correlate.
Le riferimenti chiave includono la teoria PEP fondamentale di Drori & Teboulle 18, il metodo OGM di Kim & Fessler 32,33, e l'analisi dell'oracle inesatto di Devolder et al. 12.