Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound
Liu, Tajbakhsh
Performance analysis of first-order algorithms with inexact oracles has gained recent attention due to various emerging applications in which obtaining exact gradients is impossible or computationally expensive. Previous research has demonstrated that the performance of accelerated first-order methods is more sensitive to gradient errors compared with non-accelerated ones. This paper investigates the nonasymptotic convergence bound of two accelerated methods with inexact gradients to solve deterministic smooth convex problems. Performance Estimation Problem (PEP) is used as the primary tool to analyze the convergence bounds of the underlying algorithms. By finding an analytical solution to PEP, we derive novel convergence bounds of Generalized Optimized Gradient Method (GOGM) and Generalized Fast Gradient Method (GFGM) with inexact gradient oracles following the absolute error bound. The derived bounds allow varying oracle inexactness along the iterations; furthermore, their accumulated error terms are independent of the initial condition and any unknown parameters. Furthermore, we analyze the tradeoff between the vanishing term and the accumulated error in the convergence bound that guides finding the optimal stepsize. Finally, we determine the optimal strategy to set the gradient inexactness along iterations (if possible in a given application), ensuring that the accumulated error remains subordinate to the vanishing term.
academic
Nichtasymptotische Analyse beschleunigter Verfahren mit ungenauen Orakeln unter absoluter Fehlerschranke
Dieses Paper untersucht nichtasymptotische Konvergenzschranken für beschleunigte Gradientenmethoden erster Ordnung unter ungenauen Gradienten-Orakeln. Da die Beschaffung exakter Gradienten in vielen neuen Anwendungen unmöglich oder rechnerisch teuer ist, hat die Leistungsanalyse von Algorithmen erster Ordnung unter ungenauen Orakeln breite Aufmerksamkeit erhalten. Frühere Forschungen zeigen, dass beschleunigte Methoden erster Ordnung empfindlicher gegenüber Gradientenfehlern sind als nicht-beschleunigte Verfahren. Dieses Paper nutzt das Performance Estimation Problem (PEP) als Hauptanalysewerkzeug und leitet durch Auffinden analytischer Lösungen des PEP neue Konvergenzschranken für die Generalized Optimized Gradient Method (GOGM) und die Generalized Fast Gradient Method (GFGM) unter absoluter Fehlerschranke her.
wobei f eine konvexe Funktion mit Lipschitz-stetigen Gradienten ist. In praktischen Anwendungen können nur ungenaue Gradientenschätzungen erhalten werden:
Praktische Anforderungen: In zweistufiger Optimierung, kombinatorischer Optimierung und Optimierung nullter Ordnung ist die Beschaffung exakter Gradienten schwierig oder teuer
Theoretische Mängel: Bestehende Analysen hängen von starken Annahmebedingungen ab (wie beschränkte zulässige Mengen) oder enthalten nicht quantifizierbare Terme
Methodische Einschränkungen: Beschleunigte Verfahren sind empfindlicher gegenüber Gradientenfehlern und erfordern feinere Analysen
Theoretischer Durchbruch: Herleitung quantifizierter Konvergenzschranken für iGOGM und iGFGM unter absoluter Fehlerbedingung (AE), Beseitigung der Abhängigkeit von unbekannten Parametern
Methodische Innovation: Auffinden analytischer zulässiger Lösungen durch PEP-Technik, Bereitstellung von kumulativen Fehlerausdrücken unabhängig von Anfangsbedingungen
Praktische Anleitung: Analyse des Kompromisses zwischen Konvergenzrate und kumulativem Fehler, Bereitstellung optimaler Schrittweiten-Auswahlstrategien
Optimale Planung: Bestimmung optimaler Einstellungsstrategien für Gradienten-Ungenauigkeit zur Minimierung der Gesamtrechenkosten
Erstmalige Bereitstellung quantifizierter, von unbekannten Parametern unabhängiger Konvergenzschranken für beschleunigte Verfahren unter absoluter Fehlerbedingung
Der kumulative Fehlerterm ist unabhängig von der Anfangsbedingung und hängt nur von der Lipschitz-Konstante und der Schrittweite ab
Optimale Fehlerplanung kann die Gesamtrechenkosten erheblich senken
Dieses Paper bietet eine wichtige theoretische Grundlage für beschleunigte Optimierung unter ungenauen Orakeln und hat Orientierungsbedeutung für Anwendungsgebiete wie zweistufige Optimierung und kombinatorische Optimierung. Die Anwendung der PEP-Technik bietet auch neue methodologische Ansätze für verwandte Analysen.
Wichtige Referenzen umfassen die PEP-Theoriegrundlagen von Drori & Teboulle 18, die OGM-Methode von Kim & Fessler 32,33 sowie die Analyse ungenauer Orakel von Devolder et al. 12.