2025-11-22T03:37:15.627362

Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound

Liu, Tajbakhsh

Performance analysis of first-order algorithms with inexact oracles has gained recent attention due to various emerging applications in which obtaining exact gradients is impossible or computationally expensive. Previous research has demonstrated that the performance of accelerated first-order methods is more sensitive to gradient errors compared with non-accelerated ones. This paper investigates the nonasymptotic convergence bound of two accelerated methods with inexact gradients to solve deterministic smooth convex problems. Performance Estimation Problem (PEP) is used as the primary tool to analyze the convergence bounds of the underlying algorithms. By finding an analytical solution to PEP, we derive novel convergence bounds of Generalized Optimized Gradient Method (GOGM) and Generalized Fast Gradient Method (GFGM) with inexact gradient oracles following the absolute error bound. The derived bounds allow varying oracle inexactness along the iterations; furthermore, their accumulated error terms are independent of the initial condition and any unknown parameters. Furthermore, we analyze the tradeoff between the vanishing term and the accumulated error in the convergence bound that guides finding the optimal stepsize. Finally, we determine the optimal strategy to set the gradient inexactness along iterations (if possible in a given application), ensuring that the accumulated error remains subordinate to the vanishing term.

academic

Nichtasymptotische Analyse beschleunigter Verfahren mit ungenauen Orakeln unter absoluter Fehlerschranke

Grundlegende Informationen

Paper-ID: 2408.00720
Titel: Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound
Autoren: Yin Liu (Peking-Universität), Sam Davanloo Tajbakhsh (Ohio State University)
Klassifizierung: math.OC (Optimierung und Kontrolle)
Veröffentlichungsdatum: 15. Oktober 2025
Paper-Link: https://arxiv.org/abs/2408.00720

Zusammenfassung

Dieses Paper untersucht nichtasymptotische Konvergenzschranken für beschleunigte Gradientenmethoden erster Ordnung unter ungenauen Gradienten-Orakeln. Da die Beschaffung exakter Gradienten in vielen neuen Anwendungen unmöglich oder rechnerisch teuer ist, hat die Leistungsanalyse von Algorithmen erster Ordnung unter ungenauen Orakeln breite Aufmerksamkeit erhalten. Frühere Forschungen zeigen, dass beschleunigte Methoden erster Ordnung empfindlicher gegenüber Gradientenfehlern sind als nicht-beschleunigte Verfahren. Dieses Paper nutzt das Performance Estimation Problem (PEP) als Hauptanalysewerkzeug und leitet durch Auffinden analytischer Lösungen des PEP neue Konvergenzschranken für die Generalized Optimized Gradient Method (GOGM) und die Generalized Fast Gradient Method (GFGM) unter absoluter Fehlerschranke her.

Forschungshintergrund und Motivation

Problemdefinition

Dieses Paper betrachtet das Optimierungsproblem:

min_{x∈R^d} f(x)

wobei f eine konvexe Funktion mit Lipschitz-stetigen Gradienten ist. In praktischen Anwendungen können nur ungenaue Gradientenschätzungen erhalten werden:

∇̃f(x) = ∇f(x) + e, ||e|| ≤ b

Forschungsmotivation

Praktische Anforderungen: In zweistufiger Optimierung, kombinatorischer Optimierung und Optimierung nullter Ordnung ist die Beschaffung exakter Gradienten schwierig oder teuer
Theoretische Mängel: Bestehende Analysen hängen von starken Annahmebedingungen ab (wie beschränkte zulässige Mengen) oder enthalten nicht quantifizierbare Terme
Methodische Einschränkungen: Beschleunigte Verfahren sind empfindlicher gegenüber Gradientenfehlern und erfordern feinere Analysen

Anwendungsszenarien

Zweistufige Optimierung: Das untere Problem kann nur bis zur Suboptimalität gelöst werden
Kombinatorische Optimierung: Gradientenschätzung durch Stichprobennahme mit kleinen Chargen
Optimierung nullter Ordnung: Gradientenschätzung durch endliche Differenzen oder Gaußsche Glättung

Kernbeiträge

Theoretischer Durchbruch: Herleitung quantifizierter Konvergenzschranken für iGOGM und iGFGM unter absoluter Fehlerbedingung (AE), Beseitigung der Abhängigkeit von unbekannten Parametern
Methodische Innovation: Auffinden analytischer zulässiger Lösungen durch PEP-Technik, Bereitstellung von kumulativen Fehlerausdrücken unabhängig von Anfangsbedingungen
Praktische Anleitung: Analyse des Kompromisses zwischen Konvergenzrate und kumulativem Fehler, Bereitstellung optimaler Schrittweiten-Auswahlstrategien
Optimale Planung: Bestimmung optimaler Einstellungsstrategien für Gradienten-Ungenauigkeit zur Minimierung der Gesamtrechenkosten

Methodische Details

Aufgabendefinition

Untersuchung der Konvergenz beschleunigter Gradientenmethoden unter absoluter Fehlerbedingung:

Eingabe: Ungenaues Gradienten-Orakel erfüllt ||∇̃f(x) - ∇f(x)|| ≤ b_x
Ausgabe: Oberschranke für Konvergenzschranke f(x_K) - f*
Einschränkung: f ∈ F_{0,L} (nur konvex und L-glatt)

Kernalgorithmen

iGOGM-Algorithmus (Algorithmus 2)

Eingabe: z_0 = x_0, A_0 = α_0 = 1, Schrittweiten-Parameter {λ_k}
für k = 0 bis K-1:
    y_{k+1} = x_k - (1/L)∇̃f(x_k)
    z_{k+1} = z_k - (2/L)α_k∇̃f(x_k)  # Schlüssel: Koeffizient ist 2
    α_{k+1} = (λ_{k+1} + √(4λ_{k+1}A_k + λ²_{k+1}))/2
    A_{k+1} = A_k + α_{k+1}
    x_{k+1} = (1 - α_{k+1}/A_{k+1})y_{k+1} + (α_{k+1}/A_{k+1})z_{k+1}

iGFGM-Algorithmus (Algorithmus 1)

Ähnlich wie iGOGM, aber der Koeffizient in Schritt 3 ist 1 statt 2.

Technische Innovationspunkte

1. Analytische PEP-Lösung

Auffinden analytischer zulässiger Lösungen durch die duale Form des Performance Estimation Problems:

τ = L/(4A_K), v_{i,i+1} = A_i/A_K
u_i = [A_i(1+2α_{i+1})(A_i+2α_iα_{i+1})]/(4LA_K(A_{i+1}-α²_{i+1})) + Σ_{k=i+1}^{K-1} [A_k(1+2α_{k+1})α_iα_{k+1}]/(2LA_K(A_{k+1}-α²_{k+1}))

2. Matrixzerlegungstechnik

Nutzung von Schur-Komplement und diagonal dominanten Matrixeigenschaften zur Sicherung von Positive-Semidefinitheit:

Konstruktion der Gram-Matrix G = X^T X
Behandlung von PSD-Einschränkungen durch Blockmatrix-Zerlegung
Beweis, dass u_i die Zulässigkeitsbedingungen erfüllt

Haupttheoretische Ergebnisse

Satz 2.2 (iGOGM-Konvergenzschranke)

f(x_K) - f* - (1/2L)||∇f(x_K)||² ≤ L||x_0-x*||²/(4A_K) + Σ_{k=0}^{K-1} u_k||e_k||²

Satz 2.4 (iGFGM-Konvergenzschranke)

f(x_K) - f* - (1/2L)||∇f(x_K)||² ≤ L||x_0-x*||²/(2A_K) + Σ_{k=0}^{K-1} u_k||e_k||²

Schlüsseleigenschaften:

Kumulativer Fehlerterm unabhängig von Anfangsbedingung ||x_0 - x*||
Erlaubt unterschiedliche Fehlerniveaus b_k entlang der Iteration
Koeffizienten u_k können explizit berechnet werden

Experimentelle Einrichtung und Ergebnisse

Numerische Verifikation

Lösungsverifikation: Verifikation der analytischen Lösung durch numerische Lösung, relativer Fehler < 10^{-3}
Kompromissanalyse: Analyse des Kompromisses zwischen Konvergenzrate und kumulativem Fehler für OGM-a (α_i = (i+a)/a)
Optimale Planung: Vergleich zwischen festem Fehler und optimal variierendem Fehler bezüglich Gesamtkomplexität

Wichtigste Erkenntnisse

Bei a=4 liegt der kumulative Fehler in der Größenordnung O(b²K³/L)
Vergrößerung von a kann kumulativen Fehler reduzieren, senkt aber die Konvergenzrate
Optimale Fehlerplanung kann die Gesamt-η-Komplexität erheblich senken

Vergleich mit verwandten Arbeiten

Fehlerbedingung	Erlaubt variable Fehler?	Iterationskomplexität	Einschränkungen
BIE 8	×	O(1/A_K + δ)	Beschränkte zulässige Menge
IFO 12	✓	O(1/A_K + Σδ_i/A_K)	Beschränkte zulässige Menge
IFO-q 41	×	O(1/K² + δ/K^{3q/2-1})	Subgradientenbedingung
AE 58	×	O(1/K² + R̃_Kδ + Kδ²)	Unbekanntes R̃_K
Dieses Paper	✓	O(1/A_K + Σu_kb_k²)	Keine zusätzlichen Annahmen

Optimale Fehlerplanung

Optimierungsproblem

min Σ_{k=0}^{K-1} η_k = Σ_{k=0}^{K-1} h^{-1}(b_k)
s.t. Σ_{k=0}^{K-1} u_kb_k² ≤ LR²/(4A_K)

Potenzgesetz-Abfall

Für h(η) = c₁η^{-c₂} ist die optimale Lösung:

b_k* = √(LR²/(4A_K)) · u_k^{1/(1+2c₂)} / (Σu_j^{1/(1+2c₂)})^{1/2}

Exponentieller Abfall

Für h(η) = q₁q₂^{-η} ist die optimale Lösung:

b_k* = √(LR²/(4KA_Ku_k))

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Erstmalige Bereitstellung quantifizierter, von unbekannten Parametern unabhängiger Konvergenzschranken für beschleunigte Verfahren unter absoluter Fehlerbedingung
Der kumulative Fehlerterm ist unabhängig von der Anfangsbedingung und hängt nur von der Lipschitz-Konstante und der Schrittweite ab
Optimale Fehlerplanung kann die Gesamtrechenkosten erheblich senken

Einschränkungen

Theoretische Ergebnisse erfordern α_k² < A_k (strikte Ungleichung), was den Fall α_k² = A_k der Standard-FGM ausschließt
Die Schrittweite des optimalen Algorithmus fehlt eine rekursive Struktur, was die praktische Implementierung erschwert
Die Analyse konzentriert sich hauptsächlich auf deterministische Einstellungen; der stochastische Fall erfordert weitere Forschung

Zukünftige Richtungen

Erweiterung auf stark konvexe Fälle und stochastische Einstellungen
Untersuchung allgemeinerer Fehlerbedingungen
Entwicklung praktischer adaptiver Fehlersteuerungsstrategien

Tiefgreifende Bewertung

Stärken

Bedeutender theoretischer Beitrag: Schließt die Lücke in der Analyse beschleunigter Verfahren unter absoluter Fehlerbedingung
Fortgeschrittene technische Methoden: Innovative Anwendung der PEP-Technik
Starke praktische Anwendbarkeit: Bereitstellung berechenbarer Fehlerschranken und optimaler Planungsstrategien
Umfassende und tiefe Analyse: Sowohl theoretische Beweise als auch numerische Verifikation

Mängel

Begrenzte praktische Anwendbarkeit: Die nicht-rekursive Natur des optimalen Algorithmus schränkt die praktische Anwendung ein
Bedingungseinschränkungen: Die strikte Bedingung α_k² < A_k schließt einige wichtige Fälle aus
Unzureichende Experimente: Mangel an numerischen Experimenten bei praktischen Optimierungsproblemen

Einfluss

Dieses Paper bietet eine wichtige theoretische Grundlage für beschleunigte Optimierung unter ungenauen Orakeln und hat Orientierungsbedeutung für Anwendungsgebiete wie zweistufige Optimierung und kombinatorische Optimierung. Die Anwendung der PEP-Technik bietet auch neue methodologische Ansätze für verwandte Analysen.

Anwendungsszenarien

Großskalige Optimierungsprobleme mit teuren Gradientenberechnungen
Zweistufige Optimierungs- und kombinatorische Optimierungsprobleme
Anwendungen, die einen Kompromiss zwischen Rechengenauigkeit und Iterationszahl erfordern
Theoretische Analyse von Optimierungsmethoden nullter Ordnung

Referenzen

Wichtige Referenzen umfassen die PEP-Theoriegrundlagen von Drori & Teboulle 18, die OGM-Methode von Kim & Fessler 32,33 sowie die Analyse ungenauer Orakel von Devolder et al. 12.