2025-11-22T03:37:15.627362

Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound

Liu, Tajbakhsh
Performance analysis of first-order algorithms with inexact oracles has gained recent attention due to various emerging applications in which obtaining exact gradients is impossible or computationally expensive. Previous research has demonstrated that the performance of accelerated first-order methods is more sensitive to gradient errors compared with non-accelerated ones. This paper investigates the nonasymptotic convergence bound of two accelerated methods with inexact gradients to solve deterministic smooth convex problems. Performance Estimation Problem (PEP) is used as the primary tool to analyze the convergence bounds of the underlying algorithms. By finding an analytical solution to PEP, we derive novel convergence bounds of Generalized Optimized Gradient Method (GOGM) and Generalized Fast Gradient Method (GFGM) with inexact gradient oracles following the absolute error bound. The derived bounds allow varying oracle inexactness along the iterations; furthermore, their accumulated error terms are independent of the initial condition and any unknown parameters. Furthermore, we analyze the tradeoff between the vanishing term and the accumulated error in the convergence bound that guides finding the optimal stepsize. Finally, we determine the optimal strategy to set the gradient inexactness along iterations (if possible in a given application), ensuring that the accumulated error remains subordinate to the vanishing term.
academic

Nichtasymptotische Analyse beschleunigter Verfahren mit ungenauen Orakeln unter absoluter Fehlerschranke

Grundlegende Informationen

  • Paper-ID: 2408.00720
  • Titel: Nonasymptotic Analysis of Accelerated Methods With Inexact Oracle Under Absolute Error Bound
  • Autoren: Yin Liu (Peking-Universität), Sam Davanloo Tajbakhsh (Ohio State University)
  • Klassifizierung: math.OC (Optimierung und Kontrolle)
  • Veröffentlichungsdatum: 15. Oktober 2025
  • Paper-Link: https://arxiv.org/abs/2408.00720

Zusammenfassung

Dieses Paper untersucht nichtasymptotische Konvergenzschranken für beschleunigte Gradientenmethoden erster Ordnung unter ungenauen Gradienten-Orakeln. Da die Beschaffung exakter Gradienten in vielen neuen Anwendungen unmöglich oder rechnerisch teuer ist, hat die Leistungsanalyse von Algorithmen erster Ordnung unter ungenauen Orakeln breite Aufmerksamkeit erhalten. Frühere Forschungen zeigen, dass beschleunigte Methoden erster Ordnung empfindlicher gegenüber Gradientenfehlern sind als nicht-beschleunigte Verfahren. Dieses Paper nutzt das Performance Estimation Problem (PEP) als Hauptanalysewerkzeug und leitet durch Auffinden analytischer Lösungen des PEP neue Konvergenzschranken für die Generalized Optimized Gradient Method (GOGM) und die Generalized Fast Gradient Method (GFGM) unter absoluter Fehlerschranke her.

Forschungshintergrund und Motivation

Problemdefinition

Dieses Paper betrachtet das Optimierungsproblem:

min_{x∈R^d} f(x)

wobei f eine konvexe Funktion mit Lipschitz-stetigen Gradienten ist. In praktischen Anwendungen können nur ungenaue Gradientenschätzungen erhalten werden:

∇̃f(x) = ∇f(x) + e, ||e|| ≤ b

Forschungsmotivation

  1. Praktische Anforderungen: In zweistufiger Optimierung, kombinatorischer Optimierung und Optimierung nullter Ordnung ist die Beschaffung exakter Gradienten schwierig oder teuer
  2. Theoretische Mängel: Bestehende Analysen hängen von starken Annahmebedingungen ab (wie beschränkte zulässige Mengen) oder enthalten nicht quantifizierbare Terme
  3. Methodische Einschränkungen: Beschleunigte Verfahren sind empfindlicher gegenüber Gradientenfehlern und erfordern feinere Analysen

Anwendungsszenarien

  • Zweistufige Optimierung: Das untere Problem kann nur bis zur Suboptimalität gelöst werden
  • Kombinatorische Optimierung: Gradientenschätzung durch Stichprobennahme mit kleinen Chargen
  • Optimierung nullter Ordnung: Gradientenschätzung durch endliche Differenzen oder Gaußsche Glättung

Kernbeiträge

  1. Theoretischer Durchbruch: Herleitung quantifizierter Konvergenzschranken für iGOGM und iGFGM unter absoluter Fehlerbedingung (AE), Beseitigung der Abhängigkeit von unbekannten Parametern
  2. Methodische Innovation: Auffinden analytischer zulässiger Lösungen durch PEP-Technik, Bereitstellung von kumulativen Fehlerausdrücken unabhängig von Anfangsbedingungen
  3. Praktische Anleitung: Analyse des Kompromisses zwischen Konvergenzrate und kumulativem Fehler, Bereitstellung optimaler Schrittweiten-Auswahlstrategien
  4. Optimale Planung: Bestimmung optimaler Einstellungsstrategien für Gradienten-Ungenauigkeit zur Minimierung der Gesamtrechenkosten

Methodische Details

Aufgabendefinition

Untersuchung der Konvergenz beschleunigter Gradientenmethoden unter absoluter Fehlerbedingung:

  • Eingabe: Ungenaues Gradienten-Orakel erfüllt ||∇̃f(x) - ∇f(x)|| ≤ b_x
  • Ausgabe: Oberschranke für Konvergenzschranke f(x_K) - f*
  • Einschränkung: f ∈ F_{0,L} (nur konvex und L-glatt)

Kernalgorithmen

iGOGM-Algorithmus (Algorithmus 2)

Eingabe: z_0 = x_0, A_0 = α_0 = 1, Schrittweiten-Parameter {λ_k}
für k = 0 bis K-1:
    y_{k+1} = x_k - (1/L)∇̃f(x_k)
    z_{k+1} = z_k - (2/L)α_k∇̃f(x_k)  # Schlüssel: Koeffizient ist 2
    α_{k+1} = (λ_{k+1} + √(4λ_{k+1}A_k + λ²_{k+1}))/2
    A_{k+1} = A_k + α_{k+1}
    x_{k+1} = (1 - α_{k+1}/A_{k+1})y_{k+1} + (α_{k+1}/A_{k+1})z_{k+1}

iGFGM-Algorithmus (Algorithmus 1)

Ähnlich wie iGOGM, aber der Koeffizient in Schritt 3 ist 1 statt 2.

Technische Innovationspunkte

1. Analytische PEP-Lösung

Auffinden analytischer zulässiger Lösungen durch die duale Form des Performance Estimation Problems:

τ = L/(4A_K), v_{i,i+1} = A_i/A_K
u_i = [A_i(1+2α_{i+1})(A_i+2α_iα_{i+1})]/(4LA_K(A_{i+1}-α²_{i+1})) + Σ_{k=i+1}^{K-1} [A_k(1+2α_{k+1})α_iα_{k+1}]/(2LA_K(A_{k+1}-α²_{k+1}))

2. Matrixzerlegungstechnik

Nutzung von Schur-Komplement und diagonal dominanten Matrixeigenschaften zur Sicherung von Positive-Semidefinitheit:

  • Konstruktion der Gram-Matrix G = X^T X
  • Behandlung von PSD-Einschränkungen durch Blockmatrix-Zerlegung
  • Beweis, dass u_i die Zulässigkeitsbedingungen erfüllt

Haupttheoretische Ergebnisse

Satz 2.2 (iGOGM-Konvergenzschranke)

f(x_K) - f* - (1/2L)||∇f(x_K)||² ≤ L||x_0-x*||²/(4A_K) + Σ_{k=0}^{K-1} u_k||e_k||²

Satz 2.4 (iGFGM-Konvergenzschranke)

f(x_K) - f* - (1/2L)||∇f(x_K)||² ≤ L||x_0-x*||²/(2A_K) + Σ_{k=0}^{K-1} u_k||e_k||²

Schlüsseleigenschaften:

  • Kumulativer Fehlerterm unabhängig von Anfangsbedingung ||x_0 - x*||
  • Erlaubt unterschiedliche Fehlerniveaus b_k entlang der Iteration
  • Koeffizienten u_k können explizit berechnet werden

Experimentelle Einrichtung und Ergebnisse

Numerische Verifikation

  1. Lösungsverifikation: Verifikation der analytischen Lösung durch numerische Lösung, relativer Fehler < 10^{-3}
  2. Kompromissanalyse: Analyse des Kompromisses zwischen Konvergenzrate und kumulativem Fehler für OGM-a (α_i = (i+a)/a)
  3. Optimale Planung: Vergleich zwischen festem Fehler und optimal variierendem Fehler bezüglich Gesamtkomplexität

Wichtigste Erkenntnisse

  • Bei a=4 liegt der kumulative Fehler in der Größenordnung O(b²K³/L)
  • Vergrößerung von a kann kumulativen Fehler reduzieren, senkt aber die Konvergenzrate
  • Optimale Fehlerplanung kann die Gesamt-η-Komplexität erheblich senken

Vergleich mit verwandten Arbeiten

FehlerbedingungErlaubt variable Fehler?IterationskomplexitätEinschränkungen
BIE 8×O(1/A_K + δ)Beschränkte zulässige Menge
IFO 12O(1/A_K + Σδ_i/A_K)Beschränkte zulässige Menge
IFO-q 41×O(1/K² + δ/K^{3q/2-1})Subgradientenbedingung
AE 58×O(1/K² + R̃_Kδ + Kδ²)Unbekanntes R̃_K
Dieses PaperO(1/A_K + Σu_kb_k²)Keine zusätzlichen Annahmen

Optimale Fehlerplanung

Optimierungsproblem

min Σ_{k=0}^{K-1} η_k = Σ_{k=0}^{K-1} h^{-1}(b_k)
s.t. Σ_{k=0}^{K-1} u_kb_k² ≤ LR²/(4A_K)

Potenzgesetz-Abfall

Für h(η) = c₁η^{-c₂} ist die optimale Lösung:

b_k* = √(LR²/(4A_K)) · u_k^{1/(1+2c₂)} / (Σu_j^{1/(1+2c₂)})^{1/2}

Exponentieller Abfall

Für h(η) = q₁q₂^{-η} ist die optimale Lösung:

b_k* = √(LR²/(4KA_Ku_k))

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Erstmalige Bereitstellung quantifizierter, von unbekannten Parametern unabhängiger Konvergenzschranken für beschleunigte Verfahren unter absoluter Fehlerbedingung
  2. Der kumulative Fehlerterm ist unabhängig von der Anfangsbedingung und hängt nur von der Lipschitz-Konstante und der Schrittweite ab
  3. Optimale Fehlerplanung kann die Gesamtrechenkosten erheblich senken

Einschränkungen

  1. Theoretische Ergebnisse erfordern α_k² < A_k (strikte Ungleichung), was den Fall α_k² = A_k der Standard-FGM ausschließt
  2. Die Schrittweite des optimalen Algorithmus fehlt eine rekursive Struktur, was die praktische Implementierung erschwert
  3. Die Analyse konzentriert sich hauptsächlich auf deterministische Einstellungen; der stochastische Fall erfordert weitere Forschung

Zukünftige Richtungen

  1. Erweiterung auf stark konvexe Fälle und stochastische Einstellungen
  2. Untersuchung allgemeinerer Fehlerbedingungen
  3. Entwicklung praktischer adaptiver Fehlersteuerungsstrategien

Tiefgreifende Bewertung

Stärken

  1. Bedeutender theoretischer Beitrag: Schließt die Lücke in der Analyse beschleunigter Verfahren unter absoluter Fehlerbedingung
  2. Fortgeschrittene technische Methoden: Innovative Anwendung der PEP-Technik
  3. Starke praktische Anwendbarkeit: Bereitstellung berechenbarer Fehlerschranken und optimaler Planungsstrategien
  4. Umfassende und tiefe Analyse: Sowohl theoretische Beweise als auch numerische Verifikation

Mängel

  1. Begrenzte praktische Anwendbarkeit: Die nicht-rekursive Natur des optimalen Algorithmus schränkt die praktische Anwendung ein
  2. Bedingungseinschränkungen: Die strikte Bedingung α_k² < A_k schließt einige wichtige Fälle aus
  3. Unzureichende Experimente: Mangel an numerischen Experimenten bei praktischen Optimierungsproblemen

Einfluss

Dieses Paper bietet eine wichtige theoretische Grundlage für beschleunigte Optimierung unter ungenauen Orakeln und hat Orientierungsbedeutung für Anwendungsgebiete wie zweistufige Optimierung und kombinatorische Optimierung. Die Anwendung der PEP-Technik bietet auch neue methodologische Ansätze für verwandte Analysen.

Anwendungsszenarien

  • Großskalige Optimierungsprobleme mit teuren Gradientenberechnungen
  • Zweistufige Optimierungs- und kombinatorische Optimierungsprobleme
  • Anwendungen, die einen Kompromiss zwischen Rechengenauigkeit und Iterationszahl erfordern
  • Theoretische Analyse von Optimierungsmethoden nullter Ordnung

Referenzen

Wichtige Referenzen umfassen die PEP-Theoriegrundlagen von Drori & Teboulle 18, die OGM-Methode von Kim & Fessler 32,33 sowie die Analyse ungenauer Orakel von Devolder et al. 12.