In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- Papier-ID: 2510.11990
- Titel: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
- Autoren: Cody Melcher (University of Arizona), Afrooz Jalilzadeh (University of Arizona), Erfan Yazdandoost Hamedani (University of Arizona)
- Klassifizierung: math.OC (Optimierung und Steuerung)
- Veröffentlichungsdatum: 13. Oktober 2025 (arXiv-Preprint)
- Papierlink: https://arxiv.org/abs/2510.11990
Dieses Papier untersucht Sattelpunktprobleme (SP) mit Fokus auf konvex-konkave Optimierungsprobleme, die die zweiseitigen Bedingungen des quadratischen Funktionswachstums (QFG) oder des quadratischen Gradientenwachstums (QGG) erfüllen. Diese Bedingungen sind speziell für Sattelpunktprobleme entwickelte neue Bedingungen und stellen eine Erweiterung der Wachstumsbedingungen aus Minimierungsproblemen dar. Diese Bedingungen lockern die traditionellen Anforderungen der starken Konvexität-starken Konkavität auf und umfassen somit eine breitere Klasse von Problemen. Die Autoren schlagen den verallgemeinerten beschleunigten Primal-Dual-Algorithmus (GAPD) zur Lösung von Sattelpunktproblemen mit nicht-bilinearen Zielfunktionen vor, der bestehende Methoden vereinheitlicht und erweitert. Es wird nachgewiesen, dass das Verfahren unter diesen gelockerten Bedingungen eine lineare Konvergenzrate erreicht. Darüber hinaus werden Beispiele strukturierter Sattelpunktprobleme bereitgestellt, die die zweiseitigen QFG- oder QGG-Bedingungen erfüllen, und demonstrieren die praktische Anwendbarkeit und Relevanz des Verfahrens.
Dieses Papier untersucht das folgende Sattelpunktproblem:
minx∈Xmaxy∈Yf(x,y)
wobei f:X×Y→R bezüglich x konvex für alle y∈Y und bezüglich y konkav für alle x∈X ist, und X⊆X sowie Y⊆Y abgeschlossene konvexe Mengen sind.
- Einschränkungen traditioneller Methoden: Bestehende Ergebnisse zur linearen Konvergenz für Sattelpunktprobleme erfordern typischerweise Bedingungen der starken Konvexität-starken Konkavität, was in vielen praktischen Anwendungen zu restriktiv ist.
- Breite Anwendbarkeit: Sattelpunktprobleme haben wichtige Anwendungen in Spieltheorie, verteilungsrobustem Lernen, generativen gegnerischen Netzwerken und anderen Bereichen.
- Theoretische Lücke: Während Wachstumsbedingungen (QFG und QGG) in Minimierungsproblemen nachweislich lineare Konvergenz garantieren, ist die Erweiterung dieser Bedingungen auf Sattelpunktprobleme eine nicht-triviale Herausforderung und weitgehend unerforschtes Gebiet.
- Methodische Einheitlichkeit: Bestehende Primal-Dual-Methoden wie APD und OGDA ermangeln eines einheitlichen Analyseverfahrens.
- Zweiseitige Wachstumsbedingungen: Erstmalige Erweiterung der QFG- und QGG-Bedingungen auf Sattelpunktprobleme mit Definition zweiseitiger quadratischer Funktionswachstums- und zweiseitiger quadratischer Gradientenwachstumsbedingungen.
- Einheitliches Algorithmusgerüst: Vorschlag des verallgemeinerten beschleunigten Primal-Dual-Algorithmus (GAPD), der die bestehenden APD- und OGDA-Methoden vereinheitlicht.
- Garantie linearer Konvergenz: Nachweis, dass der GAPD-Algorithmus unter zweiseitigen QFG- oder QGG-Bedingungen eine lineare Konvergenzrate erreicht.
- Bregman-Distanz-Erweiterung: Erweiterung des Analyseverfahrens auf Bregman-Distanzen, was die Flexibilität und Anwendbarkeit der Methode erhöht.
- Strukturierte Problemklassen: Bereitstellung konkreter Beispiele strukturierter Sattelpunktprobleme, die zweiseitige Wachstumsbedingungen erfüllen.
Untersuchung konvex-konkaver Sattelpunkt-Optimierungsprobleme, bei denen die Zielfunktion zweiseitige quadratische Wachstumsbedingungen statt traditioneller starker Konvexität-starker Konkavität erfüllt.
Für ein Sattelpunktproblem, wenn es Konstanten (μx,μy)∈R++2 gibt, so dass für alle x∈X und y∈Y gilt:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
wobei z=[xT,yT]T, zˉ=PZ∗(z), F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T, M=diag({μxIn,μyIm}).
Wenn es Konstanten (μx,μy)∈R++2 gibt, so dass:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
Die Kernaktualisierungsregeln des GAPD-Algorithmus sind:
- Momentumterm-Berechnung:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- Aktualisierung der dualen Variablen:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- Konstruktion aggregierter Gradienten:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- Aktualisierung der primalen Variablen:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- Einheitlichkeit: Vereinheitlichung bestehender Methoden durch Parameter θk:
- θk=0: Degeneration zu OGDA
- θk=1,βk=0: Degeneration zu APD
- Bregman-Distanz: Verwendung von Bregman-Distanzen statt euklidischer Distanzen für größere Flexibilität.
- Zweiseitige Bedingungen: Erstmalige Erweiterung einseitiger Wachstumsbedingungen zur zweiseitigen Version für Sattelpunktprobleme.
Theorem 4.4: Sei {(xk,yk)}k≥0 die durch Algorithmus 1 erzeugte Folge. Unter der Annahme, dass die Annahmen 2.1-4.3 erfüllt sind, gilt für alle K≥1 und Γ≻0:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
Korollar 4.5: Bei angemessener Parameterwahl konvergiert die Iterationsfolge mit linearer Geschwindigkeit zur optimalen Lösungsmenge:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
wobei RK=(1−α)cMαK+1, und die Konvergenzrate hängt vom Parameter ς>0 ab (bei QFG ist ς=θ, bei QGG ist ς=2(1−θ)).
Betrachtung strukturierter konvex-konkaver Sattelpunktprobleme:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
wobei h:Rp→R und g:Rq→R stark konvexe Funktionen sind.
Proposition 5.1: Wenn es Konstanten ξ1,ξ2,ξ3,ξ4>0 gibt, so dass:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
dann erfüllt diese Problemklasse die zweiseitigen QGG- und QFG-Bedingungen.
Betrachtung zufällig generierter Sattelpunktprobleme:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- Dimensionstests: Tests unter drei verschiedenen Dimensionen (n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}.
- Leistungsvergleich: GAPD übertrifft die Standard-GDA-Methode bei verschiedenen θ-Werten.
- Parametereinfluss: θ=0.99 erreicht die beste Leistung, leicht besser als der Fall θ=1.
- QFG- und QGG-Bedingungen haben wichtige Bedeutung in deterministischen und stochastischen Optimierungseinstellungen
- Bestehende Arbeiten konzentrieren sich hauptsächlich auf lineare Konvergenz bei konvexen Optimierungsproblemen
- Arrow-Hurwicz-Methode (GDA): O(κ2log(1/ε)) Komplexität
- Extragradientenmethode (EG): O(κlog(1/ε)) Komplexität
- Optimistische Gradientenmethode (OGDA): O(κlog(1/ε)) Komplexität
- Beschleunigter Primal-Dual-Algorithmus (APD): erreicht O(1/ε) bzw. O(1/ε2) in C-C- und SC-C-Einstellungen
Quadratische Wachstumsbedingungen stehen in enger Beziehung zur Fehlergrenzanalyse monotoner Operatoren und metrischer Subregularität.
- Erfolgreiche Erweiterung quadratischer Wachstumsbedingungen auf Sattelpunktprobleme mit Einführung zweiseitiger QFG- und QGG-Bedingungen
- Der GAPD-Algorithmus erreicht unter gelockerten Bedingungen lineare Konvergenz und vereinheitlicht bestehende Methoden
- Bereitstellung strukturierter Problemklassen, die neue Wachstumsbedingungen erfüllen
- Bedingungsverifikation: Die Verifikation zweiseitiger Wachstumsbedingungen in praktischen Anwendungen kann herausfordernd sein
- Parameterwahl: Die Wahl des optimalen Parameters θ erfordert problemspezifisches Wissen
- Nebenbedingungsbehandlung: Fokus liegt hauptsächlich auf einfachen Nebenbedingungsmengen, mit begrenzter Behandlung komplexer Nebenbedingungen
- Untersuchung des Konvergenzverhaltens unter einseitigen quadratischen Wachstumsbedingungen
- Erkundung von Anwendungen in verteilter Optimierung
- Erweiterung auf komplexere Nebenbedingungsoptimierungsprobleme
- Theoretische Innovation: Erstmalige systematische Erweiterung quadratischer Wachstumsbedingungen auf Sattelpunktprobleme, Schließung einer wichtigen theoretischen Lücke
- Einheitliches Gerüst: Der GAPD-Algorithmus vereinheitlicht elegant mehrere bestehende Methoden
- Praktischer Wert: Gelockerte Bedingungen ermöglichen die Anwendung auf eine breitere Problemklasse
- Rigorose Analyse: Vollständige Konvergenzanalyse und konkrete Konvergenzraten
- Begrenzte Experimente: Numerische Experimente sind relativ einfach, mit mangelnder Validierung in realen Anwendungsszenarien
- Bedingungsbeziehungen: Die Beziehungsanalyse zwischen zweiseitigen QFG- und QGG-Bedingungen könnte tiefergehend sein
- Rechenkomplexität: Detaillierte Analyse der Rechenkomplexität pro Iteration fehlt
- Akademischer Beitrag: Bereitstellung wichtiger theoretischer Werkzeuge für die Sattelpunkt-Optimierungstheorie
- Praktischer Wert: Die Einheitlichkeit und Flexibilität der Methode bietet Potenzial in mehreren Anwendungsbereichen
- Erweiterbarkeit: Bietet solide theoretische Grundlagen für nachfolgende Forschung
- Adversariales Training im maschinellen Lernen
- Verteilungsrobuste Optimierung
- Spieltheoretische Anwendungen
- Konvexe Optimierungsprobleme mit spezieller Struktur
Das Papier zitiert 46 relevante Literaturquellen, die wichtige Arbeiten in mehreren verwandten Bereichen wie Sattelpunkt-Optimierung, Variationsungleichungen und quadratischen Wachstumsbedingungen abdecken und eine solide theoretische Grundlage für diese Forschung bieten.