In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- ID Articolo: 2510.11990
- Titolo: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
- Autori: Cody Melcher (University of Arizona), Afrooz Jalilzadeh (University of Arizona), Erfan Yazdandoost Hamedani (University of Arizona)
- Classificazione: math.OC (Ottimizzazione e Controllo)
- Data di Pubblicazione: 13 ottobre 2025 (preprint arXiv)
- Link Articolo: https://arxiv.org/abs/2510.11990
Questo articolo studia i problemi di punto di sella (SP), concentrandosi su problemi di ottimizzazione convesso-concava che soddisfano le condizioni di crescita quadratica bilaterale (QFG) o di crescita quadratica del gradiente bilaterale (QGG). Queste condizioni sono nuove e specificamente adattate ai problemi di punto di sella, rappresentando un'estensione delle condizioni di crescita quadratica nei problemi di minimizzazione. Tali condizioni attenuano i tradizionali requisiti di forte convessità-forte concavità, coprendo così una classe più ampia di problemi. Gli autori propongono l'algoritmo primale-duale accelerato generalizzato (GAPD) per risolvere problemi di punto di sella con funzioni obiettivo non bilineari, unificando ed estendendo i metodi esistenti. Si dimostra che il metodo raggiunge un tasso di convergenza lineare sotto queste condizioni attenuate. Inoltre, vengono forniti esempi di problemi di punto di sella strutturati che soddisfano le condizioni QFG o QGG bilaterali, dimostrando l'applicabilità pratica e la rilevanza del metodo.
Questo articolo studia il seguente problema di punto di sella:
minx∈Xmaxy∈Yf(x,y)
dove f:X×Y→R è convessa rispetto a x per ogni y∈Y e concava rispetto a y per ogni x∈X, e X⊆X e Y⊆Y sono insiemi chiusi e convessi.
- Limitazioni dei Metodi Tradizionali: I risultati di convergenza lineare esistenti per problemi di punto di sella richiedono tipicamente condizioni di forte convessità-forte concavità, che sono troppo restrittive in molte applicazioni pratiche.
- Ampia Applicabilità: I problemi di punto di sella hanno importanti applicazioni nella teoria dei giochi, nell'apprendimento robusto distribuito e nelle reti generative antagoniste.
- Lacuna Teorica: Sebbene le condizioni di crescita quadratica (QFG e QGG) siano state dimostrate garantire convergenza lineare nei problemi di minimizzazione, l'estensione di queste condizioni ai problemi di punto di sella rappresenta una sfida non banale e rimane in gran parte inesplorata.
- Unificazione dei Metodi: I metodi primali-duali esistenti come APD e OGDA mancano di un quadro di analisi unificato.
- Proposizione di Condizioni di Crescita Bilaterale: Per la prima volta, le condizioni QFG e QGG sono estese ai problemi di punto di sella, definendo le condizioni di crescita quadratica bilaterale e di crescita quadratica del gradiente bilaterale.
- Quadro Algoritmico Unificato: Viene proposto l'algoritmo primale-duale accelerato generalizzato (GAPD), che unifica i metodi APD e OGDA esistenti.
- Garanzie di Convergenza Lineare: Si dimostra che l'algoritmo GAPD raggiunge un tasso di convergenza lineare sotto le condizioni QFG o QGG bilaterali.
- Estensione della Distanza di Bregman: Il quadro di analisi è esteso alla distanza di Bregman, aumentando la flessibilità e l'applicabilità del metodo.
- Classi di Problemi Strutturati: Vengono forniti esempi concreti di problemi di punto di sella strutturati che soddisfano le condizioni di crescita bilaterale.
Studio di problemi di ottimizzazione di punto di sella convesso-concavo, dove la funzione obiettivo soddisfa condizioni di crescita quadratica bilaterale piuttosto che le tradizionali condizioni di forte convessità-forte concavità.
Per un problema di punto di sella, se esistono costanti (μx,μy)∈R++2 tali che per ogni x∈X e y∈Y:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
dove z=[xT,yT]T, zˉ=PZ∗(z), F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T, M=diag({μxIn,μyIm}).
Se esistono costanti (μx,μy)∈R++2 tali che:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
Le regole di aggiornamento fondamentali dell'algoritmo GAPD sono:
- Calcolo dei Termini di Momento:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- Aggiornamento della Variabile Duale:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- Costruzione del Gradiente Aggregato:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- Aggiornamento della Variabile Primale:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- Unificazione: Attraverso il parametro θk si unificano i metodi esistenti:
- θk=0: degenera in OGDA
- θk=1,βk=0: degenera in APD
- Distanza di Bregman: L'uso della distanza di Bregman al posto della distanza euclidea fornisce maggiore flessibilità.
- Condizioni Bilaterali: Per la prima volta, le condizioni di crescita unilaterale sono estese alla versione bilaterale per i problemi di punto di sella.
Teorema 4.4: Sia {(xk,yk)}k≥0 la sequenza generata dall'Algoritmo 1. Assumendo che le Assunzioni 2.1-4.3 siano soddisfatte, allora per ogni K≥1 e Γ≻0:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
Corollario 4.5: Con scelte di parametri appropriate, la sequenza iterativa converge al set di soluzioni ottimali con tasso lineare:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
dove RK=(1−α)cMαK+1, e il tasso di convergenza dipende dal parametro ς>0 (con ς=θ per QFG e ς=2(1−θ) per QGG).
Si considerano i seguenti problemi di punto di sella convesso-concavo strutturati:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
dove h:Rp→R e g:Rq→R sono funzioni fortemente convesse.
Proposizione 5.1: Se esistono costanti ξ1,ξ2,ξ3,ξ4>0 tali che:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
allora questa categoria di problemi soddisfa le condizioni QGG e QFG bilaterali.
Si considerano problemi di punto di sella generati casualmente:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- Test di Dimensionalità: Test condotti su tre diverse dimensioni (n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}.
- Confronto delle Prestazioni: GAPD supera il metodo GDA standard per diversi valori di θ.
- Effetto dei Parametri: θ=0.99 raggiunge le migliori prestazioni, leggermente superiore al caso θ=1.
- Le condizioni QFG e QGG hanno importanza significativa sia negli ambienti di ottimizzazione deterministica che stocastica
- I lavori esistenti si concentrano principalmente sulla convergenza lineare nei problemi di ottimizzazione convessa
- Metodo Arrow-Hurwicz (GDA): complessità O(κ2log(1/ε))
- Metodo del Gradiente Esterno (EG): complessità O(κlog(1/ε))
- Metodo del Gradiente Ottimista (OGDA): complessità O(κlog(1/ε))
- Metodo Primale-Duale Accelerato (APD): raggiunge O(1/ε) e O(1/ε2) rispettivamente nelle impostazioni C-C e SC-C
Le condizioni di crescita quadratica sono strettamente correlate all'analisi dei margini di errore per operatori monotoni e alla regolarità metrica sottile.
- Estensione riuscita delle condizioni di crescita quadratica ai problemi di punto di sella, con proposizione delle condizioni QFG e QGG bilaterali
- L'algoritmo GAPD raggiunge convergenza lineare sotto condizioni attenuate, unificando i metodi esistenti
- Fornitura di classi di problemi strutturati che soddisfano le nuove condizioni di crescita
- Verifica delle Condizioni: La verifica delle condizioni di crescita bilaterale nelle applicazioni pratiche potrebbe presentare sfide
- Scelta dei Parametri: La scelta del parametro ottimale θ richiede conoscenza specifica del problema
- Gestione dei Vincoli: L'attenzione principale è rivolta a insiemi di vincoli semplici, con trattamento limitato di vincoli complessi
- Studio del comportamento di convergenza sotto condizioni di crescita quadratica unilaterale
- Esplorazione di applicazioni nell'ottimizzazione distribuita
- Estensione a problemi di ottimizzazione con vincoli più complessi
- Innovazione Teorica: Per la prima volta, le condizioni di crescita quadratica sono sistematicamente estese ai problemi di punto di sella, colmando un'importante lacuna teorica
- Quadro Unificato: L'algoritmo GAPD unifica elegantemente molteplici metodi esistenti
- Valore Pratico: Le condizioni attenuate rendono il metodo applicabile a una classe più ampia di problemi
- Analisi Rigorosa: Fornisce un'analisi di convergenza completa e tassi di convergenza specifici
- Esperimenti Limitati: Gli esperimenti numerici sono relativamente semplici, mancando di validazione in scenari di applicazione pratica
- Relazione tra Condizioni: L'analisi della relazione tra le condizioni QFG e QGG bilaterali potrebbe essere più approfondita
- Complessità Computazionale: Non è stata analizzata in dettaglio la complessità computazionale di ogni iterazione
- Contributo Accademico: Fornisce importanti strumenti teorici per la teoria dell'ottimizzazione di punto di sella
- Valore Pratico: L'unificazione e la flessibilità del metodo lo rendono potenzialmente utile in molteplici domini applicativi
- Estensibilità: Fornisce una base teorica solida per ricerche successive
- Addestramento antagonista nell'apprendimento automatico
- Ottimizzazione robusta distribuita
- Applicazioni della teoria dei giochi
- Problemi di ottimizzazione convessa con struttura speciale
L'articolo cita 46 lavori correlati, coprendo molteplici aree rilevanti inclusi l'ottimizzazione di punto di sella, le disuguaglianze variazionali e le condizioni di crescita quadratica, fornendo una base teorica solida per questa ricerca.