In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- ID del Artículo: 2510.11990
- Título: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
- Autores: Cody Melcher (University of Arizona), Afrooz Jalilzadeh (University of Arizona), Erfan Yazdandoost Hamedani (University of Arizona)
- Clasificación: math.OC (Optimización y Control)
- Fecha de Publicación: 13 de octubre de 2025 (preimpresión en arXiv)
- Enlace del Artículo: https://arxiv.org/abs/2510.11990
Este artículo estudia problemas de punto de silla (SP), enfocándose en problemas de optimización convexo-cóncava que satisfacen condiciones de crecimiento cuadrático bilateral de función (QFG) o crecimiento cuadrático bilateral de gradiente (QGG). Estas condiciones son nuevas y están específicamente diseñadas para problemas de punto de silla, extendiendo las condiciones de crecimiento cuadrático de problemas de minimización. Estas condiciones relajan los requisitos tradicionales de convexidad fuerte-concavidad fuerte, abarcando así una clase más amplia de problemas. Los autores proponen el algoritmo primal-dual acelerado generalizado (GAPD) para resolver problemas de punto de silla con funciones objetivo no bilineales, unificando y extendiendo métodos existentes. Se demuestra que el método logra una tasa de convergencia lineal bajo estas condiciones relajadas. Además, se proporcionan ejemplos de problemas de punto de silla estructurados que satisfacen QFG o QGG bilateral, demostrando la aplicabilidad práctica y relevancia del método.
Este artículo estudia el siguiente problema de punto de silla:
minx∈Xmaxy∈Yf(x,y)
donde f:X×Y→R es convexa en x para cualquier y∈Y y cóncava en y para cualquier x∈X, siendo X⊆X e Y⊆Y conjuntos cerrados y convexos.
- Limitaciones de Métodos Tradicionales: Los resultados de convergencia lineal existentes para problemas de punto de silla típicamente requieren condiciones de convexidad fuerte-concavidad fuerte, que son demasiado restrictivas en muchas aplicaciones prácticas.
- Amplitud de Aplicaciones: Los problemas de punto de silla tienen aplicaciones importantes en teoría de juegos, aprendizaje robusto distribuido, redes generativas adversariales y otros campos.
- Vacío Teórico: Aunque en problemas de minimización las condiciones de crecimiento cuadrático (QFG y QGG) han demostrado garantizar convergencia lineal, extender estas condiciones a problemas de punto de silla es un desafío no trivial que en gran medida permanece sin explorar.
- Unificación de Métodos: Los métodos primal-duales existentes como APD y OGDA carecen de un marco de análisis unificado.
- Propuesta de Condiciones de Crecimiento Bilateral: Primera extensión de las condiciones QFG y QGG a problemas de punto de silla, definiendo condiciones de crecimiento cuadrático bilateral de función y crecimiento cuadrático bilateral de gradiente.
- Marco Algorítmico Unificado: Propuesta del algoritmo primal-dual acelerado generalizado (GAPD), que unifica los métodos APD y OGDA existentes.
- Garantía de Convergencia Lineal: Demostración de que el algoritmo GAPD logra una tasa de convergencia lineal bajo condiciones QFG o QGG bilateral.
- Extensión de Distancia de Bregman: Extensión del marco de análisis a distancias de Bregman, aumentando la flexibilidad y aplicabilidad del método.
- Categorías de Problemas Estructurados: Provisión de ejemplos específicos de problemas de punto de silla estructurados que satisfacen condiciones de crecimiento bilateral.
Estudio de problemas de optimización de punto de silla convexo-cóncavo donde la función objetivo satisface condiciones de crecimiento cuadrático bilateral en lugar de las condiciones tradicionales de convexidad fuerte-concavidad fuerte.
Para un problema de punto de silla, si existen constantes (μx,μy)∈R++2 tales que para cualquier x∈X e y∈Y:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
donde z=[xT,yT]T, zˉ=PZ∗(z), F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T, M=diag({μxIn,μyIm}).
Si existen constantes (μx,μy)∈R++2 tales que:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
Las reglas de actualización principal del algoritmo GAPD son:
- Cálculo de Términos de Momento:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- Actualización de Variable Dual:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- Construcción de Gradiente Agregado:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- Actualización de Variable Primal:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- Unificación: Mediante el parámetro θk se unifican métodos existentes:
- θk=0: Se reduce a OGDA
- θk=1,βk=0: Se reduce a APD
- Distancia de Bregman: Uso de distancia de Bregman en lugar de distancia euclidiana, proporcionando mayor flexibilidad.
- Condiciones Bilaterales: Primera extensión de condiciones de crecimiento unilateral a versiones bilaterales para problemas de punto de silla.
Teorema 4.4: Sea {(xk,yk)}k≥0 la secuencia generada por el Algoritmo 1. Asumiendo que se cumplen las Suposiciones 2.1-4.3, entonces para cualquier K≥1 y Γ≻0:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
Corolario 4.5: Con selección apropiada de parámetros, la secuencia de iteraciones converge a la solución óptima a una tasa lineal:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
donde RK=(1−α)cMαK+1, y la tasa de convergencia depende del parámetro ς>0 (siendo ς=θ para QFG y ς=2(1−θ) para QGG).
Se considera la siguiente clase de problemas de punto de silla convexo-cóncavo estructurados:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
donde h:Rp→R y g:Rq→R son funciones fuertemente convexas.
Proposición 5.1: Si existen constantes ξ1,ξ2,ξ3,ξ4>0 tales que:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
entonces esta clase de problemas satisface las condiciones QGG y QFG bilateral.
Se consideran problemas de punto de silla generados aleatoriamente:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- Pruebas de Dimensionalidad: Se realizan pruebas en tres dimensiones diferentes (n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}.
- Comparación de Desempeño: GAPD supera al método GDA estándar para diferentes valores de θ.
- Influencia de Parámetros: θ=0.99 logra el mejor desempeño, ligeramente superior al caso θ=1.
- Las condiciones QFG y QGG tienen valor importante tanto en configuraciones de optimización determinista como estocástica
- Los trabajos existentes se enfocaban principalmente en convergencia lineal para problemas de optimización convexa
- Método Arrow-Hurwicz (GDA): complejidad O(κ2log(1/ε))
- Método de Gradiente Externo (EG): complejidad O(κlog(1/ε))
- Método de Gradiente Optimista (OGDA): complejidad O(κlog(1/ε))
- Método Primal-Dual Acelerado (APD): alcanza O(1/ε) y O(1/ε2) en configuraciones C-C y SC-C respectivamente
Las condiciones de crecimiento cuadrático están estrechamente relacionadas con análisis de cotas de error para operadores monótonos y regularidad métrica subregular.
- Extensión exitosa de condiciones de crecimiento cuadrático a problemas de punto de silla, proponiendo condiciones QFG y QGG bilateral
- El algoritmo GAPD logra convergencia lineal bajo condiciones relajadas, unificando métodos existentes
- Provisión de categorías de problemas estructurados que satisfacen las nuevas condiciones de crecimiento
- Verificación de Condiciones: Verificar condiciones de crecimiento bilateral en aplicaciones prácticas puede ser desafiante
- Selección de Parámetros: La selección del parámetro óptimo θ requiere conocimiento específico del problema
- Manejo de Restricciones: Se enfoca principalmente en conjuntos de restricciones simples, con capacidad limitada para restricciones complejas
- Investigación del comportamiento de convergencia bajo condiciones de crecimiento cuadrático unilateral
- Exploración de aplicaciones en optimización distribuida
- Extensión a problemas de optimización con restricciones más complejas
- Innovación Teórica: Primera extensión sistemática de condiciones de crecimiento cuadrático a problemas de punto de silla, llenando un vacío teórico importante
- Marco Unificado: El algoritmo GAPD unifica elegantemente múltiples métodos existentes
- Valor Práctico: Las condiciones relajadas hacen que el método sea aplicable a una clase más amplia de problemas
- Análisis Riguroso: Proporciona análisis completo de convergencia y tasas de convergencia específicas
- Experimentos Limitados: Los experimentos numéricos son relativamente simples, careciendo de validación en escenarios de aplicación práctica
- Relación de Condiciones: El análisis de la relación entre condiciones QFG y QGG bilateral podría ser más profundo
- Complejidad Computacional: No se analiza en detalle la complejidad computacional de cada iteración
- Contribución Académica: Proporciona herramientas teóricas importantes para la teoría de optimización de punto de silla
- Valor Práctico: La unificación y flexibilidad del método tiene potencial en múltiples dominios de aplicación
- Escalabilidad: Proporciona una base teórica sólida para investigaciones posteriores
- Entrenamiento adversarial en aprendizaje automático
- Optimización robusta distribuida
- Aplicaciones de teoría de juegos
- Problemas de optimización convexa con estructura especial
El artículo cita 46 referencias relacionadas, cubriendo múltiples campos relevantes incluyendo optimización de punto de silla, desigualdades variacionales, condiciones de crecimiento cuadrático y otros trabajos importantes, proporcionando una base teórica sólida para esta investigación.