2025-11-10T02:58:56.248145

Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth

Melcher, Jalilzadeh, Hamedani

In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.

academic

Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth

基本信息

论文ID: 2510.11990
标题: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
作者: Cody Melcher (University of Arizona), Afrooz Jalilzadeh (University of Arizona), Erfan Yazdandoost Hamedani (University of Arizona)
分类: math.OC (Optimization and Control)
发表时间: 2025年10月13日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.11990

摘要

本文研究鞍点(SP)问题，重点关注满足双侧二次函数增长(QFG)或双侧二次梯度增长(QGG)条件的凸-凹优化问题。这些条件是专门为鞍点问题量身定制的新条件，是最小化问题中二次增长条件的扩展。这些条件放宽了传统的强凸-强凹要求，从而涵盖了更广泛的问题类别。作者提出了广义加速原对偶(GAPD)算法来解决具有非双线性目标函数的鞍点问题，统一并扩展了现有方法。证明了该方法在这些放宽条件下实现线性收敛率。此外，还提供了满足双侧QFG或QGG的结构化鞍点问题示例，展示了该方法的实际适用性和相关性。

研究背景与动机

问题定义

本文研究如下鞍点问题： $\min_{x \in X} \max_{y \in Y} f(x,y)$ 其中 $f: X \times Y \rightarrow \mathbb{R}$ 对任意 $y \in Y$ 关于 $x$ 凸，对任意 $x \in X$ 关于 $y$ 凹， $X \subseteq \mathcal{X}$ 和 $Y \subseteq \mathcal{Y}$ 是闭凸集。

研究动机

传统方法的局限性：现有鞍点问题的线性收敛结果通常需要强凸-强凹条件，这在许多实际应用中过于严格。
应用广泛性：鞍点问题在博弈论、分布鲁棒学习、生成对抗网络等领域有重要应用。
理论空白：虽然在最小化问题中，二次增长条件(QFG和QGG)已被证明能保证线性收敛，但将这些条件扩展到鞍点问题是非平凡的挑战，且在很大程度上尚未被探索。
方法统一性：现有的原对偶方法如APD、OGDA等缺乏统一的分析框架。

核心贡献

提出双侧增长条件：首次将QFG和QGG条件扩展到鞍点问题，定义了双侧二次函数增长和双侧二次梯度增长条件。
统一算法框架：提出了广义加速原对偶(GAPD)算法，统一了现有的APD和OGDA方法。
线性收敛保证：证明了在双侧QFG或QGG条件下，GAPD算法实现线性收敛率。
Bregman距离扩展：将分析框架扩展到Bregman距离，增强了方法的灵活性和适用性。
结构化问题类别：提供了满足双侧增长条件的具体结构化鞍点问题示例。

方法详解

任务定义

研究凸-凹鞍点优化问题，其中目标函数满足双侧二次增长条件而非传统的强凸-强凹条件。

核心定义

双侧二次梯度增长(Two-Sided QGG)

对于鞍点问题，如果存在常数 $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ 使得对任意 $x \in X$ 和 $y \in Y$ 有： $\langle F(z) - F(\bar{z}), z - \bar{z} \rangle \geq 2D_Z^M(z, \bar{z})$ 其中 $z = [x^T, y^T]^T$ ， $\bar{z} = P_{Z^*}(z)$ ， $F(z) = [\nabla_x f(x,y)^T, -\nabla_y f(x,y)^T]^T$ ， $M = \text{diag}(\{μ_x I_n, μ_y I_m\})$ 。

双侧二次函数增长(Two-Sided QFG)

如果存在常数 $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ 使得： $f(x, \bar{y}) - f(\bar{x}, y) \geq D_Z^M(z, \bar{z})$

GAPD算法架构

GAPD算法的核心更新规则为：

动量项计算：
- $q_k^y = \nabla_y f(x_k, y_k) - \nabla_y f(x_{k-1}, y_{k-1})$
- $q_k^x = \nabla_x f(x_k, y_k) - \nabla_x f(x_{k-1}, y_{k-1})$
对偶变量更新： $y_{k+1} = \arg\min_{y \in Y} \left\{-\langle \nabla_y f(x_k, y_k) + α_k q_k^y, y \rangle + \frac{1}{σ_k} D_Y(y, y_k) \right\}$
聚合梯度构造： $s_k = θ_k \nabla_x f(x_k, y_{k+1}) + (1-θ_k) \nabla_x f(x_k, y_k) + β_k q_k^x$
原变量更新： $x_{k+1} = \arg\min_{x \in X} \left\{ \langle s_k, x \rangle + \frac{1}{τ_k} D_X(x, x_k) \right\}$

技术创新点

统一性：通过参数 $θ_k$ $θ_{k}$ 统一现有方法：
- $θ_k = 0$ ：退化为OGDA
- $θ_k = 1, β_k = 0$ ：退化为APD
Bregman距离：使用Bregman距离代替欧几里得距离，提供更大的灵活性。
双侧条件：首次将单侧增长条件扩展到鞍点问题的双侧版本。

$ξ_1 C_1^T C_1 \succeq A^T A$ , $ξ_2 C_1^T C_1 \succeq \|λ^*\|^2 G^T G$
$ξ_3 C_2^T C_2 \succeq AA^T$ , $ξ_4 C_2^T C_2 \succeq \|ν^*\|^2 F^T F$

则该问题类别满足双侧QGG和QFG条件。

维度测试：在三种不同维度 $(n,m,p,q) \in \{(75,60,60,50), (150,120,120,100), (300,240,240,200)\}$ 下进行测试。
性能对比：GAPD在不同 $θ$ 值下均优于标准GDA方法。
参数影响： $θ = 0.99$ 取得最佳性能，略优于 $θ = 1$ 的情况。