In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- 论文ID: 2510.11990
- 标题: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
- 作者: Cody Melcher (University of Arizona), Afrooz Jalilzadeh (University of Arizona), Erfan Yazdandoost Hamedani (University of Arizona)
- 分类: math.OC (Optimization and Control)
- 发表时间: 2025年10月13日 (arXiv预印本)
- 论文链接: https://arxiv.org/abs/2510.11990
本文研究鞍点(SP)问题,重点关注满足双侧二次函数增长(QFG)或双侧二次梯度增长(QGG)条件的凸-凹优化问题。这些条件是专门为鞍点问题量身定制的新条件,是最小化问题中二次增长条件的扩展。这些条件放宽了传统的强凸-强凹要求,从而涵盖了更广泛的问题类别。作者提出了广义加速原对偶(GAPD)算法来解决具有非双线性目标函数的鞍点问题,统一并扩展了现有方法。证明了该方法在这些放宽条件下实现线性收敛率。此外,还提供了满足双侧QFG或QGG的结构化鞍点问题示例,展示了该方法的实际适用性和相关性。
本文研究如下鞍点问题:
minx∈Xmaxy∈Yf(x,y)
其中f:X×Y→R对任意y∈Y关于x凸,对任意x∈X关于y凹,X⊆X和Y⊆Y是闭凸集。
- 传统方法的局限性:现有鞍点问题的线性收敛结果通常需要强凸-强凹条件,这在许多实际应用中过于严格。
- 应用广泛性:鞍点问题在博弈论、分布鲁棒学习、生成对抗网络等领域有重要应用。
- 理论空白:虽然在最小化问题中,二次增长条件(QFG和QGG)已被证明能保证线性收敛,但将这些条件扩展到鞍点问题是非平凡的挑战,且在很大程度上尚未被探索。
- 方法统一性:现有的原对偶方法如APD、OGDA等缺乏统一的分析框架。
- 提出双侧增长条件:首次将QFG和QGG条件扩展到鞍点问题,定义了双侧二次函数增长和双侧二次梯度增长条件。
- 统一算法框架:提出了广义加速原对偶(GAPD)算法,统一了现有的APD和OGDA方法。
- 线性收敛保证:证明了在双侧QFG或QGG条件下,GAPD算法实现线性收敛率。
- Bregman距离扩展:将分析框架扩展到Bregman距离,增强了方法的灵活性和适用性。
- 结构化问题类别:提供了满足双侧增长条件的具体结构化鞍点问题示例。
研究凸-凹鞍点优化问题,其中目标函数满足双侧二次增长条件而非传统的强凸-强凹条件。
对于鞍点问题,如果存在常数(μx,μy)∈R++2使得对任意x∈X和y∈Y有:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
其中z=[xT,yT]T,zˉ=PZ∗(z),F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T,M=diag({μxIn,μyIm})。
如果存在常数(μx,μy)∈R++2使得:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
GAPD算法的核心更新规则为:
- 动量项计算:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- 对偶变量更新:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- 聚合梯度构造:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- 原变量更新:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- 统一性:通过参数θk统一现有方法:
- θk=0:退化为OGDA
- θk=1,βk=0:退化为APD
- Bregman距离:使用Bregman距离代替欧几里得距离,提供更大的灵活性。
- 双侧条件:首次将单侧增长条件扩展到鞍点问题的双侧版本。
定理4.4:设{(xk,yk)}k≥0是算法1生成的序列。假设假设2.1-4.3成立,则对任意K≥1和Γ≻0:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
推论4.5:在适当的参数选择下,迭代序列以线性速率收敛到最优解集:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
其中RK=(1−α)cMαK+1,收敛率依赖于参数ς>0(QFG时ς=θ,QGG时ς=2(1−θ))。
考虑如下结构化凸-凹鞍点问题:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
其中h:Rp→R和g:Rq→R是强凸函数。
命题5.1:如果存在常数ξ1,ξ2,ξ3,ξ4>0使得:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
则该问题类别满足双侧QGG和QFG条件。
考虑随机生成的鞍点问题:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- 维度测试:在三种不同维度(n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}下进行测试。
- 性能对比:GAPD在不同θ值下均优于标准GDA方法。
- 参数影响:θ=0.99取得最佳性能,略优于θ=1的情况。
- QFG和QGG条件在确定性和随机优化设置中都有重要价值
- 现有工作主要关注凸优化问题的线性收敛
- Arrow-Hurwicz方法(GDA):O(κ2log(1/ε))复杂度
- 外梯度方法(EG):O(κlog(1/ε))复杂度
- 乐观梯度方法(OGDA):O(κlog(1/ε))复杂度
- 加速原对偶方法(APD):在C-C和SC-C设置下分别达到O(1/ε)和O(1/ε2)
二次增长条件与单调算子的误差界分析和度量次正则性密切相关。
- 成功将二次增长条件扩展到鞍点问题,提出了双侧QFG和QGG条件
- GAPD算法在放宽条件下实现线性收敛,统一了现有方法
- 提供了满足新增长条件的结构化问题类别
- 条件验证:在实际应用中验证双侧增长条件可能具有挑战性
- 参数选择:最优参数θ的选择需要问题特定的知识
- 约束处理:主要关注简单约束集合,对复杂约束的处理有限
- 研究单侧二次增长条件下的收敛行为
- 探索分布式优化中的应用
- 扩展到更复杂的约束优化问题
- 理论创新:首次系统地将二次增长条件扩展到鞍点问题,填补了重要理论空白
- 统一框架:GAPD算法优雅地统一了多种现有方法
- 实用价值:放宽的条件使方法适用于更广泛的问题类别
- 严谨分析:提供了完整的收敛性分析和具体的收敛率
- 实验有限:数值实验相对简单,缺乏实际应用场景的验证
- 条件关系:双侧QFG和QGG条件的关系分析可以更深入
- 计算复杂度:未详细分析每次迭代的计算复杂度
- 学术贡献:为鞍点优化理论提供了重要的理论工具
- 实用价值:方法的统一性和灵活性使其在多个应用领域有潜力
- 可扩展性:为后续研究提供了坚实的理论基础
- 机器学习中的对抗训练
- 分布鲁棒优化
- 博弈论应用
- 具有特殊结构的凸优化问题
论文引用了46篇相关文献,涵盖了鞍点优化、变分不等式、二次增长条件等多个相关领域的重要工作,为本研究提供了坚实的理论基础。