2025-11-10T02:58:56.248145

Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth

Melcher, Jalilzadeh, Hamedani

In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.

academic

二次増長を持つ凸-凹鞍点問題に対する統一原対偶アルゴリズムの線形収束

基本情報

論文ID: 2510.11990
タイトル: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
著者: Cody Melcher (アリゾナ大学), Afrooz Jalilzadeh (アリゾナ大学), Erfan Yazdandoost Hamedani (アリゾナ大学)
分類: math.OC (最適化と制御)
発表日: 2025年10月13日 (arXiv プレプリント)
論文リンク: https://arxiv.org/abs/2510.11990

要約

本論文は鞍点(SP)問題を研究し、両側二次関数増長(QFG)または両側二次勾配増長(QGG)条件を満たす凸-凹最適化問題に焦点を当てている。これらの条件は鞍点問題のために特別に設計された新しい条件であり、最小化問題における二次増長条件の拡張である。これらの条件は従来の強凸-強凹要件を緩和し、より広いクラスの問題をカバーしている。著者らは非双線形目的関数を持つ鞍点問題を解くための一般化加速原対偶(GAPD)アルゴリズムを提案し、既存手法を統一・拡張している。本手法が緩和条件下で線形収束率を達成することを証明している。さらに、両側QFGまたはQGGを満たす構造化鞍点問題の具体例を提供し、本手法の実用的な適用可能性と関連性を示している。

研究背景と動機

問題定義

本論文は以下の鞍点問題を研究する: $\min_{x \in X} \max_{y \in Y} f(x,y)$ ここで $f: X \times Y \rightarrow \mathbb{R}$ は任意の $y \in Y$ に対して $x$ について凸であり、任意の $x \in X$ に対して $y$ について凹であり、 $X \subseteq \mathcal{X}$ と $Y \subseteq \mathcal{Y}$ は閉凸集合である。

研究動機

従来手法の限界: 鞍点問題の線形収束結果は通常、強凸-強凹条件を必要とするが、これは多くの実用的応用では過度に厳格である。
応用の広がり: 鞍点問題はゲーム理論、分布ロバスト学習、生成的敵対的ネットワークなど多くの分野で重要な応用がある。
理論的空白: 最小化問題ではQFGおよびQGG条件が線形収束を保証することが証明されているが、これらの条件を鞍点問題に拡張することは非自明な課題であり、大部分が未探索である。
手法の統一性: APD、OGDAなどの既存原対偶手法は統一的な分析フレームワークを欠いている。

核心的貢献

両側増長条件の提案: QFGおよびQGG条件を初めて鞍点問題に拡張し、両側二次関数増長および両側二次勾配増長条件を定義した。
統一アルゴリズムフレームワーク: 一般化加速原対偶(GAPD)アルゴリズムを提案し、既存のAPDおよびOGDA手法を統一した。
線形収束保証: 両側QFGまたはQGG条件下でGAPDアルゴリズムが線形収束率を達成することを証明した。
Bregman距離への拡張: 分析フレームワークをBregman距離に拡張し、手法の柔軟性と適用可能性を向上させた。
構造化問題クラス: 両側増長条件を満たす具体的な構造化鞍点問題の例を提供した。

手法の詳細

タスク定義

従来の強凸-強凹条件ではなく、両側二次増長条件を満たす目的関数を持つ凸-凹鞍点最適化問題を研究する。

核心的定義

両側二次勾配増長(Two-Sided QGG)

鞍点問題に対して、定数 $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ が存在し、任意の $x \in X$ と $y \in Y$ に対して以下が成り立つ場合: $\langle F(z) - F(\bar{z}), z - \bar{z} \rangle \geq 2D_Z^M(z, \bar{z})$ ここで $z = [x^T, y^T]^T$ 、 $\bar{z} = P_{Z^*}(z)$ 、 $F(z) = [\nabla_x f(x,y)^T, -\nabla_y f(x,y)^T]^T$ 、 $M = \text{diag}(\{μ_x I_n, μ_y I_m\})$ 。

両側二次関数増長(Two-Sided QFG)

定数 $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ が存在し、以下が成り立つ場合: $f(x, \bar{y}) - f(\bar{x}, y) \geq D_Z^M(z, \bar{z})$

GAPDアルゴリズムの構造

GAPDアルゴリズムの核となる更新規則は以下の通りである:

モーメンタム項の計算:
- $q_k^y = \nabla_y f(x_k, y_k) - \nabla_y f(x_{k-1}, y_{k-1})$
- $q_k^x = \nabla_x f(x_k, y_k) - \nabla_x f(x_{k-1}, y_{k-1})$
双対変数の更新: $y_{k+1} = \arg\min_{y \in Y} \left\{-\langle \nabla_y f(x_k, y_k) + α_k q_k^y, y \rangle + \frac{1}{σ_k} D_Y(y, y_k) \right\}$
集約勾配の構成: $s_k = θ_k \nabla_x f(x_k, y_{k+1}) + (1-θ_k) \nabla_x f(x_k, y_k) + β_k q_k^x$
主変数の更新: $x_{k+1} = \arg\min_{x \in X} \left\{ \langle s_k, x \rangle + \frac{1}{τ_k} D_X(x, x_k) \right\}$

技術的革新点

統一性: パラメータ $θ_k$ $θ_{k}$ を通じて既存手法を統一:
- $θ_k = 0$ : OGDAに退化
- $θ_k = 1, β_k = 0$ : APDに退化
Bregman距離: ユークリッド距離の代わりにBregman距離を使用し、より大きな柔軟性を提供。
両側条件: 初めて単側増長条件を鞍点問題の両側バージョンに拡張。

$ξ_1 C_1^T C_1 \succeq A^T A$ , $ξ_2 C_1^T C_1 \succeq \|λ^*\|^2 G^T G$
$ξ_3 C_2^T C_2 \succeq AA^T$ , $ξ_4 C_2^T C_2 \succeq \|ν^*\|^2 F^T F$

この問題クラスは両側QGGおよびQFG条件を満たす。

次元テスト: 3つの異なる次元 $(n,m,p,q) \in \{(75,60,60,50), (150,120,120,100), (300,240,240,200)\}$ でテストを実施。
性能比較: GAPDは異なる $θ$ 値の下で標準GDA手法を上回る。
パラメータ影響: $θ = 0.99$ が最良の性能を達成し、 $θ = 1$ の場合をわずかに上回る。