2025-11-10T02:58:56.248145

Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth

Melcher, Jalilzadeh, Hamedani

In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.

academic

이차 성장을 갖는 볼록-오목 안장점 문제에 대한 통합 원-쌍대 알고리즘의 선형 수렴

기본 정보

논문 ID: 2510.11990
제목: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
저자: Cody Melcher (애리조나 대학교), Afrooz Jalilzadeh (애리조나 대학교), Erfan Yazdandoost Hamedani (애리조나 대학교)
분류: math.OC (최적화 및 제어)
발표 시간: 2025년 10월 13일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.11990

초록

본 논문은 양측 이차 함수 성장(QFG) 또는 양측 이차 기울기 성장(QGG) 조건을 만족하는 볼록-오목 최적화 문제에 중점을 두고 안장점(SP) 문제를 연구한다. 이러한 조건들은 안장점 문제를 위해 특별히 설계된 새로운 조건이며, 최소화 문제의 이차 성장 조건의 확장이다. 이러한 조건들은 전통적인 강볼록-강오목 요구사항을 완화하여 더 광범위한 문제 범주를 포함한다. 저자들은 비쌍선형 목적함수를 갖는 안장점 문제를 해결하기 위해 일반화된 가속 원-쌍대(GAPD) 알고리즘을 제안하며, 기존 방법들을 통합하고 확장한다. 이 방법이 완화된 조건 하에서 선형 수렴률을 달성함을 증명한다. 또한 양측 QFG 또는 QGG를 만족하는 구조화된 안장점 문제의 예시를 제공하여 방법의 실질적 적용 가능성과 관련성을 보여준다.

연구 배경 및 동기

문제 정의

본 논문은 다음 안장점 문제를 연구한다: $\min_{x \in X} \max_{y \in Y} f(x,y)$ 여기서 $f: X \times Y \rightarrow \mathbb{R}$ 는 임의의 $y \in Y$ 에 대해 $x$ 에 대해 볼록이고, 임의의 $x \in X$ 에 대해 $y$ 에 대해 오목이며, $X \subseteq \mathcal{X}$ 와 $Y \subseteq \mathcal{Y}$ 는 닫힌 볼록 집합이다.

연구 동기

전통적 방법의 한계: 안장점 문제의 기존 선형 수렴 결과는 일반적으로 강볼록-강오목 조건을 필요로 하며, 이는 많은 실제 응용에서 과도하게 엄격하다.
광범위한 응용: 안장점 문제는 게임 이론, 분포 강건 학습, 생성 대립 신경망 등의 분야에서 중요한 응용을 갖는다.
이론적 공백: 최소화 문제에서 이차 성장 조건(QFG 및 QGG)이 선형 수렴을 보장함이 증명되었지만, 이러한 조건을 안장점 문제로 확장하는 것은 비자명한 도전이며 대부분 미탐색 상태이다.
방법의 통일성: APD, OGDA 등의 기존 원-쌍대 방법들은 통합된 분석 프레임워크가 부족하다.

핵심 기여

양측 성장 조건 제안: QFG 및 QGG 조건을 처음으로 안장점 문제로 확장하여 양측 이차 함수 성장 및 양측 이차 기울기 성장 조건을 정의한다.
통합 알고리즘 프레임워크: 기존의 APD 및 OGDA 방법을 통합하는 일반화된 가속 원-쌍대(GAPD) 알고리즘을 제안한다.
선형 수렴 보장: 양측 QFG 또는 QGG 조건 하에서 GAPD 알고리즘이 선형 수렴률을 달성함을 증명한다.
Bregman 거리 확장: 분석 프레임워크를 Bregman 거리로 확장하여 방법의 유연성과 적용 가능성을 향상시킨다.
구조화된 문제 범주: 양측 성장 조건을 만족하는 구체적인 구조화된 안장점 문제의 예시를 제공한다.

방법론 상세 설명

작업 정의

전통적인 강볼록-강오silon 조건이 아닌 양측 이차 성장 조건을 만족하는 목적함수를 갖는 볼록-오목 안장점 최적화 문제를 연구한다.

핵심 정의

양측 이차 기울기 성장(Two-Sided QGG)

안장점 문제에 대해, 상수 $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ 가 존재하여 임의의 $x \in X$ 와 $y \in Y$ 에 대해 다음을 만족하면: $\langle F(z) - F(\bar{z}), z - \bar{z} \rangle \geq 2D_Z^M(z, \bar{z})$ 여기서 $z = [x^T, y^T]^T$ , $\bar{z} = P_{Z^*}(z)$ , $F(z) = [\nabla_x f(x,y)^T, -\nabla_y f(x,y)^T]^T$ , $M = \text{diag}(\{μ_x I_n, μ_y I_m\})$ .

양측 이차 함수 성장(Two-Sided QFG)

상수 $(μ_x, μ_y) \in \mathbb{R}_{++}^2$ 가 존재하여 다음을 만족하면: $f(x, \bar{y}) - f(\bar{x}, y) \geq D_Z^M(z, \bar{z})$

GAPD 알고리즘 구조

GAPD 알고리즘의 핵심 업데이트 규칙은 다음과 같다:

모멘텀 항 계산:
- $q_k^y = \nabla_y f(x_k, y_k) - \nabla_y f(x_{k-1}, y_{k-1})$
- $q_k^x = \nabla_x f(x_k, y_k) - \nabla_x f(x_{k-1}, y_{k-1})$
쌍대 변수 업데이트: $y_{k+1} = \arg\min_{y \in Y} \left\{-\langle \nabla_y f(x_k, y_k) + α_k q_k^y, y \rangle + \frac{1}{σ_k} D_Y(y, y_k) \right\}$
집계 기울기 구성: $s_k = θ_k \nabla_x f(x_k, y_{k+1}) + (1-θ_k) \nabla_x f(x_k, y_k) + β_k q_k^x$
원변수 업데이트: $x_{k+1} = \arg\min_{x \in X} \left\{ \langle s_k, x \rangle + \frac{1}{τ_k} D_X(x, x_k) \right\}$

기술적 혁신점

통일성: 매개변수 $θ_k$ $θ_{k}$ 를 통해 기존 방법들을 통합:
- $θ_k = 0$ : OGDA로 축퇴
- $θ_k = 1, β_k = 0$ : APD로 축퇴
Bregman 거리: 유클리드 거리 대신 Bregman 거리를 사용하여 더 큰 유연성을 제공한다.
양측 조건: 단측 성장 조건을 처음으로 안장점 문제의 양측 버전으로 확장한다.

$ξ_1 C_1^T C_1 \succeq A^T A$ , $ξ_2 C_1^T C_1 \succeq \|λ^*\|^2 G^T G$
$ξ_3 C_2^T C_2 \succeq AA^T$ , $ξ_4 C_2^T C_2 \succeq \|ν^*\|^2 F^T F$

해당 문제 범주는 양측 QGG 및 QFG 조건을 만족한다.

차원 테스트: 세 가지 다른 차원 $(n,m,p,q) \in \{(75,60,60,50), (150,120,120,100), (300,240,240,200)\}$ 에서 테스트를 수행한다.
성능 비교: GAPD는 다양한 $θ$ 값에서 표준 GDA 방법을 능가한다.
매개변수 영향: $θ = 0.99$ 가 최고 성능을 달성하며, $θ = 1$ 인 경우보다 약간 우수하다.