In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- 논문 ID: 2510.11990
- 제목: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
- 저자: Cody Melcher (애리조나 대학교), Afrooz Jalilzadeh (애리조나 대학교), Erfan Yazdandoost Hamedani (애리조나 대학교)
- 분류: math.OC (최적화 및 제어)
- 발표 시간: 2025년 10월 13일 (arXiv 사전인쇄본)
- 논문 링크: https://arxiv.org/abs/2510.11990
본 논문은 양측 이차 함수 성장(QFG) 또는 양측 이차 기울기 성장(QGG) 조건을 만족하는 볼록-오목 최적화 문제에 중점을 두고 안장점(SP) 문제를 연구한다. 이러한 조건들은 안장점 문제를 위해 특별히 설계된 새로운 조건이며, 최소화 문제의 이차 성장 조건의 확장이다. 이러한 조건들은 전통적인 강볼록-강오목 요구사항을 완화하여 더 광범위한 문제 범주를 포함한다. 저자들은 비쌍선형 목적함수를 갖는 안장점 문제를 해결하기 위해 일반화된 가속 원-쌍대(GAPD) 알고리즘을 제안하며, 기존 방법들을 통합하고 확장한다. 이 방법이 완화된 조건 하에서 선형 수렴률을 달성함을 증명한다. 또한 양측 QFG 또는 QGG를 만족하는 구조화된 안장점 문제의 예시를 제공하여 방법의 실질적 적용 가능성과 관련성을 보여준다.
본 논문은 다음 안장점 문제를 연구한다:
minx∈Xmaxy∈Yf(x,y)
여기서 f:X×Y→R는 임의의 y∈Y에 대해 x에 대해 볼록이고, 임의의 x∈X에 대해 y에 대해 오목이며, X⊆X와 Y⊆Y는 닫힌 볼록 집합이다.
- 전통적 방법의 한계: 안장점 문제의 기존 선형 수렴 결과는 일반적으로 강볼록-강오목 조건을 필요로 하며, 이는 많은 실제 응용에서 과도하게 엄격하다.
- 광범위한 응용: 안장점 문제는 게임 이론, 분포 강건 학습, 생성 대립 신경망 등의 분야에서 중요한 응용을 갖는다.
- 이론적 공백: 최소화 문제에서 이차 성장 조건(QFG 및 QGG)이 선형 수렴을 보장함이 증명되었지만, 이러한 조건을 안장점 문제로 확장하는 것은 비자명한 도전이며 대부분 미탐색 상태이다.
- 방법의 통일성: APD, OGDA 등의 기존 원-쌍대 방법들은 통합된 분석 프레임워크가 부족하다.
- 양측 성장 조건 제안: QFG 및 QGG 조건을 처음으로 안장점 문제로 확장하여 양측 이차 함수 성장 및 양측 이차 기울기 성장 조건을 정의한다.
- 통합 알고리즘 프레임워크: 기존의 APD 및 OGDA 방법을 통합하는 일반화된 가속 원-쌍대(GAPD) 알고리즘을 제안한다.
- 선형 수렴 보장: 양측 QFG 또는 QGG 조건 하에서 GAPD 알고리즘이 선형 수렴률을 달성함을 증명한다.
- Bregman 거리 확장: 분석 프레임워크를 Bregman 거리로 확장하여 방법의 유연성과 적용 가능성을 향상시킨다.
- 구조화된 문제 범주: 양측 성장 조건을 만족하는 구체적인 구조화된 안장점 문제의 예시를 제공한다.
전통적인 강볼록-강오silon 조건이 아닌 양측 이차 성장 조건을 만족하는 목적함수를 갖는 볼록-오목 안장점 최적화 문제를 연구한다.
안장점 문제에 대해, 상수 (μx,μy)∈R++2가 존재하여 임의의 x∈X와 y∈Y에 대해 다음을 만족하면:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
여기서 z=[xT,yT]T, zˉ=PZ∗(z), F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T, M=diag({μxIn,μyIm}).
상수 (μx,μy)∈R++2가 존재하여 다음을 만족하면:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
GAPD 알고리즘의 핵심 업데이트 규칙은 다음과 같다:
- 모멘텀 항 계산:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- 쌍대 변수 업데이트:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- 집계 기울기 구성:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- 원변수 업데이트:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- 통일성: 매개변수 θk를 통해 기존 방법들을 통합:
- θk=0: OGDA로 축퇴
- θk=1,βk=0: APD로 축퇴
- Bregman 거리: 유클리드 거리 대신 Bregman 거리를 사용하여 더 큰 유연성을 제공한다.
- 양측 조건: 단측 성장 조건을 처음으로 안장점 문제의 양측 버전으로 확장한다.
정리 4.4: {(xk,yk)}k≥0을 알고리즘 1에서 생성한 수열이라 하자. 가정 2.1-4.3이 성립한다고 가정하면, 임의의 K≥1과 Γ≻0에 대해:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
따름정리 4.5: 적절한 매개변수 선택 하에서, 반복 수열은 최적해 집합으로 선형 속도로 수렴한다:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
여기서 RK=(1−α)cMαK+1이고, 수렴률은 매개변수 ς>0에 의존한다(QFG일 때 ς=θ, QGG일 때 ς=2(1−θ)).
다음 구조화된 볼록-오목 안장점 문제를 고려한다:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
여기서 h:Rp→R과 g:Rq→R은 강볼록 함수이다.
명제 5.1: 상수 ξ1,ξ2,ξ3,ξ4>0이 존재하여 다음을 만족하면:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
해당 문제 범주는 양측 QGG 및 QFG 조건을 만족한다.
무작위로 생성된 안장점 문제를 고려한다:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- 차원 테스트: 세 가지 다른 차원 (n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}에서 테스트를 수행한다.
- 성능 비교: GAPD는 다양한 θ 값에서 표준 GDA 방법을 능가한다.
- 매개변수 영향: θ=0.99가 최고 성능을 달성하며, θ=1인 경우보다 약간 우수하다.
- QFG 및 QGG 조건은 결정론적 및 확률적 최적화 설정 모두에서 중요한 가치를 갖는다
- 기존 연구는 주로 볼록 최적화 문제의 선형 수렴에 초점을 맞춘다
- Arrow-Hurwicz 방법(GDA): O(κ2log(1/ε)) 복잡도
- 외부 기울기 방법(EG): O(κlog(1/ε)) 복잡도
- 낙관적 기울기 방법(OGDA): O(κlog(1/ε)) 복잡도
- 가속 원-쌍대 방법(APD): C-C 및 SC-C 설정에서 각각 O(1/ε) 및 O(1/ε2) 달성
이차 성장 조건은 단조 연산자의 오류 한계 분석 및 메트릭 준정규성과 밀접한 관련이 있다.
- 이차 성장 조건을 안장점 문제로 성공적으로 확장하여 양측 QFG 및 QGG 조건을 제안했다
- GAPD 알고리즘은 완화된 조건 하에서 선형 수렴을 달성하며 기존 방법들을 통합한다
- 새로운 성장 조건을 만족하는 구조화된 문제 범주를 제공한다
- 조건 검증: 실제 응용에서 양측 성장 조건을 검증하는 것이 도전적일 수 있다
- 매개변수 선택: 최적 매개변수 θ의 선택은 문제 특정 지식을 필요로 한다
- 제약 처리: 주로 단순 제약 집합에 초점을 맞추며, 복잡한 제약에 대한 처리는 제한적이다
- 단측 이차 성장 조건 하에서의 수렴 행동 연구
- 분산 최적화에서의 응용 탐색
- 더 복잡한 제약 최적화 문제로의 확장
- 이론적 혁신: 이차 성장 조건을 처음으로 체계적으로 안장점 문제로 확장하여 중요한 이론적 공백을 메운다
- 통합 프레임워크: GAPD 알고리즘은 여러 기존 방법을 우아하게 통합한다
- 실용적 가치: 완화된 조건은 방법을 더 광범위한 문제 범주에 적용 가능하게 한다
- 엄밀한 분석: 완전한 수렴성 분석 및 구체적인 수렴률을 제공한다
- 제한된 실험: 수치 실험이 상대적으로 단순하며 실제 응용 시나리오의 검증이 부족하다
- 조건 관계: 양측 QFG 및 QGG 조건의 관계 분석이 더 깊이 있을 수 있다
- 계산 복잡도: 각 반복의 계산 복잡도에 대한 상세한 분석이 없다
- 학술 기여: 안장점 최적화 이론에 중요한 이론적 도구를 제공한다
- 실용적 가치: 방법의 통일성과 유연성은 여러 응용 분야에서 잠재력을 갖는다
- 확장성: 후속 연구를 위한 견고한 이론적 기초를 제공한다
- 기계학습의 대립 훈련
- 분포 강건 최적화
- 게임 이론 응용
- 특수 구조를 갖는 볼록 최적화 문제
논문은 안장점 최적화, 변분 부등식, 이차 성장 조건 등 여러 관련 분야의 중요한 연구를 포함하는 46개의 관련 문헌을 인용하며, 본 연구에 견고한 이론적 기초를 제공한다.