Revisit First-order Methods for Geodesically Convex Optimization
Shu, Jiang, Shi et al.
In a seminal work of Zhang and Sra, gradient descent methods for geodesically convex optimization were comprehensively studied. In particular, Zhang and Sra derived a comparison inequality that relates the iterative points in the optimization process. Since their seminal work, numerous follow-ups have studied different downstream usages of their comparison lemma.
In this work, we introduce the concept of quasilinearization to optimization, presenting a novel framework for analyzing geodesically convex optimization. By leveraging this technique, we establish state-of-the-art convergence rates -- for both deterministic and stochastic settings -- under weaker assumptions than previously required. The technique of quasilinearization may prove valuable for other non-Euclidean optimization problems.
본 논문은 측지 볼록 최적화에서의 1차 방법을 재검토합니다. Zhang과 Sra의 획기적인 연구에서 측지 볼록 최적화의 경사 하강법을 포괄적으로 연구했으며, 특히 최적화 과정에서 반복점의 비교 부등식을 도출했습니다. 본 논문은 준선형화(quasilinearization) 개념을 최적화 분야에 도입하고, 측지 볼록 최적화 분석을 위한 새로운 프레임워크를 제시합니다. 이 기법을 활용하여 기존보다 더 약한 가정 조건 하에서 결정론적 및 확률론적 설정에 대한 최첨단 수렴률을 확립했습니다. 준선형화 기법은 다른 비유클리드 최적화 문제에도 가치가 있을 수 있습니다.
정리 1 (결정론적 경우): f가 Hadamard 다양체 M 위의 측지 볼록 함수이고, 근접 경사 알고리즘이 만족할 때:
f(xt)−f(x∗)≤ηt∣x0x∗∣2
정리 2 (확률론적 경우): 유계 분산 가정 하에서, 단계 크기 ηt=2Lt1를 갖는 확률론적 근접 경사 알고리즘이 만족할 때:
∑t=1Tαt1∑t=1Tαt(EF(xt)−F(x∗))≤2∑t=1Tαt∣x0x∗∣2+∑t=1Tαtσ2log(T+1)