Revisit First-order Methods for Geodesically Convex Optimization
Shu, Jiang, Shi et al.
In a seminal work of Zhang and Sra, gradient descent methods for geodesically convex optimization were comprehensively studied. In particular, Zhang and Sra derived a comparison inequality that relates the iterative points in the optimization process. Since their seminal work, numerous follow-ups have studied different downstream usages of their comparison lemma.
In this work, we introduce the concept of quasilinearization to optimization, presenting a novel framework for analyzing geodesically convex optimization. By leveraging this technique, we establish state-of-the-art convergence rates -- for both deterministic and stochastic settings -- under weaker assumptions than previously required. The technique of quasilinearization may prove valuable for other non-Euclidean optimization problems.
academic
Revisiter les Méthodes du Premier Ordre pour l'Optimisation Géodésiquement Convexe
Cet article revisité les méthodes du premier ordre en optimisation géodésiquement convexe. Zhang et Sra ont étudié de manière exhaustive les méthodes de descente de gradient pour l'optimisation géodésiquement convexe dans leurs travaux fondateurs, en particulier en dérivant les inégalités de comparaison pour les points d'itération du processus d'optimisation. Cet article introduit le concept de quasi-linéarisation dans le domaine de l'optimisation et propose un nouveau cadre d'analyse pour l'optimisation géodésiquement convexe. En exploitant cette technique, nous établissons des taux de convergence de pointe pour les paramètres déterministes et stochastiques sous des hypothèses plus faibles qu'auparavant. La technique de quasi-linéarisation pourrait s'avérer précieuse pour d'autres problèmes d'optimisation non-euclidiens.
Cet article étudie les problèmes d'optimisation sur les variétés de Hadamard:
minx∈Mf(x)
où M est une variété de Hadamard équipée d'une métrique riemannienne g.
Limitations des méthodes existantes: L'approche classique de Zhang et Sra repose sur deux hypothèses fortes:
(A1) Une borne inférieure uniforme de la courbure sectionnelle (condition CBB)
(A2) Une borne supérieure a priori du diamètre de la trajectoire
Problèmes pratiques: De nombreuses variétés de Hadamard importantes ne satisfont pas la condition CBB, par exemple les variétés à produit déformé, dont la courbure peut tendre vers l'infini négatif.
Défi central: Comment éliminer les hypothèses (A1) et (A2) tout en maintenant les taux de convergence de pointe?
Introduction du cadre de quasi-linéarisation: Application pour la première fois du concept de quasi-linéarisation de Berg et Nikolaev à l'analyse des problèmes d'optimisation
Élimination des hypothèses fortes: Établissement de garanties de convergence sans nécessiter de borne inférieure de courbure ni d'hypothèse de domaine borné
Optimisation déterministe: Réalisation d'un taux de convergence O(1/t) pour les fonctions géodésiquement convexes
Optimisation stochastique: Réalisation d'un taux de convergence Õ(1/√t) pour les fonctions géodésiquement convexes lisses
Percée théorique: Fourniture d'une réponse affirmative à la Question (Q), c'est-à-dire que les taux de convergence optimaux peuvent être maintenus sous des hypothèses plus faibles
Théorème 1 (Cas Déterministe): Soit f une fonction géodésiquement convexe sur la variété de Hadamard M. L'algorithme de gradient proximal satisfait:
f(xt)−f(x∗)≤ηt∣x0x∗∣2
Théorème 2 (Cas Stochastique): Sous l'hypothèse de variance bornée, l'algorithme de gradient proximal stochastique avec pas ηt=2Lt1 satisfait:
∑t=1Tαt1∑t=1Tαt(EF(xt)−F(x∗))≤2∑t=1Tαt∣x0x∗∣2+∑t=1Tαtσ2log(T+1)
Travaux Classiques: Bonnabel (2013) et Zhang & Sra (2016) ont établi le cadre d'analyse fondamental
Recherches Ultérieures: Plusieurs travaux ont tenté de relâcher les hypothèses, mais aucun n'a complètement résolu la Question (Q)
Trajectoire Technique: Les méthodes traditionnelles reposent sur le théorème de comparaison triangulaire de Toponogov; cet article ouvre une nouvelle voie via la quasi-linéarisation
Berg & Nikolaev (2008): Travail original sur la quasi-linéarisation
Zhang & Sra (2016): Analyse classique de l'optimisation géodésiquement convexe
Bonnabel (2013): Descente de gradient stochastique sur variétés riemanniennes
Plusieurs travaux récents sur l'optimisation de variétés de Hadamard
Évaluation Globale: Cet article est un travail théorique de haute qualité qui résout avec succès un problème ouvert important dans le domaine de l'optimisation géodésiquement convexe en introduisant la technique de quasi-linéarisation. Bien qu'il manque d'expériences numériques, ses contributions théoriques sont significatives et fournissent un nouveau cadre analytique et de nouveaux outils pour l'optimisation non-euclidienne.