In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
- ID de l'article: 2507.06737
- Titre: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
- Auteur: Huang Chengzhi
- Classification: math.OC (Optimisation et Contrôle)
- Date de publication: 17 octobre 2025
- Lien de l'article: https://arxiv.org/abs/2507.06737
Cet article propose un nouveau schéma de coefficients d'extrapolation et un terme d'extrapolation innovant, et développe un algorithme de gradient proximal accéléré. L'algorithme réalise un taux de convergence sublinéaire. Le schéma proposé ne nécessite que la satisfaction de conditions initiales modérées par la séquence d'estimations de constantes de Lipschitz, sous lesquelles on peut dériver des propriétés d'égalité essentielles pour soutenir l'analyse de convergence. Les expériences numériques valident l'efficacité et les performances pratiques de la méthode proposée.
- Problème à résoudre: Problèmes d'optimisation multiobjectif, en particulier les problèmes d'optimisation multiobjectif sans contrainte de structure composite:
minx∈RnF(x)≡(f1(x)+g1(x),…,fm(x)+gm(x))T
où fi sont des fonctions convexes lisses et gi sont des fonctions convexes (potentiellement non lisses).
- Importance du problème: L'optimisation multiobjectif est largement présente dans les applications pratiques, telles que la restauration d'images et la détection comprimée. Ces problèmes n'admettent généralement pas une solution optimale unique, mais plutôt un ensemble de solutions composées de solutions Pareto optimales.
- Limitations des méthodes existantes:
- Tanabe et al. ont étendu FISTA à l'optimisation multiobjectif, réalisant un taux de convergence O(1/k2)
- Les travaux de Sonntag et al. et Zhang et al. présentent des preuves théoriques incomplètes, dont l'analyse de convergence dépend de la non-négativité de la fonction auxiliaire σ(z)=mini=1,…,mFi(xk)−Fi(z), une condition difficile à garantir
- Motivation de la recherche: Surmonter les défauts de l'analyse théorique des méthodes existantes, proposer une méthode avec des exigences plus modérées sur l'estimation initiale des constantes de Lipschitz, et éviter la dépendance à la non-négativité de σ par des égalités clés.
- Proposition d'un nouveau schéma d'extrapolation: Adoption de la forme d'extrapolation yk=xk+k+α−1k+α−4(xk−xk−1), où α≥3
- Établissement de conditions initiales modérées: Nécessite seulement que la séquence d'estimations de constantes de Lipschitz satisfasse des conditions initiales plus faibles
- Dérivation de propriétés d'égalité clés: Évite la dépendance à la non-négativité de la fonction auxiliaire, perfectionnant l'analyse théorique
- Preuve d'un taux de convergence sublinéaire: Réalise un taux de convergence O(1/k2) dans le cas lisse et O(1/k) dans le cas non lisse
- Extension au cas non lisse: Traitement des problèmes d'optimisation multiobjectif complètement non lisses par des techniques de lissage
Considérons le problème d'optimisation multiobjectif sans contrainte de structure composite (MOP):
minx∈RnF(x)=(f1(x)+g1(x),…,fm(x)+gm(x))T
où:
- fi:Rn→R sont des fonctions convexes continûment différentiables
- gi:Rn→R sont des fonctions convexes (potentiellement non lisses)
- L'objectif est de trouver une solution faiblement Pareto optimale
Sous-problème principal:
minz∈RnϕL(f)(z;x,y)=maxi=1,…,m[⟨∇fi(y),z−y⟩+gi(z)+fi(y)−Fi(x)]+2L(f)∥z−y∥2
Étapes de l'algorithme:
- Calcul du point d'extrapolation: yk=xk+k+α−1k+α−4(xk−xk−1)
- Résolution du sous-problème: xk+1=psk(xk,yk)
- Mise à jour des paramètres: sk+1=ηsk, où η=(k+α−1)(k+α−3)(k+α−2)2
Conditions sur les paramètres:
- Quand α>3: 0<α−3α−2s0<L(f)1
- Quand α=3: 0<s0<L(f)1
Approximation des fonctions non lisses fi(x) par des fonctions lissées f~i(x,μ), où la fonction lissée satisfait:
- Différentiabilité continue: Pour μ>0 fixé, f~(⋅,μ) est continûment différentiable
- Cohérence: limz→x,μ↓0f~(z,μ)=f(x)
- Cohérence du gradient: {limz→x,μ↓0∇f~(z,μ)}⊆∂f(x)
- Conception nouvelle des coefficients d'extrapolation: Par le biais d'une méthode spécifique de mise à jour des paramètres η=(k+α−1)(k+α−3)(k+α−2)2, on assure que sk<L(f)1 reste valide
- Dérivation d'égalités clés: Par des manipulations algébriques astucieuses et des choix de paramètres, on évite la dépendance à la non-négativité de σk(z)
- Cadre unifié: Quand α=3, le cadre se réduit aux méthodes existantes, mais fournit une analyse théorique plus complète
L'article mentionne des expériences numériques sur trois problèmes d'optimisation à trois objectifs:
- Problème BK1&ℓ1
- Problème JOS1&ℓ1
- Problème SP1&ℓ1
Utilisation de la fonction de mérite u0(x)=supz∈Rnmini=1,…,m[Fi(x)−Fi(z)] pour évaluer les performances de l'algorithme, qui satisfait:
- u0(x)≥0 pour tout x
- x est faiblement Pareto optimal si et seulement si u0(x)=0
- Critère d'arrêt: ∥xk−xk+1∥<ε
- Pour le cas non lisse, également μk<ε
- Mise à jour des paramètres: μk+1=k+α−1k+α−2μk, sk+1=k+α−3k+α−2sk
L'article présente des graphiques du front de Pareto pour trois problèmes d'optimisation à trois objectifs, mais les résultats numériques spécifiques et les données de comparaison de performance ne sont pas complets dans le document fourni.
Cas lisse (Théorème 4.3):
u0(xk)≤2(k+α−1)2L(f)(α−1)2R
réalisant un taux de convergence O(1/k2).
Cas non lisse (Théorème 6.2):
u0(xk+1)≤O(k1)
réalisant un taux de convergence O(1/k).
- Extension FISTA multiobjectif: Tanabe et al. ont d'abord étendu FISTA à l'optimisation multiobjectif, réalisant un taux de convergence O(1/k2)
- Variantes monotones: Nishimura et al. ont proposé une variante monotone de FISTA multiobjectif
- Cadre généralisé: Tanabe et al. ont généralisé le cadre en introduisant des hyperparamètres au cas uniobjectif
- Schémas de type Nesterov: Sonntag et al. et Zhang et al. ont tenté d'utiliser des termes d'extrapolation plus efficaces, mais l'analyse théorique est incomplète
- Méthodes non lisses: Gebken et al. ont proposé un algorithme de descente de sous-gradient pour l'optimisation multiobjectif non lisse
- Proposition d'une méthode de gradient proximal accéléré avec nouveau terme d'extrapolation, applicable à l'optimisation multiobjectif lisse et non lisse
- Établissement d'une théorie de convergence complète, évitant les défauts théoriques des méthodes existantes
- Réalisation d'un taux de convergence O(1/k2) dans le cas lisse et O(1/k) dans le cas non lisse
- Partie expérimentale insuffisante: Les résultats des expériences numériques sont présentés de manière incomplète, manquant de comparaisons détaillées de performance
- Restrictions sur le choix des paramètres: Exigences spécifiques sur les paramètres initiaux s0 et α
- Taux de convergence plus lent dans le cas non lisse: Par rapport au cas lisse, la version non lisse présente un taux de convergence réduit à O(1/k)
- Exploration de meilleures techniques de lissage pour améliorer le taux de convergence dans le cas non lisse
- Étude de stratégies de sélection de paramètres adaptatifs
- Extension aux problèmes d'optimisation multiobjectif avec contraintes
- Contribution théorique significative: Résout les défauts clés de l'analyse théorique des méthodes existantes, fournissant une preuve de convergence complète
- Conception de méthode astucieuse: Par le biais d'une stratégie spécifique de mise à jour des paramètres, on assure les garanties théoriques de l'algorithme
- Unité du cadre: Intègre les cas lisse et non lisse dans un cadre unifié
- Rigueur mathématique: Les preuves sont détaillées et la logique est claire
- Vérification expérimentale insuffisante: La partie des expériences numériques est trop simple, manquant de comparaisons détaillées avec d'autres méthodes avancées
- Analyse de praticabilité manquante: Manque d'analyse approfondie de la complexité computationnelle et des scénarios d'application pratique
- Sensibilité aux paramètres non discutée: Pas d'analyse de l'impact du choix des paramètres sur les performances de l'algorithme
- Valeur théorique élevée: Fournit une base théorique plus complète pour les méthodes accélérées d'optimisation multiobjectif
- Valeur pratique à vérifier: Nécessite plus d'expériences pour valider son efficacité sur des problèmes réels
- Bonne reproductibilité: Description claire de l'algorithme et analyse théorique complète
- Problèmes d'optimisation multiobjectif avec structure composite
- Domaines d'application tels que le traitement d'images et la détection comprimée
- Scénarios d'optimisation nécessitant des garanties théoriques
L'article cite des références importantes du domaine de l'optimisation multiobjectif, notamment:
- Travaux fondateurs de Tanabe et al. sur FISTA multiobjectif
- Théories connexes des méthodes d'accélération de Nesterov
- Littérature connexe sur les techniques de lissage
- Fondements théoriques classiques de l'optimisation multiobjectif
Évaluation Globale: Cet article est une contribution théorique remarquable qui résout avec succès les défauts théoriques des méthodes existantes de gradient proximal accéléré multiobjectif, fournissant une analyse de convergence complète. Cependant, l'article laisse place à l'amélioration en matière de vérification expérimentale et d'analyse de praticabilité.