In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
- ID del Artículo: 2507.06737
- Título: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
- Autor: Huang Chengzhi
- Clasificación: math.OC (Optimización y Control)
- Fecha de Publicación: 17 de octubre de 2025
- Enlace del Artículo: https://arxiv.org/abs/2507.06737
En este artículo se propone un nuevo esquema de coeficientes de extrapolación y término de extrapolación, desarrollando un algoritmo de gradiente proximal acelerado. El algoritmo logra una tasa de convergencia sublineal. El esquema propuesto solo requiere que la secuencia de estimaciones de constantes de Lipschitz satisfaga condiciones iniciales moderadas, bajo las cuales se pueden derivar propiedades de igualdad críticas para respaldar el análisis de convergencia. Los experimentos numéricos validan la efectividad y el desempeño práctico del método propuesto.
- Problema a Resolver: Problemas de optimización multiobjetivo, particularmente problemas multiobjetivo sin restricciones de estructura compuesta:
minx∈RnF(x)≡(f1(x)+g1(x),…,fm(x)+gm(x))T
donde fi son funciones convexas suaves y gi son funciones convexas (posiblemente no suaves).
- Importancia del Problema: La optimización multiobjetivo existe ampliamente en aplicaciones prácticas, como recuperación de imágenes y detección comprimida. Estos problemas típicamente no tienen una única solución óptima, sino un conjunto de soluciones compuesto por soluciones óptimas de Pareto.
- Limitaciones de Métodos Existentes:
- Tanabe et al. extendieron FISTA a optimización multiobjetivo, logrando una tasa de convergencia O(1/k2)
- Los trabajos de Sonntag et al. y Zhang et al. presentan pruebas teóricas incompletas, cuyo análisis de convergencia depende de la no negatividad de la función auxiliar σ(z)=mini=1,…,mFi(xk)−Fi(z), condición difícil de garantizar
- Motivación de la Investigación: Superar los defectos en el análisis teórico de métodos existentes, proponer métodos con requisitos más moderados para estimaciones iniciales de constantes de Lipschitz, y evitar la dependencia de la no negatividad de σ mediante igualdades clave.
- Propuesta de Nuevo Término de Extrapolación: Adopción de la forma de extrapolación yk=xk+k+α−1k+α−4(xk−xk−1), donde α≥3
- Establecimiento de Condiciones Iniciales Moderadas: Solo se requiere que la secuencia de estimaciones de constantes de Lipschitz satisfaga condiciones iniciales débiles
- Derivación de Propiedades de Igualdad Clave: Se evita la dependencia de la no negatividad de la función auxiliar, perfeccionando el análisis teórico
- Prueba de Tasa de Convergencia Sublineal: Se logra tasa de convergencia O(1/k2) en caso suave y O(1/k) en caso no suave
- Extensión a Caso No Suave: Manejo de problemas de optimización multiobjetivo completamente no suaves mediante técnicas de suavización
Considérese el problema de optimización multiobjetivo sin restricciones de estructura compuesta (MOP):
minx∈RnF(x)=(f1(x)+g1(x),…,fm(x)+gm(x))T
Donde:
- fi:Rn→R son funciones convexas continuamente diferenciables
- gi:Rn→R son funciones convexas (posiblemente no suaves)
- El objetivo es encontrar soluciones débilmente óptimas de Pareto
Subproblema Principal:
minz∈RnϕL(f)(z;x,y)=maxi=1,…,m[⟨∇fi(y),z−y⟩+gi(z)+fi(y)−Fi(x)]+2L(f)∥z−y∥2
Pasos del Algoritmo:
- Calcular punto de extrapolación: yk=xk+k+α−1k+α−4(xk−xk−1)
- Resolver subproblema: xk+1=psk(xk,yk)
- Actualizar parámetros: sk+1=ηsk, donde η=(k+α−1)(k+α−3)(k+α−2)2
Condiciones de Parámetros:
- Cuando α>3: 0<α−3α−2s0<L(f)1
- Cuando α=3: 0<s0<L(f)1
Aproximación de funciones no suaves fi(x) mediante funciones suavizadas f~i(x,μ), donde la función suavizada satisface:
- Diferenciabilidad continua: Para μ>0 fijo, f~(⋅,μ) es continuamente diferenciable
- Consistencia: limz→x,μ↓0f~(z,μ)=f(x)
- Consistencia del gradiente: {limz→x,μ↓0∇f~(z,μ)}⊆∂f(x)
- Nuevo Diseño de Coeficientes de Extrapolación: Mediante la estrategia específica de actualización de parámetros η=(k+α−1)(k+α−3)(k+α−2)2 se asegura que sk<L(f)1 se mantenga siempre
- Derivación de Igualdades Clave: Mediante manipulación algebraica ingeniosa y selección de parámetros, se evita la dependencia de la no negatividad de σk(z)
- Marco Unificado: Cuando α=3 se degenera en métodos existentes, pero proporciona análisis teórico más completo
El artículo menciona experimentos numéricos en tres problemas de optimización triobjetivo:
- Problema BK1&ℓ1
- Problema JOS1&ℓ1
- Problema SP1&ℓ1
Se utiliza la función de mérito u0(x)=supz∈Rnmini=1,…,m[Fi(x)−Fi(z)] para evaluar el desempeño del algoritmo, que satisface:
- u0(x)≥0 para todo x
- x es débilmente óptimo de Pareto si y solo si u0(x)=0
- Criterio de parada: ∥xk−xk+1∥<ε
- Para caso no suave también se requiere μk<ε
- Actualización de parámetros: μk+1=k+α−1k+α−2μk, sk+1=k+α−3k+α−2sk
El artículo presenta gráficos del frente de Pareto para tres problemas de optimización triobjetivo, aunque los resultados numéricos específicos y datos de comparación de desempeño no están completos en el documento proporcionado.
Caso Suave (Teorema 4.3):
u0(xk)≤2(k+α−1)2L(f)(α−1)2R
Se logra una tasa de convergencia O(1/k2).
Caso No Suave (Teorema 6.2):
u0(xk+1)≤O(k1)
Se logra una tasa de convergencia O(1/k).
- Extensión FISTA Multiobjetivo: Tanabe et al. extendieron por primera vez FISTA a optimización multiobjetivo, logrando tasa de convergencia O(1/k2)
- Variantes Monótonas: Nishimura et al. propusieron variante monótona de FISTA multiobjetivo
- Marco Generalizado: Tanabe et al. generalizaron el marco introduciendo hiperparámetros al caso uniobjetivo
- Esquemas de Tipo Nesterov: Sonntag et al. y Zhang et al. intentaron usar términos de extrapolación más efectivos, pero con análisis teórico incompleto
- Métodos No Suaves: Gebken et al. propusieron algoritmo de descenso de subgradiente para optimización multiobjetivo no suave
- Se propone método de gradiente proximal acelerado con nuevo término de extrapolación, aplicable a optimización multiobjetivo suave y no suave
- Se establece teoría de convergencia completa, evitando defectos teóricos de métodos existentes
- Se logra tasa de convergencia O(1/k2) en caso suave y O(1/k) en caso no suave
- Parte Experimental Insuficiente: Presentación incompleta de resultados de experimentos numéricos, falta de comparaciones detalladas de desempeño
- Restricciones en Selección de Parámetros: Requisitos específicos para parámetro inicial s0 y α
- Tasa de Convergencia Más Lenta en Caso No Suave: Comparado con caso suave, la versión no suave tiene tasa de convergencia reducida a O(1/k)
- Explorar técnicas de suavización mejoradas para aumentar tasa de convergencia en caso no suave
- Investigar estrategias de selección de parámetros adaptativos
- Extender a problemas de optimización multiobjetivo con restricciones
- Contribución Teórica Significativa: Resuelve defectos clave en análisis teórico de métodos existentes, proporcionando prueba de convergencia completa
- Diseño de Método Ingenioso: Mediante estrategia específica de actualización de parámetros se aseguran garantías teóricas del algoritmo
- Unidad del Marco: Integra casos suave y no suave en marco unificado
- Rigor Matemático: Proceso de prueba detallado, lógica clara
- Verificación Experimental Insuficiente: Parte de experimentos numéricos demasiado simple, falta comparación detallada con otros métodos avanzados
- Análisis de Practicidad Deficiente: Falta análisis profundo de complejidad computacional del algoritmo y escenarios de aplicación práctica
- Sensibilidad de Parámetros No Discutida: No se analiza impacto de selección de parámetros en desempeño del algoritmo
- Valor Teórico Alto: Proporciona base teórica más sólida para métodos acelerados en optimización multiobjetivo
- Valor Práctico Pendiente de Verificación: Requiere más experimentos para verificar efectividad en problemas prácticos
- Reproducibilidad Buena: Descripción clara del algoritmo, análisis teórico completo
- Problemas de optimización multiobjetivo con estructura compuesta
- Campos de aplicación como procesamiento de imágenes y detección comprimida
- Escenarios de optimización que requieren garantías teóricas
El artículo cita literatura importante en el campo de optimización multiobjetivo, incluyendo:
- Trabajo pionero de Tanabe et al. sobre FISTA multiobjetivo
- Teoría relacionada de métodos acelerados de Nesterov
- Literatura relacionada con técnicas de suavización
- Fundamentos teóricos clásicos de optimización multiobjetivo
Evaluación General: Este es un artículo con contribución teórica destacada que resuelve exitosamente defectos teóricos en métodos de gradiente proximal acelerado multiobjetivo existentes, proporcionando análisis de convergencia completo. Sin embargo, el artículo aún tiene espacio para mejora en verificación experimental y análisis de practicidad.