In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
- 论文ID: 2507.06737
- 标题: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
- 作者: Huang Chengzhi
- 分类: math.OC (Optimization and Control)
- 发表时间: October 17, 2025
- 论文链接: https://arxiv.org/abs/2507.06737
本文提出了一种新的外推系数方案和外推项,并开发了一种加速近似梯度算法。该算法实现了次线性收敛率。所提出的方案仅要求Lipschitz常数估计序列满足温和的初始条件,在此条件下可以导出关键的等式性质来支持收敛性分析。数值实验验证了所提方法的有效性和实际性能。
- 要解决的问题:多目标优化问题,特别是复合无约束多目标优化问题:
minx∈RnF(x)≡(f1(x)+g1(x),…,fm(x)+gm(x))T
其中fi是光滑凸函数,gi是凸函数(可能非光滑)。
- 问题重要性:多目标优化在实际应用中广泛存在,如图像恢复、压缩感知等领域。这类问题通常不存在单一最优解,而是由Pareto最优解组成的解集。
- 现有方法局限性:
- Tanabe等人将FISTA扩展到多目标优化,实现了O(1/k2)收敛率
- Sonntag等人和Zhang等人的工作存在理论证明不完整的问题,其收敛性分析依赖于辅助函数σ(z)=mini=1,…,mFi(xk)−Fi(z)的非负性,这一条件难以保证
- 研究动机:克服现有方法理论分析中的缺陷,提出对Lipschitz常数初始估计要求更温和的方法,并通过关键等式避免对σ非负性的依赖。
- 提出新的外推项方案:采用yk=xk+k+α−1k+α−4(xk−xk−1)的外推形式,其中α≥3
- 建立温和的初始条件:仅需要Lipschitz常数估计序列满足较弱的初始条件
- 导出关键等式性质:避免了对辅助函数非负性的依赖,完善了理论分析
- 证明次线性收敛率:在光滑情况下实现O(1/k2)收敛率,非光滑情况下实现O(1/k)收敛率
- 扩展到非光滑情况:通过光滑化技术处理完全非光滑的多目标优化问题
考虑复合无约束多目标优化问题(MOP):
minx∈RnF(x)=(f1(x)+g1(x),…,fm(x)+gm(x))T
其中:
- fi:Rn→R是连续可微的凸函数
- gi:Rn→R是凸函数(可能非光滑)
- 目标是找到弱Pareto最优解
核心子问题:
minz∈RnϕL(f)(z;x,y)=maxi=1,…,m[⟨∇fi(y),z−y⟩+gi(z)+fi(y)−Fi(x)]+2L(f)∥z−y∥2
算法步骤:
- 计算外推点:yk=xk+k+α−1k+α−4(xk−xk−1)
- 求解子问题:xk+1=psk(xk,yk)
- 更新参数:sk+1=ηsk,其中η=(k+α−1)(k+α−3)(k+α−2)2
参数条件:
- 当α>3时:0<α−3α−2s0<L(f)1
- 当α=3时:0<s0<L(f)1
通过光滑化函数f~i(x,μ)逼近非光滑函数fi(x),其中光滑化函数满足:
- 连续可微性:对固定μ>0,f~(⋅,μ)连续可微
- 一致性:limz→x,μ↓0f~(z,μ)=f(x)
- 梯度一致性:{limz→x,μ↓0∇f~(z,μ)}⊆∂f(x)
- 新的外推系数设计:通过特定的参数更新方式η=(k+α−1)(k+α−3)(k+α−2)2确保sk<L(f)1恒成立
- 关键等式导出:通过巧妙的代数操作和参数选择,避免了对σk(z)非负性的依赖
- 统一框架:当α=3时退化为已有方法,但提供了更完整的理论分析
论文提到了三个三目标优化问题的数值实验:
- BK1&ℓ1问题
- JOS1&ℓ1问题
- SP1&ℓ1问题
使用merit函数u0(x)=supz∈Rnmini=1,…,m[Fi(x)−Fi(z)]评估算法性能,该函数满足:
- u0(x)≥0对所有x成立
- x是弱Pareto最优当且仅当u0(x)=0
- 停止准则:∥xk−xk+1∥<ε
- 对于非光滑情况还需要μk<ε
- 参数更新:μk+1=k+α−1k+α−2μk,sk+1=k+α−3k+α−2sk
论文展示了三个三目标优化问题的Pareto前沿图,但具体的数值结果和性能对比数据在提供的文档中并不完整。
光滑情况(Theorem 4.3):
u0(xk)≤2(k+α−1)2L(f)(α−1)2R
实现了O(1/k2)的收敛率。
非光滑情况(Theorem 6.2):
u0(xk+1)≤O(k1)
实现了O(1/k)的收敛率。
- 多目标FISTA扩展:Tanabe等人首次将FISTA扩展到多目标优化,实现O(1/k2)收敛率
- 单调变体:Nishimura等人提出了多目标FISTA的单调变体
- 广义框架:Tanabe等人通过引入超参数将框架推广到单目标情况
- Nesterov式方案:Sonntag等人和Zhang等人尝试使用更有效的外推项,但理论分析不完整
- 非光滑方法:Gebken等人提出了非光滑多目标优化的次梯度下降算法
- 提出了具有新外推项的加速近似梯度方法,适用于光滑和非光滑多目标优化
- 建立了完整的收敛性理论,避免了现有方法的理论缺陷
- 光滑情况实现O(1/k2)收敛率,非光滑情况实现O(1/k)收敛率
- 实验部分不够充分:数值实验结果展示不完整,缺乏详细的性能对比
- 参数选择限制:对初始参数s0和α有特定要求
- 非光滑情况收敛率较慢:相比光滑情况,非光滑版本收敛率降为O(1/k)
- 探索更好的光滑化技术以提高非光滑情况的收敛率
- 研究自适应参数选择策略
- 扩展到约束多目标优化问题
- 理论贡献显著:解决了现有方法理论分析中的关键缺陷,提供了完整的收敛性证明
- 方法设计巧妙:通过特定的参数更新策略确保算法的理论保证
- 框架统一性:将光滑和非光滑情况纳入统一框架
- 数学严谨性:证明过程详细,逻辑清晰
- 实验验证不足:数值实验部分过于简单,缺乏与其他先进方法的详细对比
- 实用性分析欠缺:缺乏对算法计算复杂度和实际应用场景的深入分析
- 参数敏感性未讨论:没有分析参数选择对算法性能的影响
- 理论价值高:为多目标优化加速方法提供了更完善的理论基础
- 实用价值待验证:需要更多实验验证其在实际问题中的有效性
- 可复现性良好:算法描述清晰,理论分析完整
- 复合结构的多目标优化问题
- 图像处理和压缩感知等应用领域
- 需要理论保证的优化场景
论文引用了多目标优化领域的重要文献,包括:
- Tanabe等人关于多目标FISTA的开创性工作
- Nesterov加速方法的相关理论
- 光滑化技术的相关文献
- 多目标优化的经典理论基础
总体评价:这是一篇理论贡献突出的论文,成功解决了现有多目标加速近似梯度方法中的理论缺陷,提供了完整的收敛性分析。然而,论文在实验验证和实用性分析方面还有改进空间。