2025-11-10T02:43:53.338320

Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization

Huang
In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
academic

Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization

基本信息

  • 论文ID: 2507.06737
  • 标题: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
  • 作者: Huang Chengzhi
  • 分类: math.OC (Optimization and Control)
  • 发表时间: October 17, 2025
  • 论文链接: https://arxiv.org/abs/2507.06737

摘要

本文提出了一种新的外推系数方案和外推项,并开发了一种加速近似梯度算法。该算法实现了次线性收敛率。所提出的方案仅要求Lipschitz常数估计序列满足温和的初始条件,在此条件下可以导出关键的等式性质来支持收敛性分析。数值实验验证了所提方法的有效性和实际性能。

研究背景与动机

  1. 要解决的问题:多目标优化问题,特别是复合无约束多目标优化问题: minxRnF(x)(f1(x)+g1(x),,fm(x)+gm(x))T\min_{x \in \mathbb{R}^n} F(x) \equiv (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T 其中fif_i是光滑凸函数,gig_i是凸函数(可能非光滑)。
  2. 问题重要性:多目标优化在实际应用中广泛存在,如图像恢复、压缩感知等领域。这类问题通常不存在单一最优解,而是由Pareto最优解组成的解集。
  3. 现有方法局限性
    • Tanabe等人将FISTA扩展到多目标优化,实现了O(1/k2)O(1/k^2)收敛率
    • Sonntag等人和Zhang等人的工作存在理论证明不完整的问题,其收敛性分析依赖于辅助函数σ(z)=mini=1,,mFi(xk)Fi(z)\sigma(z) = \min_{i=1,\ldots,m} F_i(x_k) - F_i(z)的非负性,这一条件难以保证
  4. 研究动机:克服现有方法理论分析中的缺陷,提出对Lipschitz常数初始估计要求更温和的方法,并通过关键等式避免对σ\sigma非负性的依赖。

核心贡献

  1. 提出新的外推项方案:采用yk=xk+k+α4k+α1(xkxk1)y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})的外推形式,其中α3\alpha \geq 3
  2. 建立温和的初始条件:仅需要Lipschitz常数估计序列满足较弱的初始条件
  3. 导出关键等式性质:避免了对辅助函数非负性的依赖,完善了理论分析
  4. 证明次线性收敛率:在光滑情况下实现O(1/k2)O(1/k^2)收敛率,非光滑情况下实现O(1/k)O(1/k)收敛率
  5. 扩展到非光滑情况:通过光滑化技术处理完全非光滑的多目标优化问题

方法详解

任务定义

考虑复合无约束多目标优化问题(MOP): minxRnF(x)=(f1(x)+g1(x),,fm(x)+gm(x))T\min_{x \in \mathbb{R}^n} F(x) = (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T

其中:

  • fi:RnRf_i: \mathbb{R}^n \to \mathbb{R}是连续可微的凸函数
  • gi:RnRg_i: \mathbb{R}^n \to \mathbb{R}是凸函数(可能非光滑)
  • 目标是找到弱Pareto最优解

模型架构

光滑情况算法(Algorithm 1)

核心子问题minzRnϕL(f)(z;x,y)=maxi=1,,m[fi(y),zy+gi(z)+fi(y)Fi(x)]+L(f)2zy2\min_{z \in \mathbb{R}^n} \phi_{L(f)}(z; x, y) = \max_{i=1,\ldots,m}[\langle\nabla f_i(y), z-y\rangle + g_i(z) + f_i(y) - F_i(x)] + \frac{L(f)}{2}\|z-y\|^2

算法步骤

  1. 计算外推点:yk=xk+k+α4k+α1(xkxk1)y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})
  2. 求解子问题:xk+1=psk(xk,yk)x_{k+1} = p_{s_k}(x_k, y_k)
  3. 更新参数:sk+1=ηsks_{k+1} = \eta s_k,其中η=(k+α2)2(k+α1)(k+α3)\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}

参数条件

  • α>3\alpha > 3时:0<α2α3s0<1L(f)0 < \frac{\alpha-2}{\alpha-3}s_0 < \frac{1}{L(f)}
  • α=3\alpha = 3时:0<s0<1L(f)0 < s_0 < \frac{1}{L(f)}

非光滑情况算法(Algorithm 2)

通过光滑化函数f~i(x,μ)\tilde{f}_i(x, \mu)逼近非光滑函数fi(x)f_i(x),其中光滑化函数满足:

  • 连续可微性:对固定μ>0\mu > 0f~(,μ)\tilde{f}(\cdot, \mu)连续可微
  • 一致性:limzx,μ0f~(z,μ)=f(x)\lim_{z \to x, \mu \downarrow 0} \tilde{f}(z, \mu) = f(x)
  • 梯度一致性:{limzx,μ0f~(z,μ)}f(x)\{\lim_{z \to x, \mu \downarrow 0} \nabla\tilde{f}(z, \mu)\} \subseteq \partial f(x)

技术创新点

  1. 新的外推系数设计:通过特定的参数更新方式η=(k+α2)2(k+α1)(k+α3)\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}确保sk<1L(f)s_k < \frac{1}{L(f)}恒成立
  2. 关键等式导出:通过巧妙的代数操作和参数选择,避免了对σk(z)\sigma_k(z)非负性的依赖
  3. 统一框架:当α=3\alpha = 3时退化为已有方法,但提供了更完整的理论分析

实验设置

数据集

论文提到了三个三目标优化问题的数值实验:

  • BK1&ℓ1问题
  • JOS1&ℓ1问题
  • SP1&ℓ1问题

评价指标

使用merit函数u0(x)=supzRnmini=1,,m[Fi(x)Fi(z)]u_0(x) = \sup_{z \in \mathbb{R}^n} \min_{i=1,\ldots,m}[F_i(x) - F_i(z)]评估算法性能,该函数满足:

  • u0(x)0u_0(x) \geq 0对所有xx成立
  • xx是弱Pareto最优当且仅当u0(x)=0u_0(x) = 0

实现细节

  • 停止准则:xkxk+1<ε\|x_k - x_{k+1}\| < \varepsilon
  • 对于非光滑情况还需要μk<ε\mu_k < \varepsilon
  • 参数更新:μk+1=k+α2k+α1μk\mu_{k+1} = \frac{k+\alpha-2}{k+\alpha-1}\mu_ksk+1=k+α2k+α3sks_{k+1} = \frac{k+\alpha-2}{k+\alpha-3}s_k

实验结果

主要结果

论文展示了三个三目标优化问题的Pareto前沿图,但具体的数值结果和性能对比数据在提供的文档中并不完整。

收敛性理论结果

光滑情况(Theorem 4.3)u0(xk)L(f)(α1)22(k+α1)2Ru_0(x_k) \leq \frac{L(f)(\alpha-1)^2}{2(k+\alpha-1)^2}R 实现了O(1/k2)O(1/k^2)的收敛率。

非光滑情况(Theorem 6.2)u0(xk+1)O(1k)u_0(x_{k+1}) \leq O\left(\frac{1}{k}\right) 实现了O(1/k)O(1/k)的收敛率。

相关工作

  1. 多目标FISTA扩展:Tanabe等人首次将FISTA扩展到多目标优化,实现O(1/k2)O(1/k^2)收敛率
  2. 单调变体:Nishimura等人提出了多目标FISTA的单调变体
  3. 广义框架:Tanabe等人通过引入超参数将框架推广到单目标情况
  4. Nesterov式方案:Sonntag等人和Zhang等人尝试使用更有效的外推项,但理论分析不完整
  5. 非光滑方法:Gebken等人提出了非光滑多目标优化的次梯度下降算法

结论与讨论

主要结论

  1. 提出了具有新外推项的加速近似梯度方法,适用于光滑和非光滑多目标优化
  2. 建立了完整的收敛性理论,避免了现有方法的理论缺陷
  3. 光滑情况实现O(1/k2)O(1/k^2)收敛率,非光滑情况实现O(1/k)O(1/k)收敛率

局限性

  1. 实验部分不够充分:数值实验结果展示不完整,缺乏详细的性能对比
  2. 参数选择限制:对初始参数s0s_0α\alpha有特定要求
  3. 非光滑情况收敛率较慢:相比光滑情况,非光滑版本收敛率降为O(1/k)O(1/k)

未来方向

  1. 探索更好的光滑化技术以提高非光滑情况的收敛率
  2. 研究自适应参数选择策略
  3. 扩展到约束多目标优化问题

深度评价

优点

  1. 理论贡献显著:解决了现有方法理论分析中的关键缺陷,提供了完整的收敛性证明
  2. 方法设计巧妙:通过特定的参数更新策略确保算法的理论保证
  3. 框架统一性:将光滑和非光滑情况纳入统一框架
  4. 数学严谨性:证明过程详细,逻辑清晰

不足

  1. 实验验证不足:数值实验部分过于简单,缺乏与其他先进方法的详细对比
  2. 实用性分析欠缺:缺乏对算法计算复杂度和实际应用场景的深入分析
  3. 参数敏感性未讨论:没有分析参数选择对算法性能的影响

影响力

  1. 理论价值高:为多目标优化加速方法提供了更完善的理论基础
  2. 实用价值待验证:需要更多实验验证其在实际问题中的有效性
  3. 可复现性良好:算法描述清晰,理论分析完整

适用场景

  1. 复合结构的多目标优化问题
  2. 图像处理和压缩感知等应用领域
  3. 需要理论保证的优化场景

参考文献

论文引用了多目标优化领域的重要文献,包括:

  • Tanabe等人关于多目标FISTA的开创性工作
  • Nesterov加速方法的相关理论
  • 光滑化技术的相关文献
  • 多目标优化的经典理论基础

总体评价:这是一篇理论贡献突出的论文,成功解决了现有多目标加速近似梯度方法中的理论缺陷,提供了完整的收敛性分析。然而,论文在实验验证和实用性分析方面还有改进空间。