In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
- ID статьи: 2507.06737
- Название: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
- Автор: Huang Chengzhi
- Классификация: math.OC (Оптимизация и управление)
- Дата публикации: 17 октября 2025
- Ссылка на статью: https://arxiv.org/abs/2507.06737
В данной работе предложена новая схема коэффициентов экстраполяции и член экстраполяции, разработан ускоренный алгоритм проксимального градиента. Алгоритм достигает сублинейной скорости сходимости. Предложенная схема требует лишь мягких начальных условий для последовательности оценок констант Липшица, при которых можно вывести ключевые свойства равенства для поддержки анализа сходимости. Численные эксперименты подтверждают эффективность и практическую производительность предложенного метода.
- Решаемая проблема: Задачи многокритериальной оптимизации, в частности, составные неограниченные задачи многокритериальной оптимизации:
minx∈RnF(x)≡(f1(x)+g1(x),…,fm(x)+gm(x))T
где fi — гладкие выпуклые функции, gi — выпуклые функции (возможно, негладкие).
- Важность проблемы: Многокритериальная оптимизация широко встречается в практических приложениях, таких как восстановление изображений, сжатое зондирование и другие области. Такие задачи обычно не имеют единственного оптимального решения, а состоят из множества решений, образующих множество оптимальных по Парето решений.
- Ограничения существующих методов:
- Tanabe и др. расширили FISTA на многокритериальную оптимизацию, достигнув скорости сходимости O(1/k2)
- Работы Sonntag и др. и Zhang и др. имеют неполные теоретические доказательства; их анализ сходимости зависит от неотрицательности вспомогательной функции σ(z)=mini=1,…,mFi(xk)−Fi(z), что трудно гарантировать
- Исследовательская мотивация: Преодолеть недостатки теоретического анализа существующих методов, предложить метод с более мягкими требованиями к начальной оценке констант Липшица и избежать зависимости от неотрицательности σ через ключевые свойства равенства.
- Предложена новая схема члена экстраполяции: Используется форма экстраполяции yk=xk+k+α−1k+α−4(xk−xk−1), где α≥3
- Установлены мягкие начальные условия: Требуются лишь слабые начальные условия для последовательности оценок констант Липшица
- Выведены ключевые свойства равенства: Избегается зависимость от неотрицательности вспомогательной функции, совершенствуется теоретический анализ
- Доказана сублинейная скорость сходимости: В гладком случае достигается скорость O(1/k2), в негладком случае — O(1/k)
- Расширение на негладкий случай: Полностью негладкие задачи многокритериальной оптимизации обрабатываются с помощью техники сглаживания
Рассматривается составная неограниченная задача многокритериальной оптимизации (MOP):
minx∈RnF(x)=(f1(x)+g1(x),…,fm(x)+gm(x))T
где:
- fi:Rn→R — непрерывно дифференцируемые выпуклые функции
- gi:Rn→R — выпуклые функции (возможно, негладкие)
- Цель — найти слабо оптимальное по Парето решение
Основная подзадача:
minz∈RnϕL(f)(z;x,y)=maxi=1,…,m[⟨∇fi(y),z−y⟩+gi(z)+fi(y)−Fi(x)]+2L(f)∥z−y∥2
Шаги алгоритма:
- Вычисление точки экстраполяции: yk=xk+k+α−1k+α−4(xk−xk−1)
- Решение подзадачи: xk+1=psk(xk,yk)
- Обновление параметра: sk+1=ηsk, где η=(k+α−1)(k+α−3)(k+α−2)2
Условия на параметры:
- При α>3: 0<α−3α−2s0<L(f)1
- При α=3: 0<s0<L(f)1
Через функцию сглаживания f~i(x,μ) аппроксимируются негладкие функции fi(x), где функция сглаживания удовлетворяет:
- Непрерывная дифференцируемость: для фиксированного μ>0, f~(⋅,μ) непрерывно дифференцируема
- Согласованность: limz→x,μ↓0f~(z,μ)=f(x)
- Согласованность градиентов: {limz→x,μ↓0∇f~(z,μ)}⊆∂f(x)
- Новая конструкция коэффициентов экстраполяции: Через специфический способ обновления параметров η=(k+α−1)(k+α−3)(k+α−2)2 обеспечивается, что sk<L(f)1 всегда выполняется
- Вывод ключевых свойств равенства: Через тщательные алгебраические манипуляции и выбор параметров избегается зависимость от неотрицательности σk(z)
- Единая схема: При α=3 вырождается в существующие методы, но обеспечивает более полный теоретический анализ
В статье упоминаются численные эксперименты на трех трёхкритериальных задачах оптимизации:
- Задача BK1&ℓ1
- Задача JOS1&ℓ1
- Задача SP1&ℓ1
Используется функция достоинства u0(x)=supz∈Rnmini=1,…,m[Fi(x)−Fi(z)] для оценки производительности алгоритма, которая удовлетворяет:
- u0(x)≥0 для всех x
- x оптимально по Парето тогда и только тогда, когда u0(x)=0
- Критерий остановки: ∥xk−xk+1∥<ε
- Для негладкого случая также требуется μk<ε
- Обновление параметров: μk+1=k+α−1k+α−2μk, sk+1=k+α−3k+α−2sk
В статье представлены графики фронта Парето для трех трёхкритериальных задач оптимизации, однако конкретные численные результаты и данные сравнения производительности в предоставленном документе неполные.
Гладкий случай (Theorem 4.3):
u0(xk)≤2(k+α−1)2L(f)(α−1)2R
достигается скорость сходимости O(1/k2).
Негладкий случай (Theorem 6.2):
u0(xk+1)≤O(k1)
достигается скорость сходимости O(1/k).
- Расширение многокритериального FISTA: Tanabe и др. впервые расширили FISTA на многокритериальную оптимизацию, достигнув скорости сходимости O(1/k2)
- Монотонные варианты: Nishimura и др. предложили монотонный вариант многокритериального FISTA
- Обобщённая схема: Tanabe и др. расширили схему на однокритериальный случай путём введения гиперпараметра
- Схемы типа Нестерова: Sonntag и др. и Zhang и др. попытались использовать более эффективные члены экстраполяции, но теоретический анализ неполный
- Негладкие методы: Gebken и др. предложили алгоритм субградиентного спуска для негладкой многокритериальной оптимизации
- Предложен ускоренный метод проксимального градиента с новым членом экстраполяции, применимый к гладкой и негладкой многокритериальной оптимизации
- Установлена полная теория сходимости, избегающая теоретических недостатков существующих методов
- Гладкий случай достигает скорости сходимости O(1/k2), негладкий случай — O(1/k)
- Недостаточная экспериментальная часть: Результаты численных экспериментов представлены неполно, отсутствуют детальные сравнения производительности
- Ограничения выбора параметров: Имеются специфические требования к начальному параметру s0 и α
- Более медленная сходимость в негладком случае: По сравнению с гладким случаем, скорость сходимости негладкой версии снижается до O(1/k)
- Исследование лучших техник сглаживания для повышения скорости сходимости в негладком случае
- Изучение стратегий адаптивного выбора параметров
- Расширение на задачи многокритериальной оптимизации с ограничениями
- Значительный теоретический вклад: Решены ключевые недостатки теоретического анализа существующих методов, обеспечено полное доказательство сходимости
- Искусное проектирование метода: Специфическая стратегия обновления параметров обеспечивает теоретические гарантии алгоритма
- Единство схемы: Гладкий и негладкий случаи объединены в единую схему
- Математическая строгость: Доказательства детальны, логика ясна
- Недостаточная экспериментальная проверка: Часть численных экспериментов слишком проста, отсутствуют детальные сравнения с другими передовыми методами
- Отсутствие анализа практичности: Недостаёт глубокого анализа вычислительной сложности и практических сценариев применения
- Не обсуждена чувствительность к параметрам: Не проанализировано влияние выбора параметров на производительность алгоритма
- Высокая теоретическая ценность: Обеспечивает более совершенную теоретическую базу для ускоренных методов многокритериальной оптимизации
- Практическая ценность требует проверки: Необходимы дополнительные эксперименты для проверки эффективности на практических задачах
- Хорошая воспроизводимость: Описание алгоритма ясно, теоретический анализ полный
- Задачи многокритериальной оптимизации с составной структурой
- Приложения в обработке изображений и сжатом зондировании
- Сценарии оптимизации, требующие теоретических гарантий
В статье цитируются важные работы в области многокритериальной оптимизации, включая:
- Основополагающие работы Tanabe и др. по многокритериальному FISTA
- Теорию ускоренных методов Нестерова
- Литературу по техникам сглаживания
- Классическую теорию многокритериальной оптимизации
Общая оценка: Это статья с выдающимся теоретическим вкладом, успешно решившая теоретические недостатки существующих ускоренных методов проксимального градиента для многокритериальной оптимизации и обеспечившая полный анализ сходимости. Однако статья имеет возможности для улучшения в области экспериментальной проверки и анализа практичности.