In this paper, we study saddle point (SP) problems, focusing on convex-concave optimization involving functions that satisfy either two-sided quadratic functional growth (QFG) or two-sided quadratic gradient growth (QGG)--novel conditions tailored specifically for SP problems as extensions of quadratic growth conditions in minimization. These conditions relax the traditional requirement of strong convexity-strong concavity, thereby encompassing a broader class of problems. We propose a generalized accelerated primal-dual (GAPD) algorithm to solve SP problems with non-bilinear objective functions, unifying and extending existing methods. We prove that our method achieves a linear convergence rate under these relaxed conditions. Additionally, we provide examples of structured SP problems that satisfy either two-sided QFG or QGG, demonstrating the practical applicability and relevance of our approach.
- ID статьи: 2510.11990
- Название: Linear Convergence of a Unified Primal--Dual Algorithm for Convex--Concave Saddle Point Problems with Quadratic Growth
- Авторы: Cody Melcher (Университет Аризоны), Afrooz Jalilzadeh (Университет Аризоны), Erfan Yazdandoost Hamedani (Университет Аризоны)
- Классификация: math.OC (Оптимизация и управление)
- Дата публикации: 13 октября 2025 г. (препринт arXiv)
- Ссылка на статью: https://arxiv.org/abs/2510.11990
В данной работе исследуются задачи седловой точки (SP), с особым акцентом на выпукло-вогнутые задачи оптимизации, удовлетворяющие условиям двусторонней квадратичной функциональной роста (QFG) или двусторонней квадратичной роста градиента (QGG). Эти условия являются новыми условиями, специально разработанными для задач седловой точки и представляют собой расширение условий квадратичного роста в задачах минимизации. Данные условия ослабляют традиционные требования сильной выпуклости-сильной вогнутости, охватывая, таким образом, более широкий класс задач. Авторы предлагают обобщённый ускоренный алгоритм прямо-двойственного типа (GAPD) для решения задач седловой точки с невилинейными целевыми функциями, унифицируя и расширяя существующие методы. Доказано, что данный метод достигает линейной скорости сходимости при указанных ослабленных условиях. Кроме того, приводятся примеры структурированных задач седловой точки, удовлетворяющих двусторонним условиям QFG или QGG, демонстрирующие практическую применимость и релевантность метода.
В работе исследуется следующая задача седловой точки:
minx∈Xmaxy∈Yf(x,y)
где f:X×Y→R выпукла по x для любого y∈Y и вогнута по y для любого x∈X, а X⊆X и Y⊆Y — замкнутые выпуклые множества.
- Ограничения традиционных методов: Существующие результаты о линейной сходимости для задач седловой точки обычно требуют условий сильной выпуклости-сильной вогнутости, что является чрезмерно строгим ограничением для многих практических приложений.
- Широкая применимость: Задачи седловой точки имеют важные приложения в теории игр, распределённо-робастном обучении, генеративных состязательных сетях и других областях.
- Теоретический пробел: Хотя в задачах минимизации условия квадратичного роста (QFG и QGG) доказали свою эффективность для гарантирования линейной сходимости, расширение этих условий на задачи седловой точки представляет нетривиальную задачу и в значительной степени остаётся неисследованным.
- Унификация методов: Существующие алгоритмы прямо-двойственного типа, такие как APD и OGDA, не имеют единой аналитической базы.
- Введение двусторонних условий роста: Впервые расширены условия QFG и QGG на задачи седловой точки с определением двусторонних условий квадратичного функционального роста и двусторонних условий квадратичного роста градиента.
- Унифицированная схема алгоритма: Предложен обобщённый ускоренный алгоритм прямо-двойственного типа (GAPD), унифицирующий существующие методы APD и OGDA.
- Гарантии линейной сходимости: Доказано, что алгоритм GAPD достигает линейной скорости сходимости при условиях двусторонней QFG или QGG.
- Расширение на расстояния Брегмана: Аналитическая база расширена на расстояния Брегмана, повышая гибкость и применимость метода.
- Классы структурированных задач: Приведены конкретные примеры структурированных задач седловой точки, удовлетворяющих двусторонним условиям роста.
Исследование выпукло-вогнутых задач оптимизации седловой точки, где целевая функция удовлетворяет условиям двусторонней квадратичной роста, а не традиционным условиям сильной выпуклости-сильной вогнутости.
Для задачи седловой точки, если существуют константы (μx,μy)∈R++2 такие, что для любых x∈X и y∈Y выполняется:
⟨F(z)−F(zˉ),z−zˉ⟩≥2DZM(z,zˉ)
где z=[xT,yT]T, zˉ=PZ∗(z), F(z)=[∇xf(x,y)T,−∇yf(x,y)T]T, M=diag({μxIn,μyIm}).
Если существуют константы (μx,μy)∈R++2 такие, что:
f(x,yˉ)−f(xˉ,y)≥DZM(z,zˉ)
Основные правила обновления алгоритма GAPD:
- Вычисление членов импульса:
- qky=∇yf(xk,yk)−∇yf(xk−1,yk−1)
- qkx=∇xf(xk,yk)−∇xf(xk−1,yk−1)
- Обновление двойственной переменной:
yk+1=argminy∈Y{−⟨∇yf(xk,yk)+αkqky,y⟩+σk1DY(y,yk)}
- Конструирование агрегированного градиента:
sk=θk∇xf(xk,yk+1)+(1−θk)∇xf(xk,yk)+βkqkx
- Обновление прямой переменной:
xk+1=argminx∈X{⟨sk,x⟩+τk1DX(x,xk)}
- Унификация: Через параметр θk унифицируются существующие методы:
- θk=0: вырождается в OGDA
- θk=1,βk=0: вырождается в APD
- Расстояния Брегмана: Использование расстояний Брегмана вместо евклидова расстояния обеспечивает большую гибкость.
- Двусторонние условия: Впервые односторонние условия роста расширены на двусторонние версии для задач седловой точки.
Теорема 4.4: Пусть {(xk,yk)}k≥0 — последовательность, генерируемая алгоритмом 1. Предположим, что выполнены предположения 2.1-4.3, тогда для любых K≥1 и Γ≻0:
DZAK−ΓBK(zˉK,zK)≤tKt0DZA0(zˉ0,z0)
Следствие 4.5: При надлежащем выборе параметров итерационная последовательность сходится к множеству оптимальных решений с линейной скоростью:
DZ(zˉK,zK)≤DZRK(zˉ0,z0)
где RK=(1−α)cMαK+1, скорость сходимости зависит от параметра ς>0 (при QFG ς=θ, при QGG ς=2(1−θ)).
Рассматривается следующий класс структурированных выпукло-вогнутых задач седловой точки:
minx∈Xmaxy∈Yh(C1x)+⟨Ax,y⟩−g(C2y)
где h:Rp→R и g:Rq→R — сильно выпуклые функции.
Предложение 5.1: Если существуют константы ξ1,ξ2,ξ3,ξ4>0 такие, что:
- ξ1C1TC1⪰ATA, ξ2C1TC1⪰∥λ∗∥2GTG
- ξ3C2TC2⪰AAT, ξ4C2TC2⪰∥ν∗∥2FTF
то данный класс задач удовлетворяет условиям двусторонней QGG и QFG.
Рассматривается случайно сгенерированная задача седловой точки:
minx∈Rnmaxy∈Rm21∥C1x−b1∥22+⟨Ax,y⟩−21∥C2y−b2∥22
- Тестирование размерности: Тестирование проводилось при трёх различных размерностях (n,m,p,q)∈{(75,60,60,50),(150,120,120,100),(300,240,240,200)}.
- Сравнение производительности: Алгоритм GAPD превосходит стандартный метод GDA при различных значениях θ.
- Влияние параметров: Значение θ=0.99 показывает наилучшую производительность, незначительно превосходя случай θ=1.
- Условия QFG и QGG имеют важное значение как в детерминированных, так и в стохастических параметрах оптимизации
- Существующие работы в основном сосредоточены на линейной сходимости в выпуклых задачах оптимизации
- Метод Arrow-Hurwicz (GDA): сложность O(κ2log(1/ε))
- Метод внешнего градиента (EG): сложность O(κlog(1/ε))
- Оптимистичный метод градиента (OGDA): сложность O(κlog(1/ε))
- Ускоренный алгоритм прямо-двойственного типа (APD): достигает O(1/ε) и O(1/ε2) в параметрах C-C и SC-C соответственно
Условия квадратичного роста тесно связаны с анализом границ ошибок для монотонных операторов и метрической субрегулярностью.
- Успешно расширены условия квадратичного роста на задачи седловой точки с введением двусторонних условий QFG и QGG
- Алгоритм GAPD достигает линейной сходимости при ослабленных условиях, унифицируя существующие методы
- Предоставлены классы структурированных задач, удовлетворяющих новым условиям роста
- Проверка условий: Проверка двусторонних условий роста в практических приложениях может быть сложной задачей
- Выбор параметров: Выбор оптимального параметра θ требует знания, специфичного для конкретной задачи
- Обработка ограничений: Основное внимание уделяется простым множествам ограничений, обработка сложных ограничений ограничена
- Исследование поведения сходимости при односторонних условиях квадратичного роста
- Изучение приложений в распределённой оптимизации
- Расширение на более сложные задачи оптимизации с ограничениями
- Теоретическая инновация: Впервые систематически расширены условия квадратичного роста на задачи седловой точки, заполняя важный теоретический пробел
- Унифицированная база: Алгоритм GAPD элегантно унифицирует несколько существующих методов
- Практическая ценность: Ослабленные условия делают метод применимым к более широкому классу задач
- Строгий анализ: Предоставлен полный анализ сходимости и конкретные скорости сходимости
- Ограниченные эксперименты: Численные эксперименты относительно просты, отсутствует проверка на практических сценариях приложений
- Анализ соотношений условий: Анализ соотношения между двусторонними условиями QFG и QGG может быть более глубоким
- Вычислительная сложность: Вычислительная сложность каждой итерации не проанализирована подробно
- Академический вклад: Предоставляет важные теоретические инструменты для теории оптимизации седловой точки
- Практическая ценность: Унификация и гибкость метода открывают потенциал для применения в нескольких областях
- Масштабируемость: Обеспечивает прочную теоретическую базу для последующих исследований
- Состязательное обучение в машинном обучении
- Распределённо-робастная оптимизация
- Приложения в теории игр
- Выпуклые задачи оптимизации со специальной структурой
Статья цитирует 46 связанных работ, охватывающих оптимизацию седловой точки, вариационные неравенства, условия квадратичного роста и другие смежные области, обеспечивая прочную теоретическую базу для данного исследования.