Convergence of two-timescale gradient descent ascent dynamics: finite-dimensional and mean-field perspectives
An, Lu
The two-timescale gradient descent-ascent (GDA) is a canonical gradient algorithm designed to find Nash equilibria in min-max games. We analyze the two-timescale GDA by investigating the effects of learning rate ratios on convergence behavior in both finite-dimensional and mean-field settings. In particular, for finite-dimensional quadratic min-max games, we obtain long-time convergence in near quasi-static regimes through the hypocoercivity method. For mean-field GDA dynamics, we investigate convergence under a finite-scale ratio using a mixed synchronous-reflection coupling technique.
academic
Сходимость двухтемповой динамики градиентного спуска-подъема: конечномерная и среднеполевая перспективы
Двухтемповой алгоритм градиентного спуска-подъема (GDA) является классическим градиентным методом поиска равновесия Нэша в минимаксных играх. В данной работе анализируется двухтемповой GDA в конечномерной и среднеполевой постановке путем изучения влияния отношения скоростей обучения на поведение сходимости. Для конечномерных квадратичных минимаксных игр получена долгосрочная сходимость в квазистатическом режиме с использованием метода субсильной монотонности. Для среднеполевой динамики GDA исследована сходимость при конечных отношениях масштабов с применением гибридной синхронной-отражающей техники связи.
Основная проблема: Минимаксные задачи оптимизации широко распространены в машинном обучении, включая генеративно-состязательные сети (GAN), многоагентное обучение с подкреплением, оптимальный транспорт и другие приложения. Стандартные алгоритмы градиентного спуска-подъема могут сходиться к предельным циклам или расходиться в невыпукло-невогнутой постановке.
Значимость: Двухтемповой GDA, использующий различные скорости обучения для обновлений спуска и подъема, стал популярной альтернативой для преодоления трудностей невыпукло-невогнутого случая. Понимание того, как отношение скоростей обучения влияет на поведение сходимости, имеет решающее значение для проектирования алгоритмов.
Существующие ограничения:
Лучшие результаты сходимости в конечномерном случае требуют сильных предположений
В среднеполевом случае существующие результаты в основном ограничены квазистатическим режимом (η ≫ 1 или η ≪ 1)
Отсутствует количественный анализ отношения скоростей обучения η
Исследовательская мотивация: Ответить на ключевой вопрос: "Как двухтемповой GDA сходится в зависимости от отношения скоростей обучения η?" и предоставить количественные ответы как для конечномерного, так и для бесконечномерного случаев.
Конечномерный анализ: Анализ динамики двухтемпового GDA для квадратичных игр методом субсильной монотонности с построением функции Ляпунова для количественной оценки связи скорости сходимости с отношением скоростей обучения η.
Проектирование предобусловливателя: Обсуждение способов проектирования предобусловливателей для двухтемповой динамики с целью снижения чувствительности к экстремальным значениям η и улучшения сходимости.
Среднеполевой анализ: Исследование сходимости энтропийно-регуляризованных минимаксных задач с использованием гибридного синхронно-отражающего метода связи, применимого к конечному диапазону значений η и локально невыпукло-невогнутым целевым функциям.
Унифицированные скорости сходимости: Получены скорости сходимости вида min{√η, 1/√η} или min{1, η} в обеих постановках, показывающие, что оптимальный выбор η должен быть близок к 1, а не находиться в квазистатическом режиме.
Двухтемповые методы: Включая классическую двухтемповую стохастическую аппроксимацию, распределенную оптимизацию, поиск неподвижных точек в обучении с подкреплением
Теория субсильной монотонности: Первоначально применялась к анализу уравнений Больцмана и Фоккера-Планка, предоставляя вариационную альтернативу спектральному анализу
Методы связи: Мощный инструмент в теории вероятностей для сравнения случайных величин, недавно расширенный на оценки сжатия для динамики Ланжевена
Статья цитирует 56 связанных работ, охватывающих важные результаты из теории оптимизации, теории вероятностей, уравнений в частных производных и других областей, обеспечивая прочную теоретическую базу для исследования.