Forward Euler for Wasserstein Gradient Flows: Breakdown and Regularization
Xu, Li
Wasserstein gradient flows have become a central tool for optimization problems over probability measures. A natural numerical approach is forward-Euler time discretization. We show, however, that even in the simple case where the energy functional is the Kullback-Leibler (KL) divergence against a smooth target density, forward-Euler can fail dramatically: the scheme does not converge to the gradient flow, despite the fact that the first variation $\nabla\frac{δF}{δÏ}$ remains formally well defined at every step. We identify the root cause as a loss of regularity induced by the discretization, and prove that a suitable regularization of the functional restores the necessary smoothness, making forward-Euler a viable solver that converges in discrete time to the global minimizer.
academic
Forward Euler для потоков градиента Вассерштейна: Разрушение и регуляризация
Потоки градиента Вассерштейна стали основным инструментом для задач оптимизации вероятностных мер. Явная схема Эйлера является естественным численным методом. Однако в данной работе доказано, что даже в простом случае, когда функционал энергии представляет собой дивергенцию Кульбака-Лейблера (KL) для гладкой целевой плотности, метод явного Эйлера катастрофически отказывает: схема не сходится к потоку градиента, несмотря на то, что первая вариация ∇δρδF остаётся формально корректно определённой на каждом шаге. Авторы выявляют коренную причину — потерю регулярности, вызванную дискретизацией, и доказывают, что надлежащая регуляризация функционала восстанавливает необходимую гладкость, делая явный Эйлер жизнеспособным решателем, сходящимся к глобальному минимуму в дискретном времени.
Оптимизация в пространстве вероятностных мер: Задача минимизации функционала F[ρ] в пространстве вероятностных мер P(Ω) широко встречается в машинном обучении и статистической физике
Потоки градиента Вассерштейна: По аналогии с градиентным спуском в евклидовом пространстве, потоки градиента в метрике Вассерштейна обеспечивают естественную основу для оптимизации вероятностных мер
Численные вызовы: Численное решение PDE потока градиента требует временной дискретизации, явный Эйлер является наиболее интуитивным выбором
Остаётся ли метод явного Эйлера эффективным в потоках градиента Вассерштейна, несмотря на его успех в классических PDE? Особенно для фундаментальных функционалов, таких как дивергенция KL.
Теорема 4.3: При предположениях 4.1, Fε одновременно L-дифференцируем и W-дифференцируем на P2(C), с единообразным градиентом:
∇WFε[ρ]=∂ρFε[ρ]=∇δρδFερ
Данная работа цитирует 41 связанную работу, охватывающую теорию оптимального переноса, потоки градиента Вассерштейна, численный анализ и другие важные области, обеспечивая прочную теоретическую основу для исследования.
Резюме технических ключевых моментов:
Центральная роль регулярности в потоках градиента Вассерштейна