2025-11-17T22:04:13.678417

A Stochastic Algorithm for Searching Saddle Points with Convergence Guarantee

Shi, Zhang, Du

Saddle points provide a hierarchical view of the energy landscape, revealing transition pathways and interconnected basins of attraction, and offering insight into the global structure, metastability, and possible collective mechanisms of the underlying system. In this work, we propose a stochastic saddle-search algorithm to circumvent exact derivative and Hessian evaluations that have been used in implementing traditional and deterministic saddle dynamics. At each iteration, the algorithm uses a stochastic eigenvector-search method, based on a stochastic Hessian, to approximate the unstable directions, followed by a stochastic gradient update with reflections in the approximate unstable direction to advance toward the saddle point. We carry out rigorous numerical analysis to establish the almost sure convergence for the stochastic eigenvector search and local almost sure convergence with an $O(1/n)$ rate for the saddle search, and present a theoretical guarantee to ensure the high-probability identification of the saddle point when the initial point is sufficiently close. Numerical experiments, including the application to a neural network loss landscape and a Landau-de Gennes type model for nematic liquid crystal, demonstrate the practical applicability and the ability for escaping from "bad" areas of the algorithm.

academic

Стохастический алгоритм поиска седловых точек с гарантией сходимости

Основная информация

ID статьи: 2510.14144
Название: A Stochastic Algorithm for Searching Saddle Points with Convergence Guarantee
Авторы: Baoming Shi (Columbia University), Lei Zhang (Peking University), Qiang Du (Columbia University)
Классификация: math.NA, cs.NA (численный анализ)
Дата публикации: 15 октября 2024 г.
Ссылка на статью: https://arxiv.org/abs/2510.14144

Аннотация

Седловые точки предоставляют иерархическую перспективу энергетического ландшафта, раскрывая пути переходов и взаимосвязанные бассейны притяжения, что дает представление о глобальной структуре системы, метастабильности и возможных коллективных механизмах. В данной работе предложен стохастический алгоритм поиска седловых точек, который избегает точного вычисления производных и матриц Гессе в традиционной детерминированной динамике поиска седловых точек. Алгоритм использует на каждой итерации метод поиска случайных собственных векторов на основе стохастической матрицы Гессе для аппроксимации неустойчивых направлений, а затем выполняет обновление стохастического градиента посредством отражения в аппроксимированном неустойчивом направлении для движения к седловой точке. Авторы провели строгий численный анализ, установив почти наверное сходимость поиска случайных собственных векторов и локальную почти наверное сходимость поиска седловых точек (скорость сходимости O(1/n)), а также предоставили теоретические гарантии для обеспечения высокой вероятности идентификации седловой точки при достаточной близости начальной точки.

Исследовательский контекст и мотивация

Постановка проблемы

Поиск седловых точек имеет важное значение в нескольких научных областях, включая:

Материаловедение и химия: понимание критического зародышеобразования при фазовых переходах и путей переходов
Физика жидких кристаллов: анализ конфигураций дефектов
Биология: исследование сворачивания белков
Глубокое обучение: анализ ландшафта потерь нейронных сетей

Ограничения существующих методов

Традиционные алгоритмы поиска седловых точек делятся на две основные категории:

Методы поиска пути: например, метод строки, поиск пути минимальной энергии
Методы обхода поверхности: например, динамика наиболее мягкого подъема, метод димера, динамика седловых точек высокого индекса (HiSD)

Основные ограничения этих методов включают:

Необходимость точного вычисления градиентов и матриц Гессе, что требует высоких вычислительных затрат
В некоторых приложениях градиенты/матрицы Гессе недоступны или их сложно получить
Отсутствие строгого теоретического анализа стохастических версий

Исследовательская мотивация

Данная работа направлена на разработку стохастического алгоритма поиска седловых точек, который может:

Избежать точного вычисления производных и матриц Гессе
Предоставить строгие теоретические гарантии сходимости
Продемонстрировать хорошую производительность и способность к выходу из локальных минимумов в практических приложениях

Основные вклады

Впервые предложен стохастический алгоритм поиска седловых точек с гарантией сходимости, заполняя пробел в теоретическом анализе этой области
Установлена полная теоретическая база:
- Почти наверное сходимость поиска случайных собственных векторов
- Локальная почти наверное сходимость поиска седловых точек со скоростью O(1/n)
- Теоретические гарантии сходимости с высокой вероятностью
Предоставлены различные результаты сходимости:
- Глобальная сходимость при известном неустойчивом подпространстве
- Локальная сходимость при неизвестном неустойчивом подпространстве
- Анализ сходимости при неточных собственных векторах
Проверена практическая применимость алгоритма: демонстрация эффективности на ландшафтах потерь нейронных сетей и моделях жидких кристаллов

Подробное описание метода

Определение задачи

Для целевой функции $f(x): \mathbb{R}^d \to \mathbb{R}$ найти седловую точку индекса k, обозначаемую $x^*$ , удовлетворяющую:

$\nabla f(x^*) = 0$
$\nabla^2 f(x^*)$ имеет k отрицательных собственных значений и (d-k) положительных собственных значений

Архитектура алгоритма

1. Случай известного неустойчивого подпространства

Для задач с выпукло-вогнутой структурой: $\min_{x_{V^⊥} \in V^⊥} \max_{x_V \in V} f(x_V + x_{V^⊥})$

Стохастическая динамика поиска седловых точек имеет вид: