В данной работе исследуются времена перемешивания проецируемого алгоритма Ланжевена (Projected Langevin Algorithm) и кривые приватности зашумленного стохастического градиентного спуска (SGD), выходящие за рамки нерасширяющих итераций. В частности, авторы выводят новые границы времени перемешивания для проецируемого алгоритма Ланжевена, которые в некоторых важных случаях являются безразмерными и полилогарифмическими по точности, тесно совпадая с существующими результатами для гладкого выпуклого случая. Кроме того, в работе устанавливаются новые верхние границы кривых приватности для алгоритмов зашумленного SGD с подвыборкой. Эти границы демонстрируют критическую зависимость от регулярности градиента и применимы к широкому классу выпуклых функций потерь за пределами гладкого случая.
Важность задачи выборки: Выборка из логарифмически вогнутого распределения π ∝ e^(-f) является фундаментальной алгоритмической задачей, служащей основным строительным блоком для оценки объемов, оптимизации, байесовской статистики, машинного обучения и дифференциальной приватности.
Данная работа направлена на расширение техники PABI за пределы нерасширяющих итераций путем использования модуля непрерывности для количественной оценки регулярности базовых отображений, что позволяет работать с более широким классом потенциалов, включая недифференцируемые функции.
Расширение фреймворка PABI: Распространение техники PABI на общие отображения с модулем непрерывности, способные обрабатывать даже разрывные отображения.
Проектирование оптимизационной задачи: Разработка оптимизационной задачи для получения оптимальных границ дивергенции Реньи при применении PABI, разрешимость которой тесно связана с модулем непрерывности соответствующего градиентного отображения.
Явное решение: Доказательство того, что оптимизационная задача допускает точное явное решение при модуле непрерывности вида φ(δ) = √(cδ² + h).
Границы времени перемешивания: Установление новых границ времени перемешивания для выпуклого и (p,M)-слабо гладкого случаев, которые в некоторых случаях являются безразмерными и полилогарифмическими по точности.
Анализ кривых приватности: Установление новых верхних границ кривых приватности для зашумленного SGD, демонстрирующих критическую зависимость от регулярности градиента.
Данная работа является в основном теоретической, устанавливая границы посредством строгих математических доказательств, а не эмпирических экспериментов. Анализ включает:
Анализ времени перемешивания: Использование полной вариационной дистанции для оценки скорости сходимости
Анализ приватности: Использование фреймворка дифференциальной приватности Реньи
Анализ оптимизации: Доказательство существования и единственности оптимального решения задачи со сдвигом
Altschuler, J. and Talwar, K. (2022, 2023). Privacy amplification by iteration
Feldman, V. et al. (2018). Privacy amplification by iteration
Dalalyan, A. (2017). Langevin Monte Carlo analysis
Bubeck, S. et al. (2018). Projected Langevin Monte Carlo
Данная статья вносит значительный вклад в область теоретического машинного обучения и дифференциальной приватности. Благодаря инновационному использованию модуля непрерывности авторам удалось успешно расширить область применения техники PABI, предоставив новые теоретические инструменты для анализа негладкой оптимизации и алгоритмов, защищающих приватность.