2025-11-17T13:58:12.673309

Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity

Bravo, Flores-Mella, Guzmán
We study the mixing time of the projected Langevin algorithm (LA) and the privacy curve of noisy Stochastic Gradient Descent (SGD), beyond nonexpansive iterations. Specifically, we derive new mixing time bounds for the projected LA which are, in some important cases, dimension-free and poly-logarithmic on the accuracy, closely matching the existing results in the smooth convex case. Additionally, we establish new upper bounds for the privacy curve of the subsampled noisy SGD algorithm. These bounds show a crucial dependency on the regularity of gradients, and are useful for a wide range of convex losses beyond the smooth case. Our analysis relies on a suitable extension of the Privacy Amplification by Iteration (PABI) framework (Feldman et al., 2018; Altschuler and Talwar, 2022, 2023) to noisy iterations whose gradient map is not necessarily nonexpansive. This extension is achieved by designing an optimization problem which accounts for the best possible Rényi divergence bound obtained by an application of PABI, where the tractability of the problem is crucially related to the modulus of continuity of the associated gradient mapping. We show that, in several interesting cases -- namely the nonsmooth convex, weakly smooth and (strongly) dissipative -- such optimization problem can be solved exactly and explicitly, yielding the tightest possible PABI-based bounds.
academic

Времена перемешивания и анализ приватности для проецируемого алгоритма Ланжевена при модуле непрерывности

Основная информация

  • ID статьи: 2501.04134
  • Название: Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity
  • Авторы: Mario Bravo, Juan Pablo Flores-Mella, Cristóbal Guzmán
  • Классификация: stat.ML cs.LG math.OC math.ST stat.TH
  • Время публикации: Январь 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2501.04134

Аннотация

В данной работе исследуются времена перемешивания проецируемого алгоритма Ланжевена (Projected Langevin Algorithm) и кривые приватности зашумленного стохастического градиентного спуска (SGD), выходящие за рамки нерасширяющих итераций. В частности, авторы выводят новые границы времени перемешивания для проецируемого алгоритма Ланжевена, которые в некоторых важных случаях являются безразмерными и полилогарифмическими по точности, тесно совпадая с существующими результатами для гладкого выпуклого случая. Кроме того, в работе устанавливаются новые верхние границы кривых приватности для алгоритмов зашумленного SGD с подвыборкой. Эти границы демонстрируют критическую зависимость от регулярности градиента и применимы к широкому классу выпуклых функций потерь за пределами гладкого случая.

Научный контекст и мотивация

Постановка проблемы

  1. Важность задачи выборки: Выборка из логарифмически вогнутого распределения π ∝ e^(-f) является фундаментальной алгоритмической задачей, служащей основным строительным блоком для оценки объемов, оптимизации, байесовской статистики, машинного обучения и дифференциальной приватности.
  2. Алгоритм Ланжевена: Алгоритм Ланжевена аппроксимирует целевое распределение путем дискретизации диффузии Ланжевена:
    dL_t = -∇f(L_t)dt + √2dW_t
    

    После дискретизации получается цепь Маркова:
    X_{t+1} = Π_X[X_t - η∇f(X_t) + √(2η)ξ_t]
    
  3. Ограничения существующих методов:
    • Большинство исследований сосредоточены на сильно выпуклых гладких потенциалах
    • Исследований негладких выпуклых потенциалов относительно мало
    • Техника PABI (Privacy Amplification by Iteration) в основном ограничена нерасширяющими итерациями

Научная мотивация

Данная работа направлена на расширение техники PABI за пределы нерасширяющих итераций путем использования модуля непрерывности для количественной оценки регулярности базовых отображений, что позволяет работать с более широким классом потенциалов, включая недифференцируемые функции.

Основные вклады

  1. Расширение фреймворка PABI: Распространение техники PABI на общие отображения с модулем непрерывности, способные обрабатывать даже разрывные отображения.
  2. Проектирование оптимизационной задачи: Разработка оптимизационной задачи для получения оптимальных границ дивергенции Реньи при применении PABI, разрешимость которой тесно связана с модулем непрерывности соответствующего градиентного отображения.
  3. Явное решение: Доказательство того, что оптимизационная задача допускает точное явное решение при модуле непрерывности вида φ(δ) = √(cδ² + h).
  4. Границы времени перемешивания: Установление новых границ времени перемешивания для выпуклого и (p,M)-слабо гладкого случаев, которые в некоторых случаях являются безразмерными и полилогарифмическими по точности.
  5. Анализ кривых приватности: Установление новых верхних границ кривых приватности для зашумленного SGD, демонстрирующих критическую зависимость от регулярности градиента.

Подробное описание методов

Определение задачи

Исследование проецируемых зашумленных итераций:

X_{t+1} = Π_X[Φ_t(X_t) + ξ_t], ξ_t ~ N(0, σ²_t I_{d×d})

где Φ_t имеет модуль непрерывности φ_t.

Фреймворк модуля непрерывности

Определение

Для отображения Φ: X ⊆ ℝ^d → ℝ^d неубывающая функция φ: ℝ₊ → ℝ₊ является модулем непрерывности Φ, если:

‖Φ(x) - Φ(y)‖ ≤ φ(‖x - y‖) ∀x, y ∈ X

Важные случаи

  1. Выпуклая липшицева: φ(δ) = √(δ² + (2ηL)²)
  2. Выпуклая (p,M)-слабо гладкая: φ(δ) = √(δ² + (2η^(1/(1-p))√((1-p)/(1+p))(M/2)^(1/(1-p)))²)
  3. Сильная диссипация: φ(δ) = √((1-2ηκ+η²β²)δ² + 2ηλ)

Расширение PABI

Ключевая лемма

Лемма 3.2: Пусть X ⊆ ℝ^d — замкнутое выпуклое множество, Φ имеет модуль непрерывности φ. Для случайных величин X, X' и гауссовского шума ξ ~ N(0, σ²I), пусть Y = Π_XΦ(X) + ξ, Y' = Π_XΦ(X') + ξ, тогда для любого 0 < a ≤ φ(δ):

R_α^(φ(δ)-a)(Y‖Y') ≤ R_α^(δ)(X‖X') + αa²/(2σ²)

Задача оптимизации со сдвигом

Для получения наиболее точных границ PABI необходимо решить задачу оптимизации со сдвигом:

min_{u∈R} E(u) := Σ_{t=1}^T (φ_{t-1}(u_{t-1}) - u_t)²/σ²_{t-1}

Основные теоретические результаты

Теорема 3.4 (Главный результат)

Пусть φ_t(δ) = √(c_tδ² + h_t), тогда для проецируемых зашумленных итераций:

R_α(X_T‖X'_T) ≤ α/2 [Π_{k=0}^{T-1}c_k D² / Σ_{j=0}^{T-1}σ²_j Π_{l=j+1}^{T-1}c_l + Σ_{t=0}^{T-1} h_t Π_{k=t+1}^{T-1}c_k / Σ_{j=t}^{T-1}σ²_j Π_{l=j+1}^{T-1}c_l]

Экспериментальная установка

Фреймворк теоретического анализа

Данная работа является в основном теоретической, устанавливая границы посредством строгих математических доказательств, а не эмпирических экспериментов. Анализ включает:

  1. Анализ времени перемешивания: Использование полной вариационной дистанции для оценки скорости сходимости
  2. Анализ приватности: Использование фреймворка дифференциальной приватности Реньи
  3. Анализ оптимизации: Доказательство существования и единственности оптимального решения задачи со сдвигом

Метрики оценки

  • Время перемешивания: T_{mix,TV}(ε) = min{t ∈ ℕ: d(t) ≤ ε}
  • Дивергенция Реньи: R_α(μ‖ν)
  • Полная вариационная дистанция: ‖μ - ν‖_

Результаты экспериментов

Границы времени перемешивания

Теорема 4.2 (Слабо гладкий случай)

Для выпуклых (p,M)-слабо гладких функций, если 1/η ≥ Θ, то:

T_{mix,TV}(ε) ≤ ⌈D²/η⌉ · ⌈log₂(1/ε)⌉

где Θ = (M/2)^(2/(1+p))(1-p)/(1+p) max{16ln(D(M/2)^(1/(1-p))e), 27}^((1-p)/(1+p))

Теорема 4.3 (Случай сильной диссипации)

Для (λ,κ)-сильно диссипативных и β-гладких функций, пусть c = 1 - 2ηκ + η²β² < 1, тогда:

T_{mix,TV}(ε) = O(log_{1/c}(1 + D²(1-c)/(4η)) · (e/(1-c))^{λ/2} log₂(1/ε))

Анализ кривых приватности

Теорема 5.2 (Зашумленный SGD)

Для выпуклых, L-липшицевых и (p,M)-слабо гладких функций потерь зашумленный SGD удовлетворяет (α,ε)-RDP, где:

ε ≤ α/σ² [16L²T/n² + D²/(η²T) + 4η^(2p/(1-p))(1-p)/(1+p)(M/2)^(2/(1-p))ln(T·e)]

Ключевые находки

  1. Безразмерность: В некоторых случаях границы времени перемешивания не зависят от размерности d
  2. Зависимость от регулярности: Границы приватности существенно зависят от параметра регулярности градиента p
  3. Оптимальность: Для модулей непрерывности вида φ(δ) = √(cδ² + h) оптимизационная задача имеет единственное оптимальное решение
  4. Вырожденные случаи: При p = 0 (липшицев случай) невозможно получить нетривиальные границы приватности, исчезающие при n → ∞

Связанные работы

Исследования алгоритма Ланжевена

  • Гладкий сильно выпуклый случай: Обширные исследования Dalalyan (2017), Durmus and Moulines (2019) и др.
  • Негладкий случай: Относительно мало исследований, в основном Pereyra (2016), Chatterji et al. (2020) и др.

Техника PABI

  • Исходный фреймворк: Предложен Feldman et al. (2018)
  • Расширенные приложения: Применение Altschuler and Talwar (2022, 2023) к гладкому выпуклому случаю
  • Вклад данной работы: Расширение на фреймворк модуля непрерывности

Дифференциальная приватность

  • Классический анализ: Предполагает публикацию всех итераций
  • Последняя итерация: Исследования Chourasia et al. (2021), Ye and Shokri (2022) и др. по приватности последней итерации

Заключение и обсуждение

Основные выводы

  1. Успешное расширение техники PABI за пределы нерасширяющих итераций
  2. Установление точных границ для множества важных классов потенциалов
  3. Доказательство критической роли модуля непрерывности в анализе приватности и выборки

Ограничения

  1. Негладкий случай: Невозможно получить нетривиальное усиление приватности в липшицевом случае
  2. Ограничения на размер шага: Некоторые результаты требуют более строгих ограничений на размер шага
  3. Специфическая форма: Основные результаты ограничены модулями непрерывности вида φ(δ) = √(cδ² + h)

Направления будущих исследований

  1. Расширение на более общие формы модулей непрерывности
  2. Улучшение границ приватности в негладком случае
  3. Исследование более сложных постановок, таких как задачи с седловыми точками

Глубокая оценка

Преимущества

  1. Теоретическая инновация: Успешное расширение техники PABI на более общие постановки с важной теоретической ценностью
  2. Математическая строгость: Полные и строгие доказательства, явное решение оптимизационной задачи демонстрирует глубокие математические идеи
  3. Практическая ценность: Результаты применимы к широкому классу потенциалов, включая недифференцируемые функции
  4. Единый фреймворк: Модуль непрерывности обеспечивает единый аналитический фреймворк

Недостатки

  1. Ограниченное применение: Основные результаты ограничены модулями непрерывности специфической формы
  2. Отсутствие эмпирической верификации: Нет численных экспериментов для проверки точности теоретических результатов
  3. Вызовы в негладком случае: Результаты приватности в негладком случае относительно пессимистичны

Влияние

  1. Теоретический вклад: Предоставление новых теоретических инструментов для анализа выборки и приватности
  2. Методологическая ценность: Метод модуля непрерывности может вдохновить другие связанные исследования
  3. Практическое руководство: Предоставление теоретического руководства для проектирования практических алгоритмов

Применимые сценарии

  1. Байесовский вывод: Апостериорная выборка с негладкими приорами
  2. Дифференциальная приватность: Приложения машинного обучения, требующие точных гарантий приватности
  3. Оптимизация: Анализ стохастических алгоритмов для негладких выпуклых задач оптимизации

Библиография

  • Altschuler, J. and Talwar, K. (2022, 2023). Privacy amplification by iteration
  • Feldman, V. et al. (2018). Privacy amplification by iteration
  • Dalalyan, A. (2017). Langevin Monte Carlo analysis
  • Bubeck, S. et al. (2018). Projected Langevin Monte Carlo

Данная статья вносит значительный вклад в область теоретического машинного обучения и дифференциальной приватности. Благодаря инновационному использованию модуля непрерывности авторам удалось успешно расширить область применения техники PABI, предоставив новые теоретические инструменты для анализа негладкой оптимизации и алгоритмов, защищающих приватность.