Название: Rényi Differential Privacy for Heavy-Tailed SDEs via Fractional Poincaré Inequalities
Авторы: Benjamin Dupuis (Inria), Mert Gürbüzbalaban (Rutgers), Umut Şimşekli (Inria), Jian Wang (Fujian Normal University), Sinan Yıldırım (Sabancı University), Lingjiong Zhu (Florida State University)
Классификация: stat.ML, cs.LG
Дата публикации: 19 ноября 2025 г. (отправка на arXiv)
В данной работе предложены первые теоретические гарантии дифференциальной приватности Рёньи (RDP) для тяжелохвостых стохастических дифференциальных уравнений (СДУ). Существующие исследования дифференциальной приватности в основном сосредоточены на легкохвостом шуме (например, гауссовском), тогда как стохастический градиентный спуск (SGD) в глубоком обучении часто демонстрирует тяжелохвостое поведение. Имеющиеся результаты по дифференциальной приватности тяжелохвостого SGD предоставляют только гарантии (0,δ)-DP с сильной зависимостью от размерности. Через новые вычисления потока Рёньи и дробные неравенства Пуанкаре авторы устанавливают гарантии RDP для тяжелохвостых СДУ и их дискретизаций, достигая значительно ослабленной зависимости от размерности при выполнении предположения о дробном неравенстве Пуанкаре.
Центральная проблема, решаемая в работе: Как установить строгие гарантии дифференциальной приватности Рёньи для алгоритмов стохастического градиентного спуска с тяжелохвостым шумом (в частности, α-устойчивым шумом)?
Практическая релевантность: Множество исследований показывают, что SGD в современном глубоком обучении при определённых гиперпараметрах генерирует тяжелохвостые распределения; внедрение тяжелохвостого шума может улучшить обобщение, сжатие модели и производительность оптимизации
Теоретический пробел: Существующая теория дифференциальной приватности в основном ориентирована на гауссов шум и опирается на инструменты, такие как логарифмические неравенства Соболева (LSI), которые не распространяются непосредственно на тяжелохвостые случаи
Потребность в приватности: С быстрым развитием машинного обучения сертификация дифференциальной приватности алгоритмов обучения стала критической необходимостью
Работа направлена на преодоление указанных ограничений путём введения дробных неравенств Пуанкаре вместо LSI, установления первых гарантий RDP для тяжелохвостых СДУ и значительного улучшения зависимости от размерности.
Универсальная схема потока Рёньи: Предоставляет универсальную схему для вычисления потока дивергенции Рёньи вдоль СДУ, управляемых процессами Леви, применимую к очень широкому классу процессов Леви
Гарантии RDP в мультифрактальном случае (σ_α > 0 и σ_2 > 0):
При предположении о дробном неравенстве Пуанкаре (FPI): κ = O(β²/(n²σ²_2)), независимо от размерности
Без предположения FPI: κ = O(βT/(n²σ²_2))
Гарантии RDP в случае чистых скачков α-устойчивости (σ_2 = 0):
При предположении FPI: κ = O(β²d^(1-α/2)/(n²σ^α_α))
Без предположения FPI: κ = O(βd^(1-α/2)T/(n²σ^α_α))
Подразумеваемые гарантии (0,δ)-DP: δ = O(d^(2-α)/4/(nσ^(α/2)_α)), с существенно более слабой зависимостью от размерности, чем существующие O(d^(1+α)/2/n)
Расширение на дискретное время: Результаты распространяются на практически используемые алгоритмы градиентного спуска в дискретном времени
Устойчивость дробных неравенств Пуанкаре: Доказана устойчивость дробных неравенств Пуанкаре при свёртке, двойных липшицевых диффеоморфизмах и ограниченных возмущениях, обеспечивая теоретическую основу для основного предположения
где S = (z_1,...,z_n) — набор данных, ℓ — функция потерь. Алгоритм обучения — это стохастическое отображение A: S ↦ W_S ∈ ℝ^d.
Цель дифференциальной приватности: Для соседних наборов данных S ≃ S' (отличающихся одной точкой данных) количественно оценить различимость Law(W_S) и Law(W_S').
При предположении о α-устойчивом неравенстве Пуанкаре:
β−12σααEα,pt′(vtβ/2,vtβ/2)+β2σ22E2,pt′(vtβ/2,vtβ/2)≥γβ1Eβ(pt,pt′)(1−e−Rβ(pt,pt′))
Это связывает нижнюю границу формы Дирихле с экспоненциальным членом дивергенции Рёньи.
Доказана взвешенная версия формулы Бургена-Брезиса-Миронеску:
limα→2−Eα,μ(u,u)=E2,μ(u,u)
Это обеспечивает теоретическую основу для обработки случая чистых скачков, показывая, что при α, приближающемся к 2, дробная форма Дирихле может быть аппроксимирована гауссовой формой Дирихле.
Данная работа — чисто теоретическое исследование, не содержащее экспериментальной части. Исследовательский фокус сосредоточен на установлении строгих математических теоретических гарантий.
Линейные динамические системы (Ito et al. 2021): Исследование DP для линейных динамических систем с α-устойчивым шумом, но не прямо связано с SGD
Общие α-устойчивые механизмы (Zawacki & Abed 2025): Предложение общих α-устойчивых DP механизмов, но независимо от исследований SGD
Предположения о конечных моментах (Asi et al. 2024): Исследование выпуклой оптимизации с тяжелохвостыми градиентами (конечные k-е моменты), но не включает напрямую α-устойчивый шум
Первая DP для тяжелохвостого SGD (Şimşekli et al. 2024):
Предоставление гарантии (0,δ)-DP без необходимости обрезания градиентов
На основе анализа возмущений цепей Маркова
Ограничения: (0,δ)-DP слабее, сильная зависимость от размерности, невозможно расширить на RDP
Теоретический прорыв: Установлены первые гарантии RDP для тяжелохвостых СДУ с существенно ослабленной зависимостью от размерности
Методологические инновации: Через комбинацию вычисления потока Рёньи и дробных неравенств Пуанкаре предоставлена новая парадигма для анализа приватности тяжелохвостых алгоритмов
Практическое значение: Результаты применимы к дискретному градиентному спуску, обеспечивая теоретические гарантии для практических тяжелохвостых алгоритмов SGD
Теоретические инсайты: Раскрыты сложные эффекты тяжелохвостого шума на приватность, зависящие от соотношения масштаба шума и размерности
Şimşekli et al. (2024): Privacy of SGD under Gaussian or Heavy-Tailed Noise: Guarantees without Gradient Clipping. Основной объект улучшения в данной работе.
Chourasia et al. (2021): Differential Privacy Dynamics of Langevin Diffusion and Noisy Gradient Descent. Метод потока Рёньи для гауссова случая, важный источник вдохновения для данной работы.
Wang & Wang (2015): Functional Inequalities for Stable-Like Dirichlet Forms. Теоретическая основа дробных неравенств Пуанкаре.
Bourgain et al. (2001): Another Look at Sobolev spaces. Оригинальный источник формулы BBM.
Dupuis & Şimşekli (2024): Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation. Связанная работа по границам обобщения, использующая различные методы энтропийного потока.
Общая оценка: Это отличная работа с глубокой техникой и строгой теорией, вносящая значительный вклад в теорию дифференциальной приватности для тяжелохвостых стохастических алгоритмов. Через введение дробных неравенств Пуанкаре и новых вычислений потока Рёньи значительно улучшена зависимость от размерности и предоставлены более сильные гарантии RDP. Несмотря на ограничения в верифицируемости предположений и зависимости β², работа открывает важные направления исследований и имеет значительную ценность для теоретического сообщества. Практическое применение требует дальнейших эмпирических исследований и верификации предположений.