Titre: Rényi Differential Privacy for Heavy-Tailed SDEs via Fractional Poincaré Inequalities
Auteurs: Benjamin Dupuis (Inria), Mert Gürbüzbalaban (Rutgers), Umut Şimşekli (Inria), Jian Wang (Fujian Normal University), Sinan Yıldırım (Sabancı University), Lingjiong Zhu (Florida State University)
Classification: stat.ML, cs.LG
Date de publication: 19 novembre 2025 (soumission arXiv)
Cet article propose les premières garanties théoriques basées sur la confidentialité différentielle de Rényi (RDP) pour les équations différentielles stochastiques (EDSs) à queues lourdes. Les recherches existantes en confidentialité différentielle se concentrent principalement sur les bruits à queues légères (comme le bruit gaussien), tandis que la descente de gradient stochastique (SGD) en apprentissage profond présente souvent un comportement à queues lourdes. Les résultats existants de confidentialité différentielle pour SGD à queues lourdes ne fournissent que des garanties (0,δ)-DP avec une forte dépendance dimensionnelle. Cet article établit des garanties RDP pour les EDSs à queues lourdes et leurs discrétisations via de nouveaux calculs de flux de Rényi et des inégalités de Poincaré fractionnaires, obtenant des bornes de confidentialité avec une dépendance dimensionnelle significativement affaiblie sous l'hypothèse d'inégalités de Poincaré fractionnaires.
Le problème central que cet article résout est: Comment établir des garanties rigoureuses de confidentialité différentielle de Rényi pour les algorithmes de descente de gradient stochastique avec bruit à queues lourdes (en particulier, bruit α-stable)?
Pertinence pratique: Plusieurs études montrent que le SGD en apprentissage profond moderne produit des distributions à queues lourdes sous certains paramètres, et l'injection de bruit à queues lourdes peut améliorer la généralisation, la compression de modèles et les performances d'optimisation
Lacune théorique: La théorie existante de la confidentialité différentielle se concentre principalement sur le bruit gaussien, s'appuyant sur des outils comme l'inégalité de Sobolev logarithmique (LSI), qui ne peuvent pas être directement étendus au cas des queues lourdes
Besoin de confidentialité: Avec le développement rapide de l'apprentissage automatique, la certification de la confidentialité différentielle des algorithmes d'apprentissage est devenue un besoin critique
Cet article vise à surmonter ces limitations en introduisant les inégalités de Poincaré fractionnaires pour remplacer LSI, établissant les premières garanties RDP pour les EDSs à queues lourdes et améliorant significativement la dépendance dimensionnelle.
Cadre Rényi Flow Universel: Fournit un cadre universel pour calculer le flux de divergence de Rényi le long des EDSs pilotées par Lévy, applicable à une très large catégorie de processus de Lévy
Garanties RDP pour le Cas Multifractal (σ_α > 0 et σ_2 > 0):
Sous l'hypothèse d'inégalité de Poincaré fractionnaire (FPI): κ = O(β²/(n²σ²_2)), indépendant de la dimension
Sans hypothèse FPI: κ = O(βT/(n²σ²_2))
Garanties RDP pour le Cas α-Stable Pur (σ_2 = 0):
Sous hypothèse FPI: κ = O(β²d^(1-α/2)/(n²σ^α_α))
Sans hypothèse FPI: κ = O(βd^(1-α/2)T/(n²σ^α_α))
Garantie (0,δ)-DP implicite: δ = O(d^(2-α)/4/(nσ^(α/2)_α)), avec dépendance dimensionnelle significativement plus faible que O(d^(1+α)/2/n) existant
Extension en Temps Discret: Étend les résultats aux algorithmes de descente de gradient en temps discret utilisés en pratique
Stabilité des Inégalités de Poincaré Fractionnaires: Prouve la stabilité des inégalités de Poincaré fractionnaires sous convolution, difféomorphismes bi-Lipschitz et perturbations bornées, fournissant une base théorique pour l'hypothèse principale
Considérez le problème de minimisation du risque empirique (ERM):
minw∈RdR^S(w):=n1∑i=1nℓ(w,zi)
où S = (z_1,...,z_n) est l'ensemble de données, ℓ est la fonction de perte. L'algorithme d'apprentissage est une application aléatoire A: S ↦ W_S ∈ ℝ^d.
Objectif de confidentialité différentielle: Pour les ensembles de données adjacents S ≃ S' (différant par un seul point de données), quantifier la distinguabilité de Law(W_S) et Law(W_S').
Hypothèse 1 (Sensibilité Finie): La sensibilité du gradient est finie
Sg:=ess sup(z,z′)∼μz⊗μzsupw∈Rd∥∇ℓ(w,z′)−∇ℓ(w,z)∥<∞
Hypothèse 2 (Conditions de Régularité): p_t, p'_t et v_t := p_t/p'_t sont positifs, différentiables et appartiennent à C²_b(ℝ^d), satisfaisant les conditions de non-explosion
Hypothèse 3 (Régularité Supplémentaire pour le Cas Pur Saut):
supS≃S′supt≤T(∥∇vtβ/2∥∞+∥∇2vtβ/2∥∞)<∞infS≃S′inft≤T∥∇vtβ/2∥L2(pt′)>0
Hypothèse Centrale (Inégalité de Poincaré α-Stable): La mesure de probabilité μ satisfait
∫f2dμ−(∫fdμ)2≤aCα,d∫∫∥z∥d+α(f(x)−f(x+z))2dμ(x)dz+b∫∥∇f∥2dμ
Sous l'hypothèse d'inégalité de Poincaré α-stable:
β−12σααEα,pt′(vtβ/2,vtβ/2)+β2σ22E2,pt′(vtβ/2,vtβ/2)≥γβ1Eβ(pt,pt′)(1−e−Rβ(pt,pt′))
Cela relie la borne inférieure de la forme de Dirichlet au terme exponentiel de la divergence de Rényi.
Prouve la version pondérée de la formule de Bourgain-Brezis-Mironescu:
limα→2−Eα,μ(u,u)=E2,μ(u,u)
Ceci fournit une base théorique pour traiter le cas pur saut, montrant que lorsque α s'approche de 2, la forme de Dirichlet fractionnaire peut être approximée par la forme de Dirichlet gaussienne.
Cet article est un travail purement théorique, sans section expérimentale. L'accent est mis sur l'établissement de garanties mathématiques rigoureuses.
Systèmes Dynamiques Linéaires (Ito et al. 2021): Étude de DP pour systèmes dynamiques linéaires avec bruit α-stable, mais pas directement lié à SGD
Mécanismes α-Stable Généraux (Zawacki & Abed 2025): Propose des mécanismes DP α-stable généraux, mais indépendant de la recherche SGD
Hypothèse de Moments Finis (Asi et al. 2024): Étude d'optimisation convexe avec gradients à queues lourdes (moments finis d'ordre k), mais n'inclut pas directement le bruit α-stable
Premier DP pour SGD à Queues Lourdes (Şimşekli et al. 2024):
Fournit garantie (0,δ)-DP sans écrêtage de gradient
Basé sur l'analyse de perturbation de chaîne de Markov
Limitations: (0,δ)-DP plus faible, forte dépendance dimensionnelle, impossible d'étendre à RDP
Percée Théorique: Établit les premières garanties RDP pour EDSs à queues lourdes, affaiblissant significativement la dépendance dimensionnelle
Innovation Méthodologique: Via la combinaison du calcul de flux de Rényi et des inégalités de Poincaré fractionnaires, fournit un nouveau paradigme pour l'analyse de confidentialité des algorithmes stochastiques à queues lourdes
Signification Pratique: Les résultats s'appliquent à la descente de gradient en temps discret, fournissant des garanties théoriques pour les algorithmes SGD à queues lourdes pratiques
Intuition Théorique: Révèle les effets complexes du bruit à queues lourdes sur la confidentialité, dépendant de la relation entre l'échelle de bruit et la dimension
Şimşekli et al. (2024): Privacy of SGD under Gaussian or Heavy-Tailed Noise: Guarantees without Gradient Clipping. Principal objet d'amélioration de cet article.
Chourasia et al. (2021): Differential Privacy Dynamics of Langevin Diffusion and Noisy Gradient Descent. Méthode de flux de Rényi pour le cas gaussien, source d'inspiration importante.
Wang & Wang (2015): Functional Inequalities for Stable-Like Dirichlet Forms. Base théorique des inégalités de Poincaré fractionnaires.
Bourgain et al. (2001): Another Look at Sobolev spaces. Source originale de la formule BBM.
Dupuis & Şimşekli (2024): Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation. Travail connexe sur les bornes de généralisation, utilisant des techniques de flux d'entropie différentes.
Évaluation Globale: Ceci est un excellent article techniquement profond et théoriquement rigoureux, apportant des contributions importantes à la théorie de la confidentialité différentielle pour les algorithmes stochastiques à queues lourdes. En introduisant les inégalités de Poincaré fractionnaires et les nouveaux calculs de flux de Rényi, il améliore significativement la dépendance dimensionnelle et fournit des garanties RDP plus fortes. Malgré certaines limitations concernant la vérifiabilité des hypothèses et la dépendance β², il ouvre des directions de recherche importantes et a une valeur significative pour la communauté théorique. Les applications pratiques nécessitent des recherches empiriques et une vérification des hypothèses supplémentaires.