Titel: Rényi Differential Privacy for Heavy-Tailed SDEs via Fractional Poincaré Inequalities
Autoren: Benjamin Dupuis (Inria), Mert Gürbüzbalaban (Rutgers), Umut Şimşekli (Inria), Jian Wang (Fujian Normal University), Sinan Yıldırım (Sabancı University), Lingjiong Zhu (Florida State University)
Klassifizierung: stat.ML, cs.LG
Veröffentlichungsdatum: 19. November 2025 (arXiv-Einreichung)
Dieses Paper befasst sich mit dem Differenzialschutzproblem für stochastische Differentialgleichungen (SDEs) mit schweren Enden und schlägt die erste theoretische Garantie basierend auf Rényi-Differenzialschutz (RDP) vor. Bestehende Differenzialschutzforschung konzentriert sich hauptsächlich auf leichte Enden (wie Gaußsches Rauschen), während stochastischer Gradientenabstieg (SGD) in tiefem Lernen häufig schwere Enden aufweist. Bisherige Ergebnisse zum Differenzialschutz von Heavy-Tailed SGD bieten nur (0,δ)-DP-Garantien mit starker Dimensionsabhängigkeit. Dieses Paper etabliert durch neue Rényi-Flussberechnungen und fraktionale Poincaré-Ungleichungen RDP-Garantien für Heavy-Tailed SDEs und deren Diskretisierungen. Unter der Annahme fraktionaler Poincaré-Ungleichungen werden Datenschutzgrenzen mit deutlich schwächerer Dimensionsabhängigkeit erreicht.
Das Kernproblem dieses Papers ist: Wie können strenge Rényi-Differenzialschutzgarantien für Stochastische-Gradienten-Abstiegs-Algorithmen mit Heavy-Tailed-Rauschen (insbesondere α-stabiles Rauschen) etabliert werden?
Praktische Relevanz: Mehrere Studien zeigen, dass SGD in modernem tiefem Lernen unter bestimmten Hyperparameter-Einstellungen Heavy-Tailed-Verteilungen erzeugt. Das Injizieren von Heavy-Tailed-Rauschen kann Generalisierungsleistung, Modellkompression und Optimierungsleistung verbessern.
Theoretische Lücke: Bestehende Differenzialschutztheorie konzentriert sich hauptsächlich auf Gaußsches Rauschen und nutzt Werkzeuge wie logarithmische Sobolev-Ungleichungen (LSI). Diese Techniken können nicht direkt auf Heavy-Tailed-Einstellungen erweitert werden.
Datenschutzanforderungen: Mit der rasanten Entwicklung des maschinellen Lernens ist die Zertifizierung des Differenzialschutzes von Lernalgorithmen zu einer kritischen Anforderung geworden.
Dieses Paper zielt darauf ab, die obigen Einschränkungen zu überwinden, indem fraktionale Poincaré-Ungleichungen als Ersatz für LSI eingeführt werden, um die erste RDP-Garantie für Heavy-Tailed SDEs zu etablieren und die Dimensionsabhängigkeit erheblich zu verbessern.
Allgemeines Rényi-Fluss-Framework: Bietet ein allgemeines Framework zur Berechnung des Rényi-Divergenz-Flusses entlang von Lévy-getriebenen SDEs, anwendbar auf eine sehr breite Klasse von Lévy-Prozessen.
RDP-Garantien für den multifraktalen Fall (σ_α > 0 und σ_2 > 0):
Unter der Annahme fraktionaler Poincaré-Ungleichungen (FPI): κ = O(β²/(n²σ²_2)), dimensionsunabhängig
Ohne FPI-Annahme: κ = O(βT/(n²σ²_2))
RDP-Garantien für den reinen Sprung-α-stabilen Fall (σ_2 = 0):
Unter FPI-Annahme: κ = O(β²d^(1-α/2)/(n²σ^α_α))
Ohne FPI-Annahme: κ = O(βd^(1-α/2)T/(n²σ^α_α))
Implizite (0,δ)-DP-Garantie: δ = O(d^(2-α)/4/(nσ^(α/2)_α)), Dimensionsabhängigkeit deutlich schwächer als bestehende O(d^(1+α)/2/n)
Diskrete Zeit-Erweiterung: Ergebnisse auf praktisch verwendete diskrete Zeit-Gradientenabstiegsalgorithmen erweitert.
Stabilität fraktionaler Poincaré-Ungleichungen: Bewiesen, dass fraktionale Poincaré-Ungleichungen unter Faltung, doppelt Lipschitz-Diffeomorphismen und beschränkten Störungen stabil sind, was theoretische Grundlagen für die Hauptannahme bietet.
Betrachten Sie das empirische Risikominimierungsproblem (ERM):
minw∈RdR^S(w):=n1∑i=1nℓ(w,zi)
wobei S = (z_1,...,z_n) ein Datensatz ist und ℓ eine Verlustfunktion ist. Der Lernalgorithmus ist eine zufällige Abbildung A: S ↦ W_S ∈ ℝ^d.
Differenzialschutz-Ziel: Für benachbarte Datensätze S ≃ S' (unterscheiden sich in einem Datenpunkt), quantifizieren Sie die Unterscheidbarkeit von Law(W_S) und Law(W_S').
Annahme 1 (Endliche Empfindlichkeit): Gradienten-Empfindlichkeit ist endlich
Sg:=ess sup(z,z′)∼μz⊗μzsupw∈Rd∥∇ℓ(w,z′)−∇ℓ(w,z)∥<∞
Annahme 2 (Regularitätsbedingungen): p_t, p'_t und v_t := p_t/p'_t sind positiv, differenzierbar und gehören zu C²_b(ℝ^d), und erfüllen Nicht-Explosionsbedingungen.
Annahme 3 (Zusätzliche Regularität für reinen Sprung-Fall):
supS≃S′supt≤T(∥∇vtβ/2∥∞+∥∇2vtβ/2∥∞)<∞infS≃S′inft≤T∥∇vtβ/2∥L2(pt′)>0
Kernhypothese (α-stabile Poincaré-Ungleichung): Ein Wahrscheinlichkeitsmaß μ erfüllt
∫f2dμ−(∫fdμ)2≤aCα,d∫∫∥z∥d+α(f(x)−f(x+z))2dμ(x)dz+b∫∥∇f∥2dμ
Unter der Annahme der α-stabilen Poincaré-Ungleichung:
β−12σααEα,pt′(vtβ/2,vtβ/2)+β2σ22E2,pt′(vtβ/2,vtβ/2)≥γβ1Eβ(pt,pt′)(1−e−Rβ(pt,pt′))
Dies verbindet die Untergrenze der Dirichlet-Form mit dem exponentiellen Term der Rényi-Divergenz.
Bewiesen die gewichtete Version der Bourgain-Brezis-Mironescu-Formel:
limα→2−Eα,μ(u,u)=E2,μ(u,u)
Dies bietet theoretische Grundlagen für die Behandlung des reinen Sprung-Falls und zeigt, dass fraktionale Dirichlet-Formen durch Gaußsche Dirichlet-Formen approximiert werden können, wenn α sich 2 nähert.
Dieses Paper ist eine rein theoretische Arbeit und enthält keinen experimentellen Teil. Der Forschungsschwerpunkt liegt auf der Etablierung strenger mathematischer theoretischer Garantien.
Lineare dynamische Systeme (Ito et al. 2021): Untersuchen DP linearer dynamischer Systeme unter α-stabilen Rauschen, aber nicht direkt mit SGD verbunden.
Allgemeine α-stabile Mechanismen (Zawacki & Abed 2025): Schlagen allgemeine α-stabile DP-Mechanismen vor, aber unabhängig von SGD-Forschung.
Endliche Moment-Annahmen (Asi et al. 2024): Untersuchen konvexe Optimierung mit Heavy-Tailed-Gradienten (endliche k-te Momente), aber enthalten nicht direkt α-stabiles Rauschen.
Erstes DP für Heavy-Tailed SGD (Şimşekli et al. 2024):
Bieten (0,δ)-DP-Garantie ohne Gradienten-Clipping
Basierend auf Markov-Ketten-Störungsanalyse
Einschränkungen: (0,δ)-DP ist schwächer, starke Dimensionsabhängigkeit, kann nicht auf RDP erweitert werden
Theoretischer Durchbruch: Etabliert die erste RDP-Garantie für Heavy-Tailed SDEs mit signifikant schwächerer Dimensionsabhängigkeit.
Methodische Innovation: Durch die Kombination von Rényi-Flussberechnungen und fraktionalen Poincaré-Ungleichungen wird ein neues Paradigma für die Datenschutzanalyse von Heavy-Tailed-Algorithmen bereitgestellt.
Praktische Bedeutung: Ergebnisse sind auf diskrete Zeit-Gradientenabstieg anwendbar und bieten theoretische Garantien für praktische Heavy-Tailed-SGD-Algorithmen.
Theoretische Einsicht: Offenbaren die komplexe Auswirkung von Heavy-Tailed-Rauschen auf den Datenschutz, abhängig von der Beziehung zwischen Rauschmaßstab und Dimension.
Şimşekli et al. (2024): Privacy of SGD under Gaussian or Heavy-Tailed Noise: Guarantees without Gradient Clipping. Hauptobjekt der Verbesserung dieses Papers.
Chourasia et al. (2021): Differential Privacy Dynamics of Langevin Diffusion and Noisy Gradient Descent. Rényi-Fluss-Methode für Gaußschen Fall, wichtige Inspirationsquelle dieses Papers.
Wang & Wang (2015): Functional Inequalities for Stable-Like Dirichlet Forms. Theoretische Grundlagen fraktionaler Poincaré-Ungleichungen.
Bourgain et al. (2001): Another Look at Sobolev spaces. Ursprüngliche Quelle der BBM-Formel.
Dupuis & Şimşekli (2024): Generalization Bounds for Heavy-Tailed SDEs through the Fractional Fokker-Planck Equation. Verwandte Generalisierungsgrenzen-Arbeit mit unterschiedlichen Entropie-Fluss-Techniken.
Gesamtbewertung: Dies ist ein technisch tiefgreifendes und theoretisch strenges ausgezeichnetes Paper, das wichtige Beiträge zur Differenzialschutztheorie von Heavy-Tailed-Zufallsalgorithmen leistet. Durch die Einführung fraktionaler Poincaré-Ungleichungen und neue Rényi-Flussberechnungen wird die Dimensionsabhängigkeit signifikant verbessert und stärkere RDP-Garantien bereitgestellt. Trotz Einschränkungen wie Verifizierbarkeit von Annahmen und β²-Abhängigkeit eröffnet es wichtige Forschungsrichtungen mit großem Wert für die theoretische Gemeinschaft. Praktische Anwendungen erfordern weitere empirische Forschung und Verifikation von Annahmen.