2025-11-17T13:58:12.673309

Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity

Bravo, Flores-Mella, GuzmÃ¡n

We study the mixing time of the projected Langevin algorithm (LA) and the privacy curve of noisy Stochastic Gradient Descent (SGD), beyond nonexpansive iterations. Specifically, we derive new mixing time bounds for the projected LA which are, in some important cases, dimension-free and poly-logarithmic on the accuracy, closely matching the existing results in the smooth convex case. Additionally, we establish new upper bounds for the privacy curve of the subsampled noisy SGD algorithm. These bounds show a crucial dependency on the regularity of gradients, and are useful for a wide range of convex losses beyond the smooth case. Our analysis relies on a suitable extension of the Privacy Amplification by Iteration (PABI) framework (Feldman et al., 2018; Altschuler and Talwar, 2022, 2023) to noisy iterations whose gradient map is not necessarily nonexpansive. This extension is achieved by designing an optimization problem which accounts for the best possible RÃ©nyi divergence bound obtained by an application of PABI, where the tractability of the problem is crucially related to the modulus of continuity of the associated gradient mapping. We show that, in several interesting cases -- namely the nonsmooth convex, weakly smooth and (strongly) dissipative -- such optimization problem can be solved exactly and explicitly, yielding the tightest possible PABI-based bounds.

academic

প্রজেক্টেড ল্যাঞ্জেভিন অ্যালগরিদমের জন্য মিক্সিং টাইম এবং গোপনীয়তা বিশ্লেষণ একটি ধারাবাহিকতা মডুলাসের অধীনে

মৌলিক তথ্য

পেপার আইডি: 2501.04134
শিরোনাম: প্রজেক্টেড ল্যাঞ্জেভিন অ্যালগরিদমের জন্য মিক্সিং টাইম এবং গোপনীয়তা বিশ্লেষণ একটি ধারাবাহিকতা মডুলাসের অধীনে
লেখক: মারিও ব্রাভো, জুয়ান পাবলো ফ্লোরেস-মেলা, ক্রিস্টোবাল গুজম্যান
শ্রেণীবিভাগ: stat.ML cs.LG math.OC math.ST stat.TH
প্রকাশনার সময়: ২০২৫ সালের জানুয়ারি (arXiv প্রিপ্রিন্ট)
পেপার লিঙ্ক: https://arxiv.org/abs/2501.04134

সারসংক্ষেপ

এই পেপারটি প্রজেক্টেড ল্যাঞ্জেভিন অ্যালগরিদমের মিক্সিং টাইম এবং নয়েজ র‍্যান্ডম গ্র্যাডিয়েন্ট ডিসেন্ট (SGD) এর গোপনীয়তা বক্ররেখা অধ্যয়ন করে, যা অ-সম্প্রসারণশীল পুনরাবৃত্তির পরিধির বাইরে যায়। নির্দিষ্টভাবে, লেখকরা প্রজেক্টেড ল্যাঞ্জেভিন অ্যালগরিদমের জন্য নতুন মিক্সিং টাইম সীমানা প্রাপ্ত করেছেন, যা কিছু গুরুত্বপূর্ণ ক্ষেত্রে এই সীমানাগুলি মাত্রা-স্বাধীন এবং নির্ভুলতায় বহু-লগারিদমিক, যা মসৃণ উত্তল ক্ষেত্রে বিদ্যমান ফলাফলের সাথে ঘনিষ্ঠভাবে মিলে যায়। অতিরিক্তভাবে, এই পেপারটি সাব-স্যাম্পলিং নয়েজ SGD অ্যালগরিদমের জন্য নতুন গোপনীয়তা বক্ররেখার উপরের সীমানা স্থাপন করে। এই সীমানাগুলি গ্র্যাডিয়েন্ট নিয়মিততার প্রতি গুরুত্বপূর্ণ নির্ভরতা প্রদর্শন করে, যা মসৃণতার বাইরে বিস্তৃত উত্তল ক্ষতি ফাংশনের জন্য উপযোগী।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

১. স্যাম্পলিং সমস্যার গুরুত্ব: লগ-অবতল বিতরণ π ∝ e^(-f) থেকে স্যাম্পলিং করা একটি মৌলিক অ্যালগরিদমিক সমস্যা, যা ভলিউম অনুমান, অপ্টিমাইজেশন, বেয়েসীয় পরিসংখ্যান, মেশিন লার্নিং এবং ডিফারেনশিয়াল গোপনীয়তার সমস্যাগুলির জন্য একটি মৌলিক বিল্ডিং ব্লক।

२. ল্যাঞ্জেভিন অ্যালগরিদম: ল্যাঞ্জেভিন অ্যালগরিদম ল্যাঞ্জেভিন বিস্তারকে বিচ্ছিন্ন করে লক্ষ্য বিতরণকে অনুমান করে:

dL_t = -∇f(L_t)dt + √2dW_t

বিচ্ছিন্নকরণের পরে মার্কভ চেইন পাওয়া যায়:

X_{t+1} = Π_X[X_t - η∇f(X_t) + √(2η)ξ_t]

३. বিদ্যমান পদ্ধতির সীমাবদ্ধতা:

বেশিরভাগ গবেষণা দৃঢ় উত্তল মসৃণ সম্ভাব্যতা ফাংশন সেটিংয়ে কেন্দ্রীভূত
অ-মসৃণ উত্তল সম্ভাব্যতা ফাংশনের উপর গবেষণা কম
PABI (পুনরাবৃত্তি দ্বারা গোপনীয়তা পরিবর্ধন) প্রযুক্তি প্রধানত অ-সম্প্রসারণশীল পুনরাবৃত্তির মধ্যে সীমাবদ্ধ

গবেষণা প্রেরণা

এই পেপারটি PABI প্রযুক্তিকে ধারাবাহিকতা মডুলাস (modulus of continuity) এর মাধ্যমে অ-সম্প্রসারণশীল পুনরাবৃত্তির বাইরে প্রসারিত করার লক্ষ্য রাখে, যা অন্তর্নিহিত ম্যাপিংয়ের নিয়মিততা পরিমাপ করে, যাতে অ-পার্থক্যযোগ্য ফাংশন সহ আরও বিস্তৃত সম্ভাব্যতা ফাংশন শ্রেণী পরিচালনা করা যায়।

মূল অবদান

१. PABI ফ্রেমওয়ার্ক সম্প্রসারণ: PABI প্রযুক্তিকে ধারাবাহিকতা মডুলাস সহ সাধারণ ম্যাপিংয়ে প্রসারিত করা, এমনকি বিচ্ছিন্ন ম্যাপিংও পরিচালনা করতে পারে।

२. অপ্টিমাইজেশন সমস্যা ডিজাইন: PABI প্রয়োগের জন্য সর্বোত্তম Rényi বিচ্যুতি সীমানা পেতে একটি অপ্টিমাইজেশন সমস্যা ডিজাইন করা, যার সমাধানযোগ্যতা সম্পর্কিত গ্র্যাডিয়েন্ট ম্যাপিংয়ের ধারাবাহিকতা মডুলাসের সাথে ঘনিষ্ঠভাবে সম্পর্কিত।

३. স্পষ্ট সমাধান: প্রমাণ করা যে যখন ধারাবাহিকতা মডুলাস φ(δ) = √(cδ² + h) ফর্মে থাকে, তখন অপ্টিমাইজেশন সমস্যা সঠিকভাবে স্পষ্টভাবে সমাধান করা যায়।

४. মিক্সিং টাইম সীমানা: উত্তল এবং (p,M)-দুর্বল মসৃণ ক্ষেত্রের জন্য নতুন মিক্সিং টাইম সীমানা স্থাপন করা, যা কিছু ক্ষেত্রে মাত্রা-স্বাধীন এবং নির্ভুলতায় বহু-লগারিদমিক।

५. গোপনীয়তা বক্ররেখা বিশ্লেষণ: নয়েজ SGD এর জন্য নতুন গোপনীয়তা বক্ররেখার উপরের সীমানা স্থাপন করা, যা গ্র্যাডিয়েন্ট নিয়মিততার প্রতি গুরুত্বপূর্ণ নির্ভরতা প্রদর্শন করে।

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

প্রজেক্টেড নয়েজ পুনরাবৃত্তি অধ্যয়ন করা:

X_{t+1} = Π_X[Φ_t(X_t) + ξ_t], ξ_t ~ N(0, σ²_t I_{d×d})

যেখানে Φ_t এর ধারাবাহিকতা মডুলাস φ_t রয়েছে।

ধারাবাহিকতা মডুলাস ফ্রেমওয়ার্ক

সংজ্ঞা

ম্যাপিং Φ: X ⊆ ℝ^d → ℝ^d এর জন্য, অ-হ্রাসমান ফাংশন φ: ℝ₊ → ℝ₊ হল Φ এর ধারাবাহিকতা মডুলাস, যদি:

‖Φ(x) - Φ(y)‖ ≤ φ(‖x - y‖) ∀x, y ∈ X

গুরুত্বপূর্ণ ক্ষেত্র

१. উত্তল লিপশিৎজ: φ(δ) = √(δ² + (2ηL)²) २. উত্তল (p,M)-দুর্বল মসৃণ: φ(δ) = √(δ² + (2η^(1/(1-p))√((1-p)/(1+p))(M/2)^(1/(1-p)))²) ३. শক্তিশালী ক্ষয়: φ(δ) = √((1-2ηκ+η²β²)δ² + 2ηλ)

PABI সম্প্রসারণ

মূল লেম্মা

লেম্মা ३.२: X ⊆ ℝ^d একটি বন্ধ উত্তল সেট, Φ এর ধারাবাহিকতা মডুলাস φ রয়েছে। র‍্যান্ডম ভেরিয়েবল X, X' এবং গাউসীয় নয়েজ ξ ~ N(0, σ²I) এর জন্য, Y = Π_XΦ(X) + ξ, Y' = Π_XΦ(X') + ξ ধরুন, যেকোনো 0 < a ≤ φ(δ) এর জন্য:

R_α^(φ(δ)-a)(Y‖Y') ≤ R_α^(δ)(X‖X') + αa²/(2σ²)

স্থানান্তরিত অপ্টিমাইজেশন সমস্যা

PABI সীমানার সবচেয়ে কঠোর পেতে, স্থানান্তরিত অপ্টিমাইজেশন সমস্যা সমাধান করতে হবে:

min_{u∈R} E(u) := Σ_{t=1}^T (φ_{t-1}(u_{t-1}) - u_t)²/σ²_{t-1}

প্রধান তাত্ত্বিক ফলাফল

উপপাদ্য ३.४ (প্রধান ফলাফল)

φ_t(δ) = √(c_tδ² + h_t) ধরুন, তাহলে প্রজেক্টেড নয়েজ পুনরাবৃত্তির জন্য:

R_α(X_T‖X'_T) ≤ α/2 [Π_{k=0}^{T-1}c_k D² / Σ_{j=0}^{T-1}σ²_j Π_{l=j+1}^{T-1}c_l + Σ_{t=0}^{T-1} h_t Π_{k=t+1}^{T-1}c_k / Σ_{j=t}^{T-1}σ²_j Π_{l=j+1}^{T-1}c_l]

পরীক্ষামূলক সেটআপ

তাত্ত্বিক বিশ্লেষণ ফ্রেমওয়ার্ক

এই পেপারটি প্রধানত একটি তাত্ত্বিক কাজ, কঠোর গাণিতিক প্রমাণের মাধ্যমে সীমানা স্থাপন করে, অভিজ্ঞতামূলক পরীক্ষার পরিবর্তে। বিশ্লেষণ অন্তর্ভুক্ত করে:

१. মিক্সিং টাইম বিশ্লেষণ: সম্পূর্ণ পরিবর্তন দূরত্ব ব্যবহার করে সংগ্রহের গতি মূল্যায়ন করা २. গোপনীয়তা বিশ্লেষণ: Rényi ডিফারেনশিয়াল গোপনীয়তা ফ্রেমওয়ার্ক ব্যবহার করা ३. অপ্টিমাইজেশন বিশ্লেষণ: স্থানান্তরিত অপ্টিমাইজেশন সমস্যার সর্বোত্তম সমাধানের অস্তিত্ব এবং অনন্যতা প্রমাণ করা

মূল্যায়ন মেট্রিক্স

মিক্সিং টাইম: T_{mix,TV}(ε) = min{t ∈ ℕ: d(t) ≤ ε}
Rényi বিচ্যুতি: R_α(μ‖ν)
সম্পূর্ণ পরিবর্তন দূরত্ব: ‖μ - ν‖_

পরীক্ষার ফলাফল

মিক্সিং টাইম সীমানা

উপপাদ্য ४.२ (দুর্বল মসৃণ ক্ষেত্র)

উত্তল এবং (p,M)-দুর্বল মসৃণ ফাংশনের জন্য, যদি 1/η ≥ Θ হয়, তাহলে:

T_{mix,TV}(ε) ≤ ⌈D²/η⌉ · ⌈log₂(1/ε)⌉

যেখানে Θ = (M/2)^(2/(1+p))(1-p)/(1+p) max{16ln(D(M/2)^(1/(1-p))e), 27}^((1-p)/(1+p))

উপপাদ্য ४.३ (শক্তিশালী ক্ষয় ক্ষেত্র)

(λ,κ)-শক্তিশালী ক্ষয় এবং β-মসৃণ ফাংশনের জন্য, c = 1 - 2ηκ + η²β² < 1 ধরুন, তাহলে:

T_{mix,TV}(ε) = O(log_{1/c}(1 + D²(1-c)/(4η)) · (e/(1-c))^{λ/2} log₂(1/ε))

গোপনীয়তা বক্ররেখা বিশ্লেষণ

উপপাদ্য ५.२ (নয়েজ SGD)

উত্তল, L-লিপশিৎজ এবং (p,M)-দুর্বল মসৃণ ক্ষতির জন্য, নয়েজ SGD (α,ε)-RDP সন্তুষ্ট করে, যেখানে:

ε ≤ α/σ² [16L²T/n² + D²/(η²T) + 4η^(2p/(1-p))(1-p)/(1+p)(M/2)^(2/(1-p))ln(T·e)]

মূল আবিষ্কার

१. মাত্রা স্বাধীনতা: কিছু ক্ষেত্রে, মিক্সিং টাইম সীমানা মাত্রা d এর উপর নির্ভর করে না २. নিয়মিততা নির্ভরতা: গোপনীয়তা সীমানা গ্র্যাডিয়েন্টের নিয়মিততা প্যারামিটার p এর উপর উল্লেখযোগ্যভাবে নির্ভর করে ३. সর্বোত্তমতা: φ(δ) = √(cδ² + h) ফর্মের ধারাবাহিকতা মডুলাসের জন্য, অপ্টিমাইজেশন সমস্যার একটি অনন্য সর্বোত্তম সমাধান রয়েছে ४. অবক্ষয়িত ক্ষেত্র: যখন p = 0 (লিপশিৎজ ক্ষেত্র) হয়, n → ∞ এর সাথে অদৃশ্য হওয়া গোপনীয়তা সীমানা পাওয়া যায় না

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. PABI প্রযুক্তিকে অ-সম্প্রসারণশীল পুনরাবৃত্তির বাইরে সফলভাবে সম্প্রসারিত করা २. বিভিন্ন গুরুত্বপূর্ণ সম্ভাব্যতা ফাংশন শ্রেণীর জন্য কঠোর সীমানা স্থাপন করা ३. গোপনীয়তা এবং স্যাম্পলিং বিশ্লেষণে ধারাবাহিকতা মডুলাসের গুরুত্বপূর্ণ ভূমিকা প্রমাণ করা

সীমাবদ্ধতা

१. অ-মসৃণ ক্ষেত্র: লিপশিৎজ ক্ষেত্রে অ-তুচ্ছ গোপনীয়তা পরিবর্ধন পাওয়া যায় না २. পদক্ষেপ দৈর্ঘ্য সীমাবদ্ধতা: কিছু ফলাফল আরও কঠোর পদক্ষেপ দৈর্ঘ্য সীমাবদ্ধতা প্রয়োজন ३. নির্দিষ্ট ফর্ম: প্রধান ফলাফল φ(δ) = √(cδ² + h) ফর্মের ধারাবাহিকতা মডুলাসে সীমাবদ্ধ

ভবিষ্যত দিকনির্দেশনা

१. আরও সাধারণ ধারাবাহিকতা মডুলাস ফর্মে সম্প্রসারণ २. অ-মসৃণ ক্ষেত্রে গোপনীয়তা সীমানা উন্নত করা ३. জিন পয়েন্ট সমস্যা ইত্যাদি আরও জটিল সেটিংয়ে গবেষণা করা

গভীর মূল্যায়ন

শক্তি

१. তাত্ত্বিক উদ্ভাবন: PABI প্রযুক্তিকে আরও সাধারণ সেটিংয়ে সফলভাবে সম্প্রসারিত করা, যা গুরুত্বপূর্ণ তাত্ত্বিক মূল্য রয়েছে २. গাণিতিক কঠোরতা: প্রমাণ সম্পূর্ণ এবং কঠোর, অপ্টিমাইজেশন সমস্যার বিশ্লেষণাত্মক সমাধান গভীর গাণিতিক অন্তর্দৃষ্টি প্রদর্শন করে ३. ব্যবহারিক মূল্য: ফলাফল অ-পার্থক্যযোগ্য ফাংশন সহ বিস্তৃত সম্ভাব্যতা ফাংশন শ্রেণীতে প্রযোজ্য ४. একীভূত ফ্রেমওয়ার্ক: ধারাবাহিকতা মডুলাসের মাধ্যমে বিশ্লেষণের জন্য একটি একীভূত ফ্রেমওয়ার্ক প্রদান করা

অপূর্ণতা

१. প্রয়োগ সীমাবদ্ধতা: প্রধান ফলাফল নির্দিষ্ট ফর্মের ধারাবাহিকতা মডুলাসে সীমাবদ্ধ २. অভিজ্ঞতামূলক যাচাইকরণ: তাত্ত্বিক ফলাফলের কঠোরতা যাচাই করার জন্য সংখ্যাসূচক পরীক্ষার অভাব ३. অ-মসৃণ চ্যালেঞ্জ: অ-মসৃণ ক্ষেত্রে গোপনীয়তা ফলাফল তুলনামূলকভাবে নেতিবাচক

প্রভাব

१. তাত্ত্বিক অবদান: স্যাম্পলিং এবং গোপনীয়তা বিশ্লেষণের জন্য নতুন তাত্ত্বিক সরঞ্জাম প্রদান করা २. পদ্ধতিগত মূল্য: ধারাবাহিকতা মডুলাস পদ্ধতি অন্যান্য সম্পর্কিত গবেষণাকে অনুপ্রাণিত করতে পারে ३. ব্যবহারিক নির্দেশনা: প্রকৃত অ্যালগরিদম ডিজাইনের জন্য তাত্ত্বিক নির্দেশনা প্রদান করা

প্রযোজ্য পরিস্থিতি

१. বেয়েসীয় অনুমান: অ-মসৃণ পূর্ববর্তী সহ পোস্টেরিয়র স্যাম্পলিং জড়িত २. ডিফারেনশিয়াল গোপনীয়তা: নির্ভুল গোপনীয়তা গ্যারান্টি প্রয়োজন এমন মেশিন লার্নিং প্রয়োগ ३. অপ্টিমাইজেশন: অ-মসৃণ উত্তল অপ্টিমাইজেশন সমস্যার র‍্যান্ডম অ্যালগরিদম বিশ্লেষণ

রেফারেন্স

অল্টশুলার, জে. এবং তালওয়ার, কে. (२०२२, २०२३). পুনরাবৃত্তি দ্বারা গোপনীয়তা পরিবর্ধন
ফেল্ডম্যান, ভি. এট আল (२०१८). পুনরাবৃত্তি দ্বারা গোপনীয়তা পরিবর্ধন
ডালালিয়ান, এ. (२०१७). ল্যাঞ্জেভিন মন্টে কার্লো বিশ্লেষণ
বাবেক, এস. এট আল (२०१८). প্রজেক্টেড ল্যাঞ্জেভিন মন্টে কার্লো

এই পেপারটি তাত্ত্বিক মেশিন লার্নিং এবং ডিফারেনশিয়াল গোপনীয়তার ক্ষেত্রে গুরুত্বপূর্ণ অবদান রাখে, ধারাবাহিকতা মডুলাসের সৃজনশীল ব্যবহারের মাধ্যমে, PABI প্রযুক্তির প্রযোজ্যতার পরিধি সফলভাবে প্রসারিত করে, অ-মসৃণ অপ্টিমাইজেশন এবং গোপনীয়তা-সুরক্ষিত অ্যালগরিদম বিশ্লেষণের জন্য নতুন তাত্ত্বিক সরঞ্জাম প্রদান করে।