Given two measures $μ$, $ν$ on Rd that satisfy Carleman's condition, we provide a numerical scheme to approximate as closely as desired the total variation distance between $μ$ and $ν$. It consists of solving a sequence (hierarchy) of convex relaxations whose associated sequence of optimal values converges to the total variation distance, an additional illustration of the versatility of the Moment-SOS hierarchy. Indeed each relaxation in the hierarchy is a semidefinite program whose size increases with the number of involved moments. It has an optimal solution which is a couple of degree-2n pseudo-moments which converge, as n grows, to moments of the Hahn-Jordan decomposition of $μ$-$ν$.
- পেপার আইডি: 2401.01086
- শিরোনাম: সম্পূর্ণ ভেরিয়েশন দূরত্বের জন্য উত্তল শিথিলকরণের একটি শ্রেণিবিন্যাস
- লেখক: Jean B. Lasserre
- শ্রেণীবিভাগ: math.OC (অপ্টিমাইজেশন এবং নিয়ন্ত্রণ)
- প্রকাশনার সময়: ২০২৪ সালের জানুয়ারি (arXiv v3: ২০২৫ সালের অক্টোবর ১৬)
- পেপার লিঙ্ক: https://arxiv.org/abs/2401.01086
এই পেপারটি কার্লেম্যান শর্ত সন্তুষ্টকারী দুটি পরিমাপ μ এবং ν এর মধ্যে সম্পূর্ণ ভেরিয়েশন দূরত্বকে নির্বিচারে নির্ভুলভাবে অনুমান করার জন্য একটি সংখ্যাসূচক স্কিম প্রস্তাব করে। এই স্কিমটি শ্রেণিবদ্ধ উত্তল শিথিলকরণ সমস্যাগুলির একটি সিরিজ সমাধানের মাধ্যমে কাজ করে, যার সর্বোত্তম মানের ক্রম সম্পূর্ণ ভেরিয়েশন দূরত্বে রূপান্তরিত হয়, যা Moment-SOS শ্রেণিবিন্যাসের বহুমুখিতা প্রদর্শন করে। শ্রেণিবিন্যাসের প্রতিটি শিথিলকরণ একটি আধা-নির্দিষ্ট প্রোগ্রামিং সমস্যা, যার আকার জড়িত মুহূর্তের পরিমাণের সাথে বৃদ্ধি পায়, যার সর্বোত্তম সমাধান হল ডিগ্রি ২n এর একটি সিউডো-মোমেন্ট জোড়া, যা n বৃদ্ধির সাথে সাথে μ-ν এর Hahn-Jordan বিয়োজনের মুহূর্তে রূপান্তরিত হয়।
সম্পূর্ণ ভেরিয়েশন (Total Variation, TV) দূরত্বের সংখ্যাসূচক গণনা একটি গুরুত্বপূর্ণ এবং চ্যালেঞ্জিং সমস্যা, যা নিম্নলিখিত ক্ষেত্রে ব্যাপক প্রয়োগ রয়েছে:
- পরিসংখ্যানগত পরীক্ষা: সমজাতীয়তা পরীক্ষা এবং স্বাধীনতা পরীক্ষার জন্য ব্যবহৃত
- বিতরণ-শক্তিশালী অপ্টিমাইজেশন: অনিশ্চয়তা সেট সংজ্ঞায়িত করা
- ডেটা বিজ্ঞান এবং মেশিন লার্নিং: পরিমাপের মধ্যে দূরত্ব মেট্রিক
- অভিজ্ঞতামূলক অনুমানকারীর সমস্যা: র্যান্ডম নমুনার উপর ভিত্তি করে অভিজ্ঞতামূলক অনুমানকারী প্রায়শই অসামঞ্জস্যপূর্ণ, বিশেষত TV দূরত্বের জন্য
- গণনা চ্যালেঞ্জ: TV দূরত্ব "খারাপ" খরচ ফাংশন c(x,y) = 1_{x≠y} ব্যবহার করে Wasserstein দূরত্বের সমতুল্য, কার্যকরভাবে গণনা করা কঠিন
- ফাংশন স্থান খুব বড়: মান দ্বৈত সূত্রে সীমাবদ্ধ পরিমাপযোগ্য ফাংশনের স্থান খুব বড়, কার্যকরভাবে মূল্যায়ন করা কঠিন
- সমর্থন সেট সীমাবদ্ধতা: বিদ্যমান পদ্ধতিগুলি সাধারণত কমপ্যাক্ট সমর্থন সেট প্রয়োজন
বিদ্যমান অবদানগুলি প্রধানত নির্দিষ্ট বিতরণ শ্রেণীর জন্য বিশ্লেষণাত্মক উপরি এবং নিম্ন সীমা প্রদানে কেন্দ্রীভূত, সর্বজনীন সংখ্যাসূচক গণনা পদ্ধতির অভাব রয়েছে। এই পেপারটি তুলনামূলকভাবে দুর্বল অনুমানের অধীনে একটি ব্যবহারিক গণনা স্কিম প্রদান করার লক্ষ্য রাখে।
- সংখ্যাসূচক গণনা স্কিম: Moment-SOS শ্রেণিবিন্যাসের উপর ভিত্তি করে আধা-নির্দিষ্ট প্রোগ্রামিং শিথিলকরণের একটি ক্রম প্রস্তাব করা হয়েছে যা TV দূরত্বকে নির্বিচারে নির্ভুলভাবে অনুমান করতে পারে
- তাত্ত্বিক গ্যারান্টি: শিথিলকরণ ক্রমের একঘেয়েতা এবং রূপান্তর প্রমাণ করা হয়েছে, সর্বোত্তম মান প্রকৃত TV দূরত্বের দিক থেকে নিচে রূপান্তরিত হয়
- অ-কমপ্যাক্ট সমর্থন প্রক্রিয়াকরণ: পদ্ধতি অ-কমপ্যাক্ট সমর্থনের পরিমাপের জন্য প্রযোজ্য, শুধুমাত্র কার্লেম্যান শর্ত সন্তুষ্ট করা প্রয়োজন
- বিশেষ ক্ষেত্রে সঠিক সমাধান: বাস্তব অক্ষে পরমাণু পরিমাপের জন্য, যখন শিথিলকরণ ডিগ্রি n ≥ maxm₁,m₂ হয় তখন সঠিক সমাধান পাওয়া যায়
- দ্বৈত তত্ত্ব: দ্বৈত আধা-নির্দিষ্ট প্রোগ্রামিং প্রদান করা হয়েছে, যা বহুপদে সীমাবদ্ধ করে এবং শাস্ত্রীয় TV দূরত্ব দ্বৈত সূত্রকে শক্তিশালী করার জন্য শাস্তি শর্ত যোগ করে কীভাবে তা প্রকাশ করে
দুটি সীমাবদ্ধ Borel পরিমাপ μ, ν ∈ M(ℝᵈ)₊ দেওয়া, তাদের সম্পূর্ণ ভেরিয়েশন দূরত্ব গণনা করুন:
∥μ−ν∥TV=supf{∫fdμ−∫fdν:∥f∥∞≤1}
অনুমান 2.5:
- μ এবং ν এর সমস্ত মুহূর্ত সীমাবদ্ধ
- μ এবং ν শর্ত সন্তুষ্ট করে: ∫exp(c∣xi∣)dμ<∞, কিছু c > 0 এবং সমস্ত i = 1,...,d এর জন্য
TV দূরত্বকে অসীম-মাত্রিক LP হিসাবে পুনর্নির্মাণ করুন:
τ=infϕ+,ϕ−∈M(Rd)+{ϕ+(1)+ϕ−(1):ϕ+−ϕ−=μ−ν}
আধিপত্য সীমাবদ্ধতা যোগ করে সমতুল্য সমস্যা পান:
ρ=infϕ+,ϕ−∈M(Rd)+{ϕ+(1)+ϕ−(1):ϕ+−ϕ−=μ−ν;ϕ+≤μ;ϕ−≤ν}
লেম্মা 2.2 ব্যবহার করে, আধিপত্য সীমাবদ্ধতা মুহূর্ত ম্যাট্রিক্স শর্তের সমতুল্য:
ϕ≤μ⇔Mn(ϕ)⪯Mn(μ),∀n∈N
n-তম স্তরের শিথিলকরণ সমস্যা:
ρn=minϕ,ψ{ϕ(1)+ψ(1):ϕα−ψα=μα−να,∀α∈N2nd;0⪯Mn(ϕ)⪯Mn(μ);0⪯Mn(ψ)⪯Mn(ν)}
- আধিপত্য সীমাবদ্ধতার মূল ভূমিকা: যদিও অসীম-মাত্রিক সূত্রে অপ্রয়োজনীয়, শিথিলকরণ স্কিমে এটি সংকোচন সরঞ্জাম হিসাবে অত্যন্ত উপকারী
- কার্লেম্যান শর্তের চতুর ব্যবহার: পরিমাপের অনন্যতা নিশ্চিত করে, মুহূর্ত সীমাবদ্ধতাকে আধিপত্য সীমাবদ্ধতার সমতুল্য করে তোলে
- Hahn-Jordan বিয়োজনের প্রাকৃতিক উপস্থিতি: সর্বোত্তম সমাধান μ-ν এর Hahn-Jordan বিয়োজনের মুহূর্তে রূপান্তরিত হয়
- দ্বৈত সমস্যার বহুপদ সীমাবদ্ধতা: বহুপদ স্থানে সীমাবদ্ধ করে এবং ‖f‖∞ ≤ 1 সীমাবদ্ধতার লঙ্ঘন পরিচালনা করার জন্য শাস্তি শর্ত যোগ করে
- সফটওয়্যার: বহুপদ অপ্টিমাইজেশনের জন্য GloptiPoly 3
- সমাধানকারী: SeDuMi 1.03 আধা-নির্দিষ্ট প্রোগ্রামিং সমাধানকারী
- প্ল্যাটফর্ম: HP Elitebook Ubuntu 24 ল্যাপটপ
- পারস্পরিক বিচ্ছিন্ন সমর্থন: X = {-1.0, 0.0, 1.0, 2.0}, Y = {-0.7, 0.3, 1.3, 2.3}
- একটি সাধারণ পয়েন্ট: X ∩ Y = {-1.0}
- কাছাকাছি পরমাণু: সংখ্যাগত স্থিতিশীলতা পরীক্ষা
- বিভিন্ন গড় এবং বৈচিত্র্যের গাউসিয়ান বিতরণ N(m₁,σ₁) এবং N(m₂,σ₂)
- মুহূর্ত সংখ্যা 2n = 4 থেকে 2n = 8 পর্যন্ত
- শিথিলকরণ সর্বোত্তম মান ρₙ এবং প্রকৃত TV দূরত্বের নৈকট্য
- রূপান্তর গতি এবং সংখ্যাগত স্থিতিশীলতা
- গণনা সময় (সমস্ত ফলাফল 0.35 সেকেন্ডের মধ্যে সম্পন্ন)
বাস্তব অক্ষে পরমাণু পরিমাপের জন্য, যখন n ≥ maxm₁,m₂ হয় তখন সঠিক সমাধান পান:
- উদাহরণ 1: μ = δ₀, ν = δₑ, ρ₁ = 2 (সঠিক)
- উদাহরণ 2: চারটি পরমাণু, একটি সাধারণ পয়েন্ট, ρ₄ = 1.499 ≈ 1.5
- উদাহরণ 3: পারস্পরিক বিচ্ছিন্ন পরমাণু, ρ₄ = 1.9999 ≈ 2
| (m₁,σ₁) | (m₂,σ₂) | ρ₁ | ρ₂ | ρ₃ | ρ₄ |
|---|
| (0,0.1) | (1,0.1) | 1.9231 | 1.9936 | 1.9991 | 1.9997 |
| (0,0.2) | (1,0.2) | 1.7241 | 1.9049 | 1.9376 | 1.939 |
| (0,0.5) | (1,0.5) | 1.0000 | 1.0000 | 1.1653 | 1.1897 |
- ρ₁ সাহিত্যে 1 এর বিশ্লেষণাত্মক নিম্ন সীমার সাথে সম্পূর্ণভাবে সামঞ্জস্যপূর্ণ
- n=2 থেকে শুরু করে উল্লেখযোগ্য উন্নতি, n=3,4 এ আরও ভাল প্রভাব
- ছোট বৈচিত্র্যে পারস্পরিক একবচন পরিমাপের আচরণের কাছাকাছি (TV দূরত্ব 2 এর কাছাকাছি)
উপপাদ্য 3.1 গ্যারান্টি দেয়:
- প্রতিটি শিথিলকরণের একটি সর্বোত্তম সমাধান রয়েছে
- ρₙ ↑ ‖μ-ν‖_ একঘেয়ে রূপান্তর
- সর্বোত্তম সমাধান Hahn-Jordan বিয়োজনের মুহূর্তে রূপান্তরিত হয়
- অভিজ্ঞতামূলক অনুমানকারী: নমুনার উপর ভিত্তি করে দূরত্ব অনুমান, কিন্তু TV দূরত্বের অনুমানকারী প্রায়শই অসামঞ্জস্যপূর্ণ
- বিশ্লেষণাত্মক সীমানা: নির্দিষ্ট বিতরণ শ্রেণীর জন্য (যেমন উচ্চ-মাত্রিক গাউসিয়ান, গাউসিয়ান মিশ্রণ) উপরি এবং নিম্ন সীমা প্রদান করা
- অসমতা পদ্ধতি: Pinsker অসমতা, Hellinger দূরত্ব সীমানা
- সর্বোত্তম পরিবহন: Kantorovich মেট্রিকের জন্য ডেডিকেটেড অ্যালগরিদম (যেমন Sinkhorn অ্যালগরিদম)
- সর্বজনীনতা: কার্লেম্যান শর্ত সন্তুষ্টকারী সাধারণ পরিমাপের জন্য প্রযোজ্য
- অ-কমপ্যাক্ট সমর্থন: কমপ্যাক্ট সমর্থন সেট প্রয়োজন নেই
- গ্যারান্টিযুক্ত রূপান্তর: তাত্ত্বিক গ্যারান্টিযুক্ত একঘেয়ে রূপান্তর
- ব্যবহারিকতা: বন্ধ-ফর্ম মুহূর্ত এবং অভিজ্ঞতামূলক মুহূর্ত উভয় ক্ষেত্রে পরিচালনা করতে পারে
- TV দূরত্ব গণনার জন্য একটি সর্বজনীন সংখ্যাসূচক স্কিম প্রদান করা হয়েছে
- তুলনামূলকভাবে দুর্বল অনুমানের অধীনে নির্বিচার নির্ভুলতা অনুমান অর্জন করা হয়েছে
- প্রতিটি শিথিলকরণ গ্যারান্টিযুক্ত নিম্ন সীমা প্রদান করে
- বিচ্ছিন্ন পরিমাপের জন্য সঠিক সমাধান পাওয়া যায়
- মাত্রা সংবেদনশীলতা: পদ্ধতি মাত্রার প্রতি সংবেদনশীল, বর্তমানে ছোট মাত্রার সমস্যায় সীমাবদ্ধ
- আধা-নির্দিষ্ট প্রোগ্রামিং সমাধানকারী সীমাবদ্ধতা: উচ্চ ডিগ্রি শিথিলকরণ সমস্যা সমাধানের প্রত্যাশা করা যায় না
- সংখ্যাগত নির্ভুলতা: যখন পরমাণু খুব কাছাকাছি থাকে তখন সংখ্যাগত সমস্যার সম্মুখীন হতে পারে
- নমুনা আকার প্রয়োজনীয়তা: অভিজ্ঞতামূলক মুহূর্ত ব্যবহার করার সময় যথেষ্ট বড় নমুনা প্রয়োজন
- গণনা সস্তা বিকল্প নিম্ন সীমানা প্রদান করা
- উচ্চ-মাত্রিক সমস্যা প্রক্রিয়াকরণে সম্প্রসারণ
- সংখ্যাগত স্থিতিশীলতা উন্নত করা
- অন্যান্য দূরত্ব মেট্রিকের সাথে তুলনামূলক গবেষণা
- তাত্ত্বিক কঠোরতা: সম্পূর্ণ রূপান্তর প্রমাণ এবং দ্বৈত তত্ত্ব
- পদ্ধতি উদ্ভাবন: TV দূরত্ব গণনায় Moment-SOS শ্রেণিবিন্যাসের প্রথম প্রয়োগ
- ব্যবহারিক মূল্য: বন্ধ-ফর্ম এবং নমুনা উভয় ডেটা ফর্ম পরিচালনা করতে পারে
- নির্ভুলতা গ্যারান্টি: নির্দিষ্ট ক্ষেত্রে (পরমাণু পরিমাপ) সঠিক সমাধান পাওয়া যায়
- গণনা জটিলতা: আধা-নির্দিষ্ট প্রোগ্রামিং এর গণনা জটিলতা প্রয়োগের স্কেল সীমাবদ্ধ করে
- সীমিত পরীক্ষা: প্রধানত কম মাত্রা এবং সরল বিতরণে পরীক্ষা করা হয়েছে
- বিদ্যমান পদ্ধতির সাথে তুলনা অপর্যাপ্ত: TV দূরত্ব গণনার অন্যান্য পদ্ধতির সাথে সিস্টেমেটিক তুলনার অভাব
- তাত্ত্বিক অবদান: TV দূরত্ব গণনার জন্য নতুন তাত্ত্বিক কাঠামো প্রদান করা হয়েছে
- পদ্ধতিগত মূল্য: সম্ভাব্য মেট্রিক গণনায় Moment-SOS শ্রেণিবিন্যাসের সম্ভাবনা প্রদর্শন করা হয়েছে
- ব্যবহারিক প্রয়োগ: বিতরণ-শক্তিশালী অপ্টিমাইজেশন ইত্যাদি ক্ষেত্রে নতুন সরঞ্জাম প্রদান করা হয়েছে
- সঠিক গণনা প্রয়োজনীয়তা: তাত্ত্বিক গ্যারান্টিযুক্ত TV দূরত্ব নিম্ন সীমা প্রয়োজন
- ছোট মাত্রা সমস্যা: মাত্রা অপেক্ষাকৃত কম ব্যবহারিক প্রয়োগ
- বিশেষ বিতরণ: গাউসিয়ান, সূচকীয় বিতরণ এবং তাদের মিশ্রণ
- বিচ্ছিন্ন বিতরণ: সীমাবদ্ধ সমর্থনের পরমাণু পরিমাপ
পেপারটি 28টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, যা সর্বোত্তম পরিবহন, মুহূর্ত সমস্যা, আধা-নির্দিষ্ট প্রোগ্রামিং এবং সম্ভাব্য মেট্রিক্স সহ একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, বিশেষত লেখকের Moment-SOS শ্রেণিবিন্যাসে নিজস্ব সিরিজ কাজ 21,24,26 এই পেপারের তাত্ত্বিক ভিত্তি গঠন করে।