2025-11-28T22:22:19.391257

Criterion for the resemblance between the mother and the model distribution

Sheena
If the probability distribution model aims to approximate the hidden mother distribution, it is imperative to establish a useful criterion for the resemblance between the mother and the model distributions. This study proposes a criterion that measures the Hellinger distance between discretized (quantized) samples from both distributions. Unlike information criteria such as AIC, this criterion does not require the probability density function of the model distribution, which cannot be explicitly obtained for a complicated model such as a deep learning machine. Second, it can draw a positive conclusion (i.e., both distributions are sufficiently close) under a given threshold, whereas a statistical hypothesis test, such as the Kolmogorov-Smirnov test, cannot genuinely lead to a positive conclusion when the hypothesis is accepted. In this study, we establish a reasonable threshold for the criterion deduced from the Bayes error rate and also present the asymptotic bias of the estimator of the criterion. From these results, a reasonable and easy-to-use criterion is established that can be directly calculated from the two sets of samples from both distributions.
academic

মাতৃ এবং মডেল বিতরণের মধ্যে সাদৃশ্যের জন্য মানদণ্ড

মৌলিক তথ্য

  • পেপার আইডি: 2212.03397
  • শিরোনাম: মাতৃ এবং মডেল বিতরণের মধ্যে সাদৃশ্যের জন্য মানদণ্ড
  • লেখক: ইয়ো শীনা (শিগা বিশ্ববিদ্যালয়, জাপান; পরিসংখ্যানগত গণিত প্রতিষ্ঠানের অতিথি অধ্যাপক, জাপান)
  • শ্রেণীবিভাগ: math.ST stat.TH
  • প্রকাশনার সময়: নভেম্বর ১৩, ২০২৫ (arXiv v3)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2212.03397

সারসংক্ষেপ

এই পেপারটি সম্ভাব্যতা বিতরণ মডেল এবং প্রকৃত ডেটা বিতরণ (মাতৃ বিতরণ) এর মধ্যে সাদৃশ্যের পরিমাপের সমস্যা অধ্যয়ন করে। এটি বিচ্ছিন্নকৃত নমুনা হেলিঞ্জার দূরত্বের উপর ভিত্তি করে একটি মানদণ্ড প্রস্তাব করে, যা মডেল বিতরণের স্পষ্ট সম্ভাব্যতা ঘনত্ব ফাংশনের প্রয়োজন করে না, তাই গভীর শিক্ষার মতো জটিল মডেলের জন্য উপযুক্ত। ঐতিহ্যবাহী অনুমান পরীক্ষা (যেমন কলমোগোরভ-স্মিরনভ পরীক্ষা) এর বিপরীতে, এই মানদণ্ড একটি নির্দিষ্ট থ্রেশহোল্ডের অধীনে "দুটি বিতরণ যথেষ্ট কাছাকাছি" এর ইতিবাচক সিদ্ধান্তে পৌঁছাতে পারে। গবেষণা বেয়েস ত্রুটির হার থেকে উদ্ভূত যুক্তিসঙ্গত থ্রেশহোল্ড প্রতিষ্ঠা করে এবং মানদণ্ড অনুমানকারীর অ্যাসিম্পটোটিক পক্ষপাত বিশ্লেষণ প্রদান করে।

গবেষণা পটভূমি এবং প্রেরণা

১. মূল সমস্যা

যখন একটি সম্ভাব্যতা বিতরণ মডেল অজানা প্রকৃত ডেটা বিতরণ (মাতৃ বিতরণ) অনুমান করার লক্ষ্যে থাকে, তখন কার্যকর সাদৃশ্য পরিমাপ মানদণ্ড প্রতিষ্ঠা করা একটি মৌলিক সমস্যা। এটি উৎপাদনশীল মডেল (যেমন গভীর উৎপাদনশীল মডেল, বেয়েসীয় মডেল) মূল্যায়নে বিশেষভাবে গুরুত্বপূর্ণ।

২. সমস্যার গুরুত্ব

  • মডেল মূল্যায়নের প্রয়োজনীয়তা: মেশিন লার্নিং এবং পরিসংখ্যানগত মডেলিংয়ে, উৎপাদিত মডেল প্রকৃত ডেটা বিতরণকে যথেষ্টভাবে অনুমান করে কিনা তা নির্ধারণ করা প্রয়োজন
  • ব্যবহারিক তাৎপর্য: প্রশিক্ষণ যথেষ্ট কিনা, প্যারামেট্রিক মডেল উপযুক্ত কিনা, নমুনা আকার যথেষ্ট কিনা ইত্যাদি ব্যবহারিক সমস্যা নির্ধারণ করা
  • তাত্ত্বিক মূল্য: বিতরণ সাদৃশ্যের জন্য ব্যাখ্যাযোগ্য পরিমাণগত মান প্রদান করা

৩. বিদ্যমান পদ্ধতির সীমাবদ্ধতা

কুলব্যাক-লেইবলার বিচ্যুতি এবং তথ্য মানদণ্ড (যেমন AIC):

  • মডেল বিতরণের স্পষ্ট সম্ভাব্যতা ঘনত্ব ফাংশন gm(x) প্রয়োজন
  • জটিল মডেলের জন্য (যেমন গভীর স্নায়ু নেটওয়ার্ক, বেয়েসীয় মডেল) স্পষ্ট ফর্ম পাওয়া কঠিন
  • যদিও মডেল তুলনার জন্য ব্যবহার করা যায়, সংখ্যাসূচক মান নিজেই পরিসংখ্যানগত অর্থ অভাব করে, মডেল মূল্যায়নের জন্য ব্যবহার করা যায় না

পরিসংখ্যানগত অনুমান পরীক্ষা (যেমন K-S পরীক্ষা):

  • মূল অনুমান প্রত্যাখ্যান করার সময় শুধুমাত্র "দুটি বিতরণ ভিন্ন" এর সিদ্ধান্তে পৌঁছানো যায়, কিন্তু বাস্তবে এখনও অনুরূপ হতে পারে
  • বড় নমুনায় ক্ষুদ্র পার্থক্য সনাক্ত করার কারণে অনুমান প্রত্যাখ্যান করা সহজ
  • অনুমান গ্রহণ করার সময় "দুটি বিতরণ যথেষ্ট কাছাকাছি" এর ইতিবাচক সিদ্ধান্তে পৌঁছানো যায় না
  • p মান সরাসরি বিতরণ সাদৃশ্যের ডিগ্রি প্রতিফলিত করে না

৪. গবেষণা প্রেরণা

এমন একটি পদ্ধতি প্রস্তাব করা যা:

  • সরাসরি নমুনা থেকে গণনা করা যায়, স্পষ্ট ঘনত্ব ফাংশনের প্রয়োজন নেই
  • "যথেষ্ট কাছাকাছি" এর ইতিবাচক সিদ্ধান্ত প্রদান করে
  • ব্যাখ্যাযোগ্য থ্রেশহোল্ড সহ সাদৃশ্য মানদণ্ড রয়েছে

মূল অবদান

১. বিচ্ছিন্নকৃত হেলিঞ্জার দূরত্বের উপর ভিত্তি করে দুটি-নমুনা মানদণ্ড প্রস্তাব করা: দুটি বিতরণের নমুনা বিচ্ছিন্ন করে (পরিমাণ করে), বহুপদী বিতরণ স্তরে হেলিঞ্জার দূরত্ব তুলনা করে

२. বেয়েস ত্রুটির হারের সাথে তাত্ত্বিক সংযোগ প্রতিষ্ঠা করা (উপপাদ্য ১): f-বিচ্যুতি এবং বেয়েস ত্রুটির হারের মধ্যে সম্পর্ক প্রমাণ করে, বিচ্যুতি মান ব্যবহারিক ব্যাখ্যাযোগ্যতা প্রদান করে

३. যুক্তিসঙ্গত থ্রেশহোল্ড মান উদ্ভব করা: বেয়েস ত্রুটির হার থেকে হেলিঞ্জার দূরত্বের থ্রেশহোল্ড δ* = 8ϵ² উদ্ভব করে, যেখানে ϵ র্যান্ডম অনুমান থেকে ত্রুটির হারের বিচ্যুতির সাথে সম্পর্কিত

४. চলমান অঞ্চল বিচ্ছিন্নকরণ পদ্ধতি প্রস্তাব করা: স্থির অঞ্চল পদ্ধতির তুলনায়, n⁻² ক্রমে উন্নত অ্যাসিম্পটোটিক দক্ষতা রয়েছে (উপপাদ্য ২ এবং ३)

५. অনুমানকারীর অ্যাসিম্পটোটিক পক্ষপাত বিশ্লেষণ প্রদান করা (উপপাদ্য ४): অনুমানকারী EDm⁽¹⁾ : m⁽²⁾ এর উপরের সীমা প্রমাণ করে EDm̂⁽¹⁾ : m̂⁽²⁾ + √(8p'/n₂) + o(n₁⁻¹) + o(n₂⁻¹/²)

६. ব্যবহারিক মডেল ফিটিং মানদণ্ড প্রতিষ্ঠা করা:

D[m̂⁽¹⁾ : m̂⁽²⁾] + p'/(2n₁) + √(8p'/n₂) < 8ϵ²

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

দুটি নমুনা সেট দেওয়া:

  • মাতৃ বিতরণ পর্যবেক্ষণ ডেটা: X⁽¹⁾ = {X₁⁽¹⁾, ..., Xₙ₁⁽¹⁾}
  • মডেল উৎপাদিত নমুনা: X⁽²⁾ = {X₁⁽²⁾, ..., Xₙ₂⁽²⁾}

লক্ষ্য: মাতৃ বিতরণ এবং মডেল বিতরণ যথেষ্ট কাছাকাছি কিনা তা নির্ধারণ করার জন্য একটি মানদণ্ড প্রতিষ্ঠা করা।

পদ্ধতি স্থাপত্য

१. f-বিচ্যুতি এবং বেয়েস ত্রুটির হারের সম্পর্ক

দুটি সম্ভাব্যতা ঘনত্ব ফাংশন g₁(x) এবং g₂(x) এর জন্য, f-বিচ্যুতি সংজ্ঞায়িত করা হয়:

Df[g₁(x) | g₂(x)] = ∫ g₁(x)f(g₂(x)/g₁(x))dµ(x)

বেয়েস ত্রুটির হার:

Er[g₁(x)|g₂(x)] = (1/2)∫ min(g₁(x), g₂(x))dµ

উপপাদ্য १ মূল সংযোগ প্রতিষ্ঠা করে: যদি Dfg₁(x) | g₂(x) < δ হয়, তাহলে Erg₁(x) | g₂(x) ≥ α(δ), যেখানে α(δ) হল δ এর একটি ফাংশন।

হেলিঞ্জার দূরত্বের জন্য (f(x) = 2(1-√x)²), আনুমানিক:

α(δ) ≈ (1 - √(δ/2))/2

বেয়েস ত্রুটির হার 1/2 - ϵ এ থ্রেশহোল্ড সেট করে (র্যান্ডম অনুমানের কাছাকাছি), পাওয়া যায়:

δ* = 8ϵ²

२. বিচ্ছিন্নকরণ পদ্ধতি

স্থির অঞ্চল পদ্ধতি: অঞ্চল বিভাজন Iᵢ পূর্বে নির্ধারিত, নমুনা থেকে স্বাধীন।

চলমান অঞ্চল পদ্ধতি (এই পেপার সুপারিশকৃত): নমুনা X⁽²⁾ এর কোয়ান্টাইলের উপর ভিত্তি করে গতিশীলভাবে অঞ্চল নির্ধারণ করা।

স্কেলার ক্ষেত্রে (k=1):

  • কোয়ান্টাইল পয়েন্ট নির্বাচন করুন λᵢ = i/(p+1), i = 1,...,p
  • X⁽²⁾ এর ক্রম পরিসংখ্যান ব্যবহার করে অন্তরাল শেষ বিন্দু নির্ধারণ করুন: ξ̂ᵢ = X₍ñᵢ₎⁽²⁾, যেখানে ñᵢ = ⌊n₂λᵢ⌋
  • চলমান অন্তরাল সংজ্ঞায়িত করুন Iᵢ = (ξ̂ᵢ, ξ̂ᵢ₊₁)

ভেক্টর ক্ষেত্রে (k≥२):

  • পুনরাবৃত্তিমূলক বিভাজন পদ্ধতি ব্যবহার করুন
  • i-তম ধাপে i-তম স্থানাঙ্ক বরাবর ক্রম পরিসংখ্যান ব্যবহার করে বিভাজন করুন
  • বিভাজন গভীরতা l (≤k)

३. বহুপদী বিতরণ নির্মাণ

চলমান অঞ্চল Aj(l) এর উপর ভিত্তি করে, দুটি বহুপদী বিতরণ নির্মাণ করুন:

m⁽¹⁾ = {m_j(l)⁽¹⁾}, m_j(l)⁽¹⁾ = P(X ∈ Aj(l)|মাতৃ বিতরণ)
m⁽²⁾ = {m_j(l)⁽²⁾}, m_j(l)⁽²⁾ = P(X ∈ Aj(l)|মডেল বিতরণ)

অনুমানকারী:

m̂⁽¹⁾ = {m̂_j(l)⁽¹⁾}, m̂_j(l)⁽¹⁾ = #{X⁽¹⁾ | X⁽¹⁾ ∈ Aj(l)}/n₁
m̂⁽²⁾ = {m̂_j(l)⁽²⁾}, m̂_j(l)⁽²⁾ = 1/(p'_j(l-1) + 1)

४. হেলিঞ্জার দূরত্ব গণনা

হেলিঞ্জার দূরত্ব সংজ্ঞায়িত করা হয়:

D[m⁽¹⁾ : m⁽²⁾] = 2∑_j(l) (√m_j(l)⁽¹⁾ - √m_j(l)⁽²⁾)²

অনুমানকারী:

D[m̂⁽¹⁾ : m̂⁽²⁾] = 2∑_j(l) (√m̂_j(l)⁽¹⁾ - √m̂_j(l)⁽²⁾)²

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. তাত্ত্বিক উদ্ভাবন:

  • f-বিচ্যুতি এবং বেয়েস ত্রুটির হারের মধ্যে সাধারণ সম্পর্ক প্রতিষ্ঠা করা (উপপাদ্য १), বিচ্যুতি মান শ্রেণীবিভাগ ত্রুটির স্বজ্ঞাত ব্যাখ্যা প্রদান করে
  • চলমান অঞ্চল পদ্ধতির একক-নমুনা সমস্যায় অ্যাসিম্পটোটিক উচ্চতর প্রমাণ করা (উপপাদ্য २, ३)

२. পদ্ধতি উদ্ভাবন:

  • স্থির অঞ্চলের পরিবর্তে চলমান অঞ্চল পদ্ধতি ব্যবহার করে অনুমান দক্ষতা উন্নত করা
  • শূন্য অনুমান সমস্যা এড়াতে হেলিঞ্জার দূরত্ব নির্বাচন করা (যখন -1 < α < 1 হয় তখন বিচ্যুতি ঘটে না)
  • মডেল নমুনা X⁽²⁾ ব্যবহার করে অঞ্চল নির্মাণ করা (কারণ সাধারণত n₂ >> n₁)

३. পক্ষপাত বিশ্লেষণ:

  • উপপাদ্য ४ অনুমানকারীর অ্যাসিম্পটোটিক পক্ষপাত উপরের সীমা প্রদান করে
  • n₂ এর প্রভাব n₂⁻¹/² ক্রম, n₁ এর প্রভাব n₁⁻¹ ক্রম
  • এটি ব্যাখ্যা করে কেন তুলনামূলকভাবে বড় n₂ প্রয়োজন

४. ব্যবহারিক মানদণ্ড:

  • পক্ষপাত সংশোধন সহ সম্পূর্ণ মানদণ্ড প্রদান করা (সূত্র ४०)
  • থ্রেশহোল্ড 8ϵ² স্পষ্ট পরিসংখ্যানগত অর্থ রয়েছে (বেয়েস ত্রুটির হারের সাথে সম্পর্কিত)

পরীক্ষামূলক সেটআপ

ডেটাসেট

কেস १: বহুমাত্রিক সাধারণ বিতরণ

  • মাতৃ বিতরণ: X⁽¹⁾ᵢ ~ N(α, Iₖ + βV), যেখানে Vᵢⱼ = 0.95|ⁱ⁻ʲ|
  • মডেল বিতরণ: X⁽²⁾ᵢ ~ N(0, Iₖ) (মান সাধারণ)
  • প্যারামিটার সেটিং:
    • মাত্রা k = 3, বিভাজন গভীরতা l = 3
    • প্রতিটি চলকের বিভাজন সংখ্যা p = pⱼ₍₁₎ = pⱼ₍२₎ = 3
    • মোট অঞ্চল সংখ্যা p' = (3+1)³ - 1 = 63
    • সাদৃশ্য প্যারামিটার (α, β) = (0,0), (0.01,0.01), (0.1,0.1), (1,1)
    • নমুনা আকার n₁ ∈ {10³, 10⁴, 10⁵, 10⁶, 10⁷}, n₂ = 10⁷

উচ্চ-মাত্রিক ক্ষেত্র:

  • k = 10, p = pⱼ₍१₎ = ... = pⱼ₍९₎ = 3
  • সম্পূর্ণ গভীরতা বিভাজনের জন্য p' = (3+1)¹⁰ - 1 > 10⁶ প্রয়োজন, l = 2 ব্যবহার করুন
  • সমস্ত চলকের দ্বি-মাত্রিক সীমান্ত বিতরণ বিবেচনা করুন

কেস २: বেয়েসীয় মডেল

  • ডেটাসেট: UCI বিদ্যুৎ উৎপাদন ডেটাসেট (९५६८ নমুনা)
  • মডেল: সাধারণ রিগ্রেশন মডেল y = β₁ + ∑ᵢ₌२⁵ βᵢxᵢ + ϵ
  • পূর্ব বিতরণ:
    • β₁ ~ Cauchy(0, 10)
    • βᵢ ~ Cauchy(0, 2.5), i = 2,...,5
    • σ ~ t(5, 5, 1)
  • MCMC নমুনা: ४००० β পরবর্তী নমুনা
  • পূর্বাভাস মান নমুনা: n₂ = 4000 × 9568 ≈ 3.827×10⁷
  • প্রকৃত মান নমুনা: n₁ = 9568
  • অঞ্চল সংখ্যা: p' = 10

মূল্যায়ন সূচক

१. হেলিঞ্জার দূরত্ব: Dm̂⁽¹⁾ : m̂⁽²⁾ २. সম্পূর্ণ মানদণ্ড মান (সূত্র ४०এর বাম দিক): Dm̂⁽¹⁾ : m̂⁽²⁾ + p'/(2n₁) + √(8p'/n₂) ३. থ্রেশহোল্ড: 8ϵ² (ϵ = 0.05 সময় 0.02, ϵ = 0.01 সময় 0.0008) ४. তুলনা পদ্ধতি: কলমোগোরভ-স্মিরনভ পরীক্ষার p মান

বাস্তবায়ন বিবরণ

  • পক্ষপাত সংশোধন শর্তাবলী: p'/(2n₁) + √(8p'/n₂)
  • চলমান অঞ্চল পদ্ধতি সমান-ভর বিভাজন ব্যবহার করে (λᵢ = i/(p+1))
  • উচ্চ-মাত্রিক ক্ষেত্রে, মাত্রা হ্রাস কৌশল ব্যবহার করুন (দ্বি-মাত্রিক সীমান্ত বিতরণ)

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

কেস १: ত্রি-মাত্রিক সাধারণ বিতরণ (k=3, l=3, p'=63, n₂=10⁷)

(α, β)n₁=10⁷n₁=10⁶n₁=10⁵n₁=10⁴
(0, 0)0.007110.007170.007730.0136
(0.01, 0.01)0.007350.007410.007970.0137
(0.1, 0.1)0.02770.02770.02900.0349
(1, 1)0.6990.6980.7070.707

মূল আবিষ্কার: १. (α, β) = (0, 0) এবং (0.01, 0.01): মানদণ্ড মান < 0.02 (ϵ=0.05 এর থ্রেশহোল্ড), সিদ্ধান্ত যথেষ্ট কাছাকাছি २. (α, β) = (0.1, 0.1): মানদণ্ড মান প্রায় 0.028-0.035 > 0.02, কিন্তু < 0.08 (ϵ=0.1 এর থ্রেশহোল্ড), শিথিল মান অধীনে কাছাকাছি ३. (α, β) = (1, 1): মানদণ্ড মান প্রায় 0.7 >> 0.02, স্পষ্টভাবে কাছাকাছি নয় ४. নমুনা আকার প্রভাব: n₁ ১०⁴ থেকে ১०⁷ বৃদ্ধি, মানদণ্ড মান 0.0136 থেকে 0.00711 হ্রাস (α=β=0 ক্ষেত্র)

উচ্চ-মাত্রিক ক্ষেত্র (k=10, l=2, দ্বি-মাত্রিক সীমান্ত বিতরণ)

(α, β) = (0.1, 0.1) এর জন্য:

  • n₁=10³, n₂=10⁷: সমস্ত ४५ চলক জোড়ার মানদণ্ড মান 0.023-0.038 এর মধ্যে, সব > 0.02, কাছাকাছি সিদ্ধান্তে পৌঁছানো যায় না
  • n₁=10⁴, n₂=10⁷: সমস্ত জোড়ার মানদণ্ড মান 0.015-0.019 এর মধ্যে, সব < 0.02, সিদ্ধান্ত যথেষ্ট কাছাকাছি

এটি নমুনা আকার প্রয়োজনীয়তা যাচাই করে, বিশেষ করে n₁ ১०⁴ স্তরে পৌঁছানো প্রয়োজন।

কেস বিশ্লেষণ

বেয়েসীয় রিগ্রেশন মডেল

পরীক্ষামূলক ফলাফল:

  • হেলিঞ্জার দূরত্ব: Dm̂⁽¹⁾ : m̂⁽²⁾ ≈ 0.0113
  • পক্ষপাত সংশোধন শর্তাবলী: p'/(2n₁) + √(8p'/n₂) ≈ 0.0020
  • সম্পূর্ণ মানদণ্ড মান: ≈ 0.0133
  • সংশ্লিষ্ট ϵ: 8ϵ² = 0.0133 সমাধান করে ϵ ≈ 0.04 পান
  • সংশ্লিষ্ট বেয়েস ত্রুটির হার: 0.5 - 0.04 = 0.46

K-S পরীক্ষা তুলনা:

  • p মান = 7.587×10⁻⁸, অত্যন্ত নিম্ন তাৎপর্য স্তরে মূল অনুমান প্রত্যাখ্যান করুন
  • কিন্তু এই পেপারের মানদণ্ড বেয়েস ত্রুটির হার 0.46 মান অধীনে বিতরণ যথেষ্ট কাছাকাছি নির্দেশ করে

হিস ্টোগ্রাম বিশ্লেষণ (চিত্র २):

  • ŷ এবং y এর বিতরণ আকৃতি অনুরূপ
  • "যথেষ্ট কাছাকাছি" সিদ্ধান্ত সমর্থন করে

এই কেস প্রদর্শন করে: १. K-S পরীক্ষা "প্রত্যাখ্যান" সিদ্ধান্ত প্রদান করে, কিন্তু প্রকৃত বিতরণ ইতিমধ্যে অনুরূপ २. এই পেপারের মানদণ্ড "যথেষ্ট কাছাকাছি" ইতিবাচক সিদ্ধান্ত প্রদান করতে পারে, প্রকৃত প্রয়োজন আরও ভালভাবে পূরণ করে ३. থ্রেশহোল্ডের ব্যাখ্যাযোগ্যতা (বেয়েস ত্রুটির হার 0.46 র্যান্ডম অনুমান 0.5 এর কাছাকাছি)

পরীক্ষামূলক আবিষ্কার

१. পদ্ধতি কার্যকারিতা: মানদণ্ড বিভিন্ন সাদৃশ্য ডিগ্রির বিতরণ জোড়া সঠিকভাবে পার্থক্য করতে পারে

२. নমুনা আকার প্রয়োজনীয়তা:

  • n₂ এর প্রভাব n₂⁻¹/² ক্রম, তুলনামূলকভাবে বড় প্রয়োজন (পরীক্ষায় ১०⁷)
  • n₁ এর প্রভাব n₁⁻¹ ক্রম, ১०⁴ সাধারণত যথেষ্ট
  • এটি তাত্ত্বিক বিশ্লেষণের সাথে সামঞ্জস্যপূর্ণ (উপপাদ্য ४)

३. মাত্রা প্রভাব:

  • উচ্চ-মাত্রিক ক্ষেত্রে, সম্পূর্ণ গভীরতা বিভাজন সূচকীয় স্তরের নমুনা প্রয়োজন
  • দ্বি-মাত্রিক সীমান্ত বিতরণ কৌশল ব্যবহারিক আপস সমাধান

४. অনুমান পরীক্ষার সাথে তুলনা:

  • K-S পরীক্ষা বড় নমুনায় অত্যধিক সংবেদনশীল
  • এই পেপারের মানদণ্ড ব্যাখ্যাযোগ্য "যথেষ্ট কাছাকাছি" বিচার প্রদান করে

५. থ্রেশহোল্ডের যুক্তিসঙ্গততা:

  • ϵ = 0.05 (সংশ্লিষ্ট থ্রেশহোল্ড 0.02) যুক্তিসঙ্গত মান নির্বাচন
  • প্রয়োজন অনুযায়ী সামঞ্জস্য করা যায় (যেমন ϵ = 0.1 সংশ্লিষ্ট 0.08)

সম্পর্কিত কাজ

१. দুটি-নমুনা তুলনা পদ্ধতি

রিচার্ডসন এবং ওয়েইস (२०१८):

  • এই পেপারের সবচেয়ে কাছাকাছি পদ্ধতি
  • স্থির অঞ্চল পদ্ধতি গ্রহণ করে
  • বহুপদী বিতরণের পরিবর্তে দ্বিপদী বিতরণ সেট ব্যবহার করে
  • শেষে z পরীক্ষা ব্যবহার করে মূল্যায়ন করে

জনসন এবং ডাসু (१९९८):

  • উচ্চ-মাত্রিক ডেটা শ্রেণীবদ্ধ এবং ক্রমাগত চলকে বিভক্ত করে
  • একাধিক পরীক্ষা ব্যবহার করে সাদৃশ্য বিচার করে

२. K-S পরীক্ষার সম্প্রসারণ

প্রেস এবং টিউকোলস্কি (१९८८): দ্বি-মাত্রিক K-S পরীক্ষা

হেগেন এবং অন্যরা (२०२०): উচ্চ-মাত্রিক K-S দূরত্ব

লাউডিন এবং মিয়েটিনেন (२००३):

  • উচ্চ-মাত্রিক বিতরণ এক-মাত্রিকে সংকুচিত করে
  • এক-মাত্রিক K-S পরীক্ষা ব্যবহার করে

३. কার্নেল পদ্ধতি

গ্রেটন এবং অন্যরা (२००७):

  • পুনরুৎপাদন কার্নেল হিলবার্ট স্থান তত্ত্ব প্রয়োগ করে
  • ফাংশন সাদৃশ্যের মাধ্যমে বিতরণ সাদৃশ্য পরিমাপ করে
  • কিন্তু শেষে ঐতিহ্যবাহী অনুমান পরীক্ষা গ্রহণ করে

४. উৎপাদনশীল মডেল মূল্যায়ন

থেইস এবং অন্যরা (२०१५):

  • সম্ভাব্যতা চিত্র উৎপাদন মডেল মূল্যায়ন করে
  • বিভিন্ন মূল্যায়ন পদ্ধতি সম্পূর্ণ ভিন্ন সিদ্ধান্তে পৌঁছাতে পারে নির্দেশ করে

বোরজি (२०१८):

  • উৎপাদনশীল প্রতিদ্বন্দ্বী নেটওয়ার্কের মূল্যায়ন সূচকের ব্যাপক পর্যালোচনা
  • কিছু পদ্ধতি দুটি-নমুনা সমস্যায় প্রযোজ্য

এই পেপারের সুবিধা

१. স্পষ্ট ঘনত্ব ফাংশন প্রয়োজন নেই: জটিল মডেলের জন্য প্রযোজ্য (গভীর শিক্ষা, বেয়েসীয় মডেল) २. ইতিবাচক সিদ্ধান্ত: "যথেষ্ট কাছাকাছি" বিচার করতে পারে, শুধু "ভিন্ন" নয় ३. ব্যাখ্যাযোগ্য থ্রেশহোল্ড: বেয়েস ত্রুটির হারের উপর ভিত্তি করে, পরিসংখ্যানগত অর্থ রয়েছে ४. তাত্ত্বিক গ্যারান্টি: অ্যাসিম্পটোটিক পক্ষপাত বিশ্লেষণ এবং দক্ষতা তুলনা প্রদান করে ५. ব্যবহারিকতা: সরাসরি নমুনা থেকে গণনা করা যায়, বাস্তবায়ন সহজ

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. তাত্ত্বিক অবদান:

  • f-বিচ্যুতি এবং বেয়েস ত্রুটির হারের সাধারণ সম্পর্ক প্রতিষ্ঠা করা (উপপাদ্য १)
  • চলমান অঞ্চল পদ্ধতির অ্যাসিম্পটোটিক উচ্চতর প্রমাণ করা (উপপাদ্য २, ३)
  • দুটি-নমুনা সমস্যা অনুমানকারীর পক্ষপাত উপরের সীমা প্রদান করা (উপপাদ্য ४)

२. পদ্ধতি অবদান:

  • বিচ্ছিন্নকৃত হেলিঞ্জার দূরত্বের উপর ভিত্তি করে ব্যবহারিক মানদণ্ড প্রস্তাব করা
  • থ্রেশহোল্ড δ* = 8ϵ² স্পষ্ট পরিসংখ্যানগত ব্যাখ্যা রয়েছে
  • সম্পূর্ণ মানদণ্ড পক্ষপাত সংশোধন অন্তর্ভুক্ত করে, সরাসরি প্রয়োগ করা যায়

३. পরীক্ষামূলক যাচাইকরণ:

  • বহুমাত্রিক সাধারণ বিতরণ পরীক্ষা পদ্ধতির কার্যকারিতা এবং নমুনা আকার প্রয়োজনীয়তা যাচাই করে
  • বেয়েসীয় মডেল কেস ব্যবহারিক প্রয়োগ মূল্য প্রদর্শন করে
  • K-S পরীক্ষার সাথে তুলনা "ইতিবাচক সিদ্ধান্ত" এর সুবিধা দেখায়

সীমাবদ্ধতা

१. নমুনা আকার প্রয়োজনীয়তা:

  • n₂ তুলনামূলকভাবে বড় প্রয়োজন (n₂⁻¹/² ক্রম প্রভাব)
  • যদিও মডেল নমুনা সাধারণত সহজে পাওয়া যায়, তবুও গণনা খরচ রয়েছে

२. মাত্রা অভিশাপ:

  • উচ্চ-মাত্রিক ক্ষেত্রে সম্পূর্ণ গভীরতা বিভাজন অসম্ভব
  • মাত্রা হ্রাস কৌশল প্রয়োজন (যেমন দ্বি-মাত্রিক সীমান্ত বিতরণ)
  • উচ্চ-মাত্রিক নির্ভরতা কাঠামো তথ্য হারাতে পারে

३. অঞ্চল বিভাজন:

  • চলমান অঞ্চল পদ্ধতির তাত্ত্বিক উচ্চতর শুধুমাত্র স্কেলার ক্ষেত্রে (k=1) সম্পূর্ণভাবে প্রমাণিত
  • উচ্চ-মাত্রিক ক্ষেত্রে (k≥२) n⁻² ক্রম উচ্চতর প্রমাণিত নয়

४. থ্রেশহোল্ড নির্বাচন:

  • ϵ এর নির্বাচন (0.05 বা 0.01) এখনও কিছু বিষয়গত
  • যদিও বেয়েস ত্রুটির হারের উপর ভিত্তি করে, বিভিন্ন প্রয়োগ বিভিন্ন মান প্রয়োজন হতে পারে

५. বিতরণ অনুমান:

  • পদ্ধতি ক্রমাগত বিতরণের জন্য ডিজাইন করা
  • মিশ্র ধরনের (বিচ্ছিন্ন + ক্রমাগত) বিতরণের জন্য সমন্বয় প্রয়োজন

ভবিষ্যত দিকনির্দেশনা

१. উচ্চ-মাত্রিক তত্ত্ব: k≥२ ক্ষেত্রে চলমান অঞ্চল পদ্ধতির অ্যাসিম্পটোটিক তত্ত্ব উন্নত করা

२. স্ব-অভিযোজিত অঞ্চল বিভাজন:

  • ডেটা বৈশিষ্ট্য অনুযায়ী স্ব-অভিযোজিতভাবে বিভাজন সংখ্যা p এবং গভীরতা l নির্বাচন করা
  • অ-সমান বিভাজন কৌশল

३. বহু-নমুনা সম্প্রসারণ: একাধিক বিতরণের একযোগে তুলনায় সম্প্রসারণ করা

४. গণনা অপ্টিমাইজেশন:

  • বড় আকারের ডেটার দক্ষ বাস্তবায়ন
  • সমান্তরাল গণনা কৌশল

५. অন্যান্য বিচ্যুতি: অন্যান্য f-বিচ্যুতির বৈশিষ্ট্য অধ্যয়ন করা (যেমন χ² বিচ্যুতি)

  • বিভিন্ন বিচ্যুতির প্রযোজ্য পরিস্থিতি তুলনা করা

গভীর মূল্যায়ন

সুবিধা

१. তাত্ত্বিক কঠোরতা:

  • উপপাদ্য १ দ্বারা প্রতিষ্ঠিত f-বিচ্যুতি এবং বেয়েস ত্রুটির হারের সম্পর্ক সর্বজনীন এবং গভীর
  • অ্যাসিম্পটোটিক বিশ্লেষণ (উপপাদ্য २-४) গাণিতিক উদ্ভব সম্পূর্ণ, প্রমাণ বিস্তারিত
  • তাত্ত্বিক ফলাফল অনুশীলনের জন্য দৃঢ় ভিত্তি প্রদান করে

२. পদ্ধতি উদ্ভাবনশীলতা:

  • মূল উদ্ভাবন: বেয়েস ত্রুটির হার বিচ্যুতি থ্রেশহোল্ড নির্ধারণে প্রবর্তন করে, বিমূর্ত বিচ্যুতি মান শ্রেণীবিভাগ নির্ভুলতার স্বজ্ঞাত ব্যাখ্যা প্রদান করে
  • চলমান অঞ্চল পদ্ধতি স্থির অঞ্চলের তুলনায় উচ্চতর তাত্ত্বিক সমর্থন রয়েছে
  • হেলিঞ্জার দূরত্ব নির্বাচন প্রযুক্তিগত সমস্যা এড়ায় (শূন্য অনুমান) ব্যবহারিক বিবেচনা প্রতিফলিত করে

३. ব্যবহারিক মূল্য:

  • মানদণ্ড (४०) সংক্ষিপ্ত ফর্ম, গণনা এবং প্রয়োগ সহজ
  • স্পষ্ট ঘনত্ব ফাংশন প্রয়োজন নেই, কালো বাক্স মডেলের জন্য প্রযোজ্য (গভীর শিক্ষা)
  • "ইতিবাচক সিদ্ধান্ত" প্রদান করে, প্রকৃত প্রয়োজন পূরণ করে

४. পরীক্ষামূলক সম্পূর্ণতা:

  • বহুমাত্রিক সাধারণ বিতরণ পরীক্ষা বিভিন্ন সাদৃশ্য এবং নমুনা আকার পদ্ধতিগতভাবে পরীক্ষা করে
  • বেয়েসীয় মডেল কেস ব্যবহারিক প্রয়োগ পরিস্থিতি প্রদর্শন করে
  • K-S পরীক্ষার সাথে তুলনা প্রভাবশালী

५. লেখার স্পষ্টতা:

  • কাঠামো স্পষ্ট, যুক্তি সংযুক্ত
  • গাণিতিক প্রতীক সংজ্ঞা স্পষ্ট
  • চিত্র এবং টেবিল (যেমন চিত্র १, টেবিল १-६) কার্যকরভাবে যুক্তি সমর্থন করে

অপূর্ণতা

१. উচ্চ-মাত্রিক ক্ষেত্রের তত্ত্ব অসম্পূর্ণ:

  • উপপাদ্য ३ শুধুমাত্র n⁻¹ ক্রম ফলাফল প্রদান করে, n⁻² ক্রম শর্তাবলী স্পষ্ট নয়
  • চলমান অঞ্চল পদ্ধতি k≥२ সময় উচ্চতর কঠোরভাবে প্রমাণিত নয়
  • এটি তত্ত্বের সম্পূর্ণতা সীমিত করে

२. পরীক্ষামূলক ডিজাইনের সীমাবদ্ধতা:

  • কেস १ শুধুমাত্র সাধারণ বিতরণ বিবেচনা করে, বিতরণ ধরন একক
  • অন্যান্য দুটি-নমুনা পদ্ধতির সাথে পদ্ধতিগত তুলনা অভাব (যেমন MMD)
  • উচ্চ-মাত্রিক পরীক্ষা শুধুমাত্র k=10, উচ্চতর মাত্রা অন্বেষণ করা হয়নি

३. পদ্ধতির প্রযোজ্যতা সীমাবদ্ধতা:

  • বিচ্ছিন্ন বিতরণ বা মিশ্র বিতরণের পরিচালনা আলোচনা করা হয়নি
  • অঞ্চল সংখ্যা p' এবং গভীরতা l নির্বাচনের জন্য পদ্ধতিগত নির্দেশনা অভাব
  • নমুনা আকার প্রয়োজনীয়তা (বিশেষ করে n₂) কিছু পরিস্থিতিতে এখনও বেশি হতে পারে

४. থ্রেশহোল্ডের বিষয়গত:

  • ϵ নির্বাচন (0.05, 0.01) যদিও বেয়েস ত্রুটির হার ব্যাখ্যা রয়েছে, তবুও ব্যবহারকারী সিদ্ধান্ত প্রয়োজন
  • বিভিন্ন প্রয়োগ ক্ষেত্রের যুক্তিসঙ্গত থ্রেশহোল্ড উল্লেখযোগ্যভাবে ভিন্ন হতে পারে
  • নির্দিষ্ট প্রয়োগের জন্য থ্রেশহোল্ড নির্বাচন নির্দেশনা অভাব

५. গণনা জটিলতা বিশ্লেষণ অভাব:

  • অ্যালগরিদমের সময় এবং স্থান জটিলতা আলোচনা করা হয়নি
  • বড় আকারের ডেটার স্কেলেবিলিটি স্পষ্ট নয়

६. উপপাদ্য १ এর আনুমানিকতা:

  • α(δ) গণনা জটিল অপ্টিমাইজেশন জড়িত (সমীকরণ ९-१०)
  • প্রকৃত ব্যবহার টেইলর সম্প্রসারণ আনুমানিকতা জড়িত (চিত্র १ চারপাশে)
  • আনুমানিক ত্রুটির পরিমাণগত বিশ্লেষণ অপর্যাপ্ত

প্রভাব

१. ক্ষেত্রে অবদান:

  • বিতরণ সাদৃশ্য মূল্যায়নের জন্য নতুন তাত্ত্বিক দৃষ্টিভঙ্গি প্রদান করে (বেয়েস ত্রুটির হার সংযোগ)
  • পরিসংখ্যানগত অনুমানে বিচ্ছিন্নকরণ পদ্ধতির প্রয়োগ প্রচার করে
  • উৎপাদনশীল মডেল মূল্যায়নের জন্য ব্যবহারিক সরঞ্জাম প্রদান করে

२. ব্যবহারিক মূল্য:

  • উচ্চ ব্যবহারিকতা: গভীর উৎপাদনশীল মডেল (GANs, VAEs), বেয়েসীয় মডেল ইত্যাদি স্পষ্ট ঘনত্ব ছাড়া পরিস্থিতিতে প্রযোজ্য
  • মডেল নির্বাচন, প্রশিক্ষণ পর্যবেক্ষণ, ডেটা গুণমান মূল্যায়নে ব্যবহার করা যায়
  • কোড বাস্তবায়ন তুলনামূলকভাবে সহজ

३. পুনরুৎপাদনযোগ্যতা:

  • পদ্ধতি বর্ণনা বিস্তারিত, অ্যালগরিদম পদক্ষেপ স্পষ্ট
  • পরীক্ষামূলক সেটআপ স্পষ্ট (নমুনা আকার, প্যারামিটার ইত্যাদি)
  • তাত্ত্বিক উদ্ভব সম্পূর্ণ (প্রমাণ পরিশিষ্টে)
  • পরামর্শ: ওপেন সোর্স কোড প্রদান পুনরুৎপাদনযোগ্যতা উল্লেখযোগ্যভাবে বৃদ্ধি করবে

४. সম্ভাব্য প্রয়োগ ক্ষেত্র:

  • মেশিন লার্নিং: উৎপাদনশীল মডেল মূল্যায়ন, ডোমেন অভিযোজন
  • পরিসংখ্যান: ফিটিং উত্তমতা পরীক্ষা, মডেল নির্ণয়
  • ডেটা বিজ্ঞান: ডেটা গুণমান পর্যবেক্ষণ, A/B পরীক্ষা
  • বৈজ্ঞানিক গণনা: সিমুলেশন যাচাইকরণ, অনিশ্চয়তা পরিমাণ

প্রযোজ্য পরিস্থিতি

সবচেয়ে উপযুক্ত পরিস্থিতি: १. জটিল উৎপাদনশীল মডেল মূল্যায়ন: গভীর স্নায়ু নেটওয়ার্ক উৎপাদনশীল মডেল (GANs, VAEs, বিস্তার মডেল) २. বেয়েসীয় পরবর্তী মূল্যায়ন: MCMC নমুনা এবং প্রকৃত বিতরণের তুলনা ३. বড় নমুনা উপলব্ধ: মডেল বড় পরিমাণ নমুনা উৎপাদন করতে পারে (n₂ >> n₁) ४. ইতিবাচক সিদ্ধান্ত প্রয়োজন: "যথেষ্ট ভাল কিনা" বিচার করা, শুধু "ভিন্ন কিনা" নয় ५. ক্রমাগত বিতরণ: পদ্ধতি ক্রমাগত র্যান্ডম ভেক্টরের জন্য ডিজাইন করা

কম উপযুক্ত পরিস্থিতি: १. ছোট নমুনা: n₁ এবং n₂ উভয়ই ছোট হলে পক্ষপাত সংশোধন শর্তাবলী বড় হতে পারে २. অত্যন্ত উচ্চ-মাত্রিক: মাত্রা k >> 10 বিশেষ পরিচালনা প্রয়োজন (মাত্রা হ্রাস) ३. বিচ্ছিন্ন বিতরণ: পদ্ধতি সমন্বয় প্রয়োজন ४. নির্ভুল p মান প্রয়োজন: এই পদ্ধতি থ্রেশহোল্ড বিচার প্রদান করে, p মান নয় ५. রিয়েল-টাইম অনলাইন মূল্যায়ন: গণনা খরচ বেশি হতে পারে

অন্যান্য পদ্ধতির সাথে তুলনা:

  • vs. K-S পরীক্ষা: এই পদ্ধতি ইতিবাচক সিদ্ধান্ত এবং ব্যাখ্যাযোগ্য থ্রেশহোল্ড প্রদান করে
  • vs. AIC/BIC: এই পদ্ধতি স্পষ্ট ঘনত্ব ফাংশন প্রয়োজন করে না
  • vs. MMD (সর্বোচ্চ গড় বিচ্যুতি): এই পদ্ধতি স্পষ্ট পরিসংখ্যানগত ব্যাখ্যা রয়েছে (বেয়েস ত্রুটির হার)
  • vs. FID (ফ্রেচেট ইনসেপশন দূরত্ব): এই পদ্ধতি নির্দিষ্ট বৈশিষ্ট্য নিষ্কাশনকারীর উপর নির্ভর করে না

সংক্ষিপ্ত মূল্যায়ন

এটি একটি তাত্ত্বিকভাবে কঠোর এবং ব্যবহারিকভাবে কার্যকর উৎকৃষ্ট পেপার। মূল উদ্ভাবন বেয়েস ত্রুটির হার বিচ্যুতি থ্রেশহোল্ড নির্ধারণে প্রবর্তন করে, বিমূর্ত পরিসংখ্যানগত পরিমাণ শ্রেণীবিভাগ নির্ভুলতার স্বজ্ঞাত ব্যাখ্যা প্রদান করে। পদ্ধতি বিশেষভাবে স্পষ্ট ঘনত্ব ফাংশন ছাড়া জটিল মডেল মূল্যায়নের জন্য উপযুক্ত, এই ক্ষেত্রে গুরুত্বপূর্ণ শূন্যস্থান পূরণ করে। প্রধান সীমাবদ্ধতা উচ্চ-মাত্রিক ক্ষেত্রের তত্ত্ব অসম্পূর্ণ এবং পরীক্ষামূলক কভারেজ সীমিত, কিন্তু এটি একাডেমিক মূল্য এবং ব্যবহারিকতা প্রভাবিত করে না। পাঠকদের প্রয়োগ করার সময় নমুনা আকার প্রয়োজনীয়তা (বিশেষ করে n₂) এবং মাত্রা সীমাবদ্ধতা মনোযোগ দিতে সুপারিশ করা হয়, প্রয়োজনে মাত্রা হ্রাস কৌশল ব্যবহার করুন।