Criterion for the resemblance between the mother and the model distribution
Sheena
If the probability distribution model aims to approximate the hidden mother distribution, it is imperative to establish a useful criterion for the resemblance between the mother and the model distributions.
This study proposes a criterion that measures the Hellinger distance between discretized (quantized) samples from both distributions. Unlike information criteria such as AIC, this criterion does not require the probability density function of the model distribution, which cannot be explicitly obtained for a complicated model such as a deep learning machine. Second, it can draw a positive conclusion (i.e., both distributions are sufficiently close) under a given threshold, whereas a statistical hypothesis test, such as the Kolmogorov-Smirnov test, cannot genuinely lead to a positive conclusion when the hypothesis is accepted.
In this study, we establish a reasonable threshold for the criterion deduced from the Bayes error rate and also present the asymptotic bias of the estimator of the criterion. From these results, a reasonable and easy-to-use criterion is established that can be directly calculated from the two sets of samples from both distributions.
academic
মাতৃ এবং মডেল বিতরণের মধ্যে সাদৃশ্যের জন্য মানদণ্ড
এই পেপারটি সম্ভাব্যতা বিতরণ মডেল এবং প্রকৃত ডেটা বিতরণ (মাতৃ বিতরণ) এর মধ্যে সাদৃশ্যের পরিমাপের সমস্যা অধ্যয়ন করে। এটি বিচ্ছিন্নকৃত নমুনা হেলিঞ্জার দূরত্বের উপর ভিত্তি করে একটি মানদণ্ড প্রস্তাব করে, যা মডেল বিতরণের স্পষ্ট সম্ভাব্যতা ঘনত্ব ফাংশনের প্রয়োজন করে না, তাই গভীর শিক্ষার মতো জটিল মডেলের জন্য উপযুক্ত। ঐতিহ্যবাহী অনুমান পরীক্ষা (যেমন কলমোগোরভ-স্মিরনভ পরীক্ষা) এর বিপরীতে, এই মানদণ্ড একটি নির্দিষ্ট থ্রেশহোল্ডের অধীনে "দুটি বিতরণ যথেষ্ট কাছাকাছি" এর ইতিবাচক সিদ্ধান্তে পৌঁছাতে পারে। গবেষণা বেয়েস ত্রুটির হার থেকে উদ্ভূত যুক্তিসঙ্গত থ্রেশহোল্ড প্রতিষ্ঠা করে এবং মানদণ্ড অনুমানকারীর অ্যাসিম্পটোটিক পক্ষপাত বিশ্লেষণ প্রদান করে।
যখন একটি সম্ভাব্যতা বিতরণ মডেল অজানা প্রকৃত ডেটা বিতরণ (মাতৃ বিতরণ) অনুমান করার লক্ষ্যে থাকে, তখন কার্যকর সাদৃশ্য পরিমাপ মানদণ্ড প্রতিষ্ঠা করা একটি মৌলিক সমস্যা। এটি উৎপাদনশীল মডেল (যেমন গভীর উৎপাদনশীল মডেল, বেয়েসীয় মডেল) মূল্যায়নে বিশেষভাবে গুরুত্বপূর্ণ।
মডেল মূল্যায়নের প্রয়োজনীয়তা: মেশিন লার্নিং এবং পরিসংখ্যানগত মডেলিংয়ে, উৎপাদিত মডেল প্রকৃত ডেটা বিতরণকে যথেষ্টভাবে অনুমান করে কিনা তা নির্ধারণ করা প্রয়োজন
ব্যবহারিক তাৎপর্য: প্রশিক্ষণ যথেষ্ট কিনা, প্যারামেট্রিক মডেল উপযুক্ত কিনা, নমুনা আকার যথেষ্ট কিনা ইত্যাদি ব্যবহারিক সমস্যা নির্ধারণ করা
তাত্ত্বিক মূল্য: বিতরণ সাদৃশ্যের জন্য ব্যাখ্যাযোগ্য পরিমাণগত মান প্রদান করা
১. বিচ্ছিন্নকৃত হেলিঞ্জার দূরত্বের উপর ভিত্তি করে দুটি-নমুনা মানদণ্ড প্রস্তাব করা: দুটি বিতরণের নমুনা বিচ্ছিন্ন করে (পরিমাণ করে), বহুপদী বিতরণ স্তরে হেলিঞ্জার দূরত্ব তুলনা করে
२. বেয়েস ত্রুটির হারের সাথে তাত্ত্বিক সংযোগ প্রতিষ্ঠা করা (উপপাদ্য ১): f-বিচ্যুতি এবং বেয়েস ত্রুটির হারের মধ্যে সম্পর্ক প্রমাণ করে, বিচ্যুতি মান ব্যবহারিক ব্যাখ্যাযোগ্যতা প্রদান করে
३. যুক্তিসঙ্গত থ্রেশহোল্ড মান উদ্ভব করা: বেয়েস ত্রুটির হার থেকে হেলিঞ্জার দূরত্বের থ্রেশহোল্ড δ* = 8ϵ² উদ্ভব করে, যেখানে ϵ র্যান্ডম অনুমান থেকে ত্রুটির হারের বিচ্যুতির সাথে সম্পর্কিত
४. চলমান অঞ্চল বিচ্ছিন্নকরণ পদ্ধতি প্রস্তাব করা: স্থির অঞ্চল পদ্ধতির তুলনায়, n⁻² ক্রমে উন্নত অ্যাসিম্পটোটিক দক্ষতা রয়েছে (উপপাদ্য ২ এবং ३)
५. অনুমানকারীর অ্যাসিম্পটোটিক পক্ষপাত বিশ্লেষণ প্রদান করা (উপপাদ্য ४): অনুমানকারী EDm⁽¹⁾ : m⁽²⁾ এর উপরের সীমা প্রমাণ করে EDm̂⁽¹⁾ : m̂⁽²⁾ + √(8p'/n₂) + o(n₁⁻¹) + o(n₂⁻¹/²)
१. হেলিঞ্জার দূরত্ব: Dm̂⁽¹⁾ : m̂⁽²⁾
२. সম্পূর্ণ মানদণ্ড মান (সূত্র ४०এর বাম দিক): Dm̂⁽¹⁾ : m̂⁽²⁾ + p'/(2n₁) + √(8p'/n₂)
३. থ্রেশহোল্ড: 8ϵ² (ϵ = 0.05 সময় 0.02, ϵ = 0.01 সময় 0.0008)
४. তুলনা পদ্ধতি: কলমোগোরভ-স্মিরনভ পরীক্ষার p মান
কেস १: ত্রি-মাত্রিক সাধারণ বিতরণ (k=3, l=3, p'=63, n₂=10⁷)
(α, β)
n₁=10⁷
n₁=10⁶
n₁=10⁵
n₁=10⁴
(0, 0)
0.00711
0.00717
0.00773
0.0136
(0.01, 0.01)
0.00735
0.00741
0.00797
0.0137
(0.1, 0.1)
0.0277
0.0277
0.0290
0.0349
(1, 1)
0.699
0.698
0.707
0.707
মূল আবিষ্কার:
१. (α, β) = (0, 0) এবং (0.01, 0.01): মানদণ্ড মান < 0.02 (ϵ=0.05 এর থ্রেশহোল্ড), সিদ্ধান্ত যথেষ্ট কাছাকাছি
२. (α, β) = (0.1, 0.1): মানদণ্ড মান প্রায় 0.028-0.035 > 0.02, কিন্তু < 0.08 (ϵ=0.1 এর থ্রেশহোল্ড), শিথিল মান অধীনে কাছাকাছি
३. (α, β) = (1, 1): মানদণ্ড মান প্রায় 0.7 >> 0.02, স্পষ্টভাবে কাছাকাছি নয়
४. নমুনা আকার প্রভাব: n₁ ১०⁴ থেকে ১०⁷ বৃদ্ধি, মানদণ্ড মান 0.0136 থেকে 0.00711 হ্রাস (α=β=0 ক্ষেত্র)
p মান = 7.587×10⁻⁸, অত্যন্ত নিম্ন তাৎপর্য স্তরে মূল অনুমান প্রত্যাখ্যান করুন
কিন্তু এই পেপারের মানদণ্ড বেয়েস ত্রুটির হার 0.46 মান অধীনে বিতরণ যথেষ্ট কাছাকাছি নির্দেশ করে
হিস ্টোগ্রাম বিশ্লেষণ (চিত্র २):
ŷ এবং y এর বিতরণ আকৃতি অনুরূপ
"যথেষ্ট কাছাকাছি" সিদ্ধান্ত সমর্থন করে
এই কেস প্রদর্শন করে:
१. K-S পরীক্ষা "প্রত্যাখ্যান" সিদ্ধান্ত প্রদান করে, কিন্তু প্রকৃত বিতরণ ইতিমধ্যে অনুরূপ
२. এই পেপারের মানদণ্ড "যথেষ্ট কাছাকাছি" ইতিবাচক সিদ্ধান্ত প্রদান করতে পারে, প্রকৃত প্রয়োজন আরও ভালভাবে পূরণ করে
३. থ্রেশহোল্ডের ব্যাখ্যাযোগ্যতা (বেয়েস ত্রুটির হার 0.46 র্যান্ডম অনুমান 0.5 এর কাছাকাছি)
१. স্পষ্ট ঘনত্ব ফাংশন প্রয়োজন নেই: জটিল মডেলের জন্য প্রযোজ্য (গভীর শিক্ষা, বেয়েসীয় মডেল)
२. ইতিবাচক সিদ্ধান্ত: "যথেষ্ট কাছাকাছি" বিচার করতে পারে, শুধু "ভিন্ন" নয়
३. ব্যাখ্যাযোগ্য থ্রেশহোল্ড: বেয়েস ত্রুটির হারের উপর ভিত্তি করে, পরিসংখ্যানগত অর্থ রয়েছে
४. তাত্ত্বিক গ্যারান্টি: অ্যাসিম্পটোটিক পক্ষপাত বিশ্লেষণ এবং দক্ষতা তুলনা প্রদান করে
५. ব্যবহারিকতা: সরাসরি নমুনা থেকে গণনা করা যায়, বাস্তবায়ন সহজ
সবচেয়ে উপযুক্ত পরিস্থিতি:
१. জটিল উৎপাদনশীল মডেল মূল্যায়ন: গভীর স্নায়ু নেটওয়ার্ক উৎপাদনশীল মডেল (GANs, VAEs, বিস্তার মডেল)
२. বেয়েসীয় পরবর্তী মূল্যায়ন: MCMC নমুনা এবং প্রকৃত বিতরণের তুলনা
३. বড় নমুনা উপলব্ধ: মডেল বড় পরিমাণ নমুনা উৎপাদন করতে পারে (n₂ >> n₁)
४. ইতিবাচক সিদ্ধান্ত প্রয়োজন: "যথেষ্ট ভাল কিনা" বিচার করা, শুধু "ভিন্ন কিনা" নয়
५. ক্রমাগত বিতরণ: পদ্ধতি ক্রমাগত র্যান্ডম ভেক্টরের জন্য ডিজাইন করা
কম উপযুক্ত পরিস্থিতি:
१. ছোট নমুনা: n₁ এবং n₂ উভয়ই ছোট হলে পক্ষপাত সংশোধন শর্তাবলী বড় হতে পারে
२. অত্যন্ত উচ্চ-মাত্রিক: মাত্রা k >> 10 বিশেষ পরিচালনা প্রয়োজন (মাত্রা হ্রাস)
३. বিচ্ছিন্ন বিতরণ: পদ্ধতি সমন্বয় প্রয়োজন
४. নির্ভুল p মান প্রয়োজন: এই পদ্ধতি থ্রেশহোল্ড বিচার প্রদান করে, p মান নয়
५. রিয়েল-টাইম অনলাইন মূল্যায়ন: গণনা খরচ বেশি হতে পারে
অন্যান্য পদ্ধতির সাথে তুলনা:
vs. K-S পরীক্ষা: এই পদ্ধতি ইতিবাচক সিদ্ধান্ত এবং ব্যাখ্যাযোগ্য থ্রেশহোল্ড প্রদান করে
vs. AIC/BIC: এই পদ্ধতি স্পষ্ট ঘনত্ব ফাংশন প্রয়োজন করে না
vs. MMD (সর্বোচ্চ গড় বিচ্যুতি): এই পদ্ধতি স্পষ্ট পরিসংখ্যানগত ব্যাখ্যা রয়েছে (বেয়েস ত্রুটির হার)
vs. FID (ফ্রেচেট ইনসেপশন দূরত্ব): এই পদ্ধতি নির্দিষ্ট বৈশিষ্ট্য নিষ্কাশনকারীর উপর নির্ভর করে না
এটি একটি তাত্ত্বিকভাবে কঠোর এবং ব্যবহারিকভাবে কার্যকর উৎকৃষ্ট পেপার। মূল উদ্ভাবন বেয়েস ত্রুটির হার বিচ্যুতি থ্রেশহোল্ড নির্ধারণে প্রবর্তন করে, বিমূর্ত পরিসংখ্যানগত পরিমাণ শ্রেণীবিভাগ নির্ভুলতার স্বজ্ঞাত ব্যাখ্যা প্রদান করে। পদ্ধতি বিশেষভাবে স্পষ্ট ঘনত্ব ফাংশন ছাড়া জটিল মডেল মূল্যায়নের জন্য উপযুক্ত, এই ক্ষেত্রে গুরুত্বপূর্ণ শূন্যস্থান পূরণ করে। প্রধান সীমাবদ্ধতা উচ্চ-মাত্রিক ক্ষেত্রের তত্ত্ব অসম্পূর্ণ এবং পরীক্ষামূলক কভারেজ সীমিত, কিন্তু এটি একাডেমিক মূল্য এবং ব্যবহারিকতা প্রভাবিত করে না। পাঠকদের প্রয়োগ করার সময় নমুনা আকার প্রয়োজনীয়তা (বিশেষ করে n₂) এবং মাত্রা সীমাবদ্ধতা মনোযোগ দিতে সুপারিশ করা হয়, প্রয়োজনে মাত্রা হ্রাস কৌশল ব্যবহার করুন।