মেশিন লার্নিং শ্রেণীবিভাগ মডেলগুলি জলবায়ু পর্যবেক্ষণ, চিকিৎসা নির্ণয় এবং জৈব এরোসল পর্যবেক্ষণের মতো গুরুত্বপূর্ণ প্রয়োগ ক্ষেত্রে ক্রমবর্ধমান ব্যবহৃত হচ্ছে, যেখানে পূর্বাভাসের ফলাফলগুলি অবশ্যই অনিশ্চয়তা মূল্যায়নের সাথে থাকতে হবে। এমএল শ্রেণীবিভাগ মডেলের আউটপুট একটি শ্রেণীবিভাগ পরিবর্তনশীল, যা আন্তর্জাতিক মেট্রোলজি শব্দভাণ্ডার (ভিআইএম)-এ নামমাত্র বৈশিষ্ট্য হিসাবে পরিচিত। তবে ভিআইএম এবং পরিমাপ অনিশ্চয়তা প্রকাশের নির্দেশিকা (জিইউএম) উভয়ই নামমাত্র বৈশিষ্ট্যের অনিশ্চয়তা মূল্যায়নের ধারণা সংজ্ঞায়িত করে না। এই পেপারটি সম্ভাব্যতা ভর ফাংশন এবং এর সংক্ষিপ্ত পরিসংখ্যানের উপর ভিত্তি করে নামমাত্র বৈশিষ্ট্যের মেট্রোলজিক্যাল অনিশ্চয়তা মূল্যায়নের একটি কাঠামো প্রস্তাব করে, যা এমএল শ্রেণীবিভাগের জন্য প্রযোজ্য। জলবায়ু পর্যবেক্ষণ এবং চিকিৎসা নির্ণয়ের দুটি উল্লেখযোগ্য সামাজিক প্রভাবের সাথে প্রয়োগ কেস দ্বারা কাঠামোর ব্যবহার চিত্রিত করা হয়। এই কাঠামোটি জিইউএমকে নামমাত্র বৈশিষ্ট্যের অনিশ্চয়তা মূল্যায়নে প্রসারিত করতে সক্ষম করবে, যা উভয়কে এমএল শ্রেণীবিভাগ মডেলের জন্য উপযুক্ত করে তুলবে।
১. প্রয়োগের চাহিদা বৃদ্ধি: এমএল শ্রেণীবিভাগ মডেলগুলি জলবায়ু পর্যবেক্ষণ, চিকিৎসা নির্ণয়, জৈব এরোসল পর্যবেক্ষণ ইত্যাদি গুরুত্বপূর্ণ ক্ষেত্রে ক্রমবর্ধমান প্রয়োগ করা হচ্ছে, যেখানে পূর্বাভাসের ফলাফলগুলি বিশ্বাসযোগ্য অনিশ্চয়তা মূল্যায়নের সাথে থাকতে হবে।
२. মেট্রোলজিক্যাল মান ঘাটতি: বিদ্যমান মেট্রোলজিক্যাল মান (ভিআইএম এবং জিইউএম) প্রধানত পরিমাণগত পরিবর্তনশীলের জন্য ডিজাইন করা হয়েছে, শ্রেণীবিভাগ মডেল আউটপুটের নামমাত্র বৈশিষ্ট্যের অনিশ্চয়তা মূল্যায়নের জন্য কাঠামোর অভাব রয়েছে।
३. বহুস্রোত অনিশ্চয়তা: এমএল শ্রেণীবিভাগ মডেলগুলি প্রশিক্ষণ ডেটা অনিশ্চয়তা, শ্রেণী বরাদ্দ অনিশ্চয়তা, মডেল নির্বাচন অনিশ্চয়তা, মডেল পরামিতি অনিশ্চয়তা এবং নতুন ইনপুট ডেটা অনিশ্চয়তা সহ একাধিক উৎস জড়িত।
१. নামমাত্র বৈশিষ্ট্যের জন্য মেট্রোলজিক্যাল অনিশ্চয়তা মূল্যায়ন কাঠামো প্রস্তাব করা: সম্ভাব্যতা ভর ফাংশন (পিএমএফ) এবং সংক্ষিপ্ত পরিসংখ্যানের উপর ভিত্তি করে, এমএল শ্রেণীবিভাগ মডেলের জন্য একটি পদ্ধতিগত অনিশ্চয়তা মূল্যায়ন পদ্ধতি প্রদান করা।
२. অনিশ্চয়তা প্রচার প্রক্রিয়া স্থাপন করা: বহু-পর্যায়ের পরিমাপ মডেলে পিএমএফের মাধ্যমে নামমাত্র বৈশিষ্ট্যের অনিশ্চয়তা কীভাবে প্রচার করতে হয় তা প্রদর্শন করা, বিশ্লেষণাত্মক এবং মন্টে কার্লো পদ্ধতি সমর্থন করা।
३. অনিশ্চয়তা পরিসংখ্যান পদ্ধতিগতভাবে তুলনা করা: উইলকক্স পরিবর্তনশীলতা অনুপাত (ডাব্লুভিআর), তথ্য এন্ট্রপি, গুণগত পরিবর্তনশীলতা সূচক (আইকিউভি) এবং অন্যান্য একাধিক অনিশ্চয়তা প্রকাশের পদ্ধতির বৈশিষ্ট্য এবং প্রয়োজনীয়তা মূল্যায়ন করা।
४. কাঠামোর ব্যবহারিকতা যাচাই করা: ভূমি কভার শ্রেণীবিভাগ এবং অ্যাট্রিয়াল ফাইব্রিলেশন সনাক্তকরণের দুটি গুরুত্বপূর্ণ প্রয়োগ কেসের মাধ্যমে, বাস্তব সমস্যায় কাঠামোর কার্যকারিতা প্রমাণ করা।
५. জিইউএম সম্প্রসারণের ভিত্তি স্থাপন করা: এই কাঠামোটি জিইউএমকে নামমাত্র বৈশিষ্ট্যের অনিশ্চয়তা মূল্যায়নে প্রসারিত করতে সক্ষম করে, মেট্রোলজিক্যাল মান ব্যবস্থা সম্পূর্ণ করে।
এই পেপারটি এমএল শ্রেণীবিভাগ মডেলের অনিশ্চয়তা মূল্যায়ন কাজ অধ্যয়ন করে:
নামমাত্র পরিবর্তনশীলের জন্য, সম্পূর্ণ অনিশ্চয়তা তথ্য পিএমএফ দ্বারা প্রকাশ করা হয়:
p : CK → [0,1]
ck ↦ pk := p(ck)
স্বাভাবিকীকরণ শর্ত সন্তুষ্ট করে: ∑pk = 1
পেপারটি সাতটি অনিশ্চয়তা পরিসংখ্যান পদ্ধতিগতভাবে মূল্যায়ন করে:
উইলকক্স পরিবর্তনশীলতা অনুপাত (ডাব্লুভিআর):
uWVR(p) = 1 - (Kp̂-1)/(K-1)
তথ্য এন্ট্রপি:
H(p) = -∑pk logK pk
গুণগত পরিবর্তনশীলতা সূচক (আইকিউভি):
uIQV(p) = K/(K-1)(1-∑pk²)
যেখানে p̂ মোডাল সম্ভাব্যতা (সর্বোচ্চ শ্রেণী সম্ভাব্যতা)।
নামমাত্র ইনপুট সহ পরিমাপ মডেল z = g(x,y) এর জন্য, আউটপুটের প্রত্যাশিত মান এবং বৈচিত্র্য প্রকাশ করা যায়:
E[z] = ∑pk μk
Var[z] = ∑pk(σk² + μk²) - (∑pkμk)²
পেপারটি এমএল শ্রেণীবিভাগে পাঁচটি প্রধান অনিশ্চয়তার উৎস চিহ্নিত করে: १. প্রশিক্ষণ ডেটা অনিশ্চয়তা: প্রশিক্ষণ ডেটা নিজেই পরিমাপ অনিশ্চয়তা २. শ্রেণী বরাদ্দ অনিশ্চয়তা: কাজের অন্তর্নিহিত শ্রেণীবিভাগ অস্পষ্টতা ३. মডেল নির্বাচন অনিশ্চয়তা: মডেল ধরনের নির্বাচনের অনিশ্চয়তা ४. মডেল পরামিতি অনিশ্চয়তা: পরামিতি অনুমান এবং অপ্টিমাইজেশনের অনিশ্চয়তা ५. নতুন ইনপুট ডেটা অনিশ্চয়তা: পূর্বাভাস পর্যায়ে ইনপুট ডেটার পরিমাপ অনিশ্চয়তা
ডেটাসেট:
পদ্ধতি: বেয়েসিয়ান দ্বিঘাত বৈষম্য বিশ্লেষণ (বিকিউডিএ)
মূল্যায়ন সূচক:
ডেটাসেট:
পদ্ধতি: কনভোলিউশনাল নিউরাল নেটওয়ার্ক + মন্টে কার্লো ড্রপআউট
শ্রেণীবিভাগ কর্মক্ষমতা:
অনিশ্চয়তা পরিসংখ্যান কর্মক্ষমতা (२०२०):
শ্রেণীবিভাগ কর্মক্ষমতা:
অনিশ্চয়তা পরিসংখ্যান:
१. পরিসংখ্যান সংবেদনশীলতা ক্রম: তথ্য এন্ট্রপি > আইকিউভি > ডাব্লুভিআর/এসডিএম/সিএনভি > ইউভিআর २. দ্বিমুখী শ্রেণীবিভাগ সমতুল্যতা: ডাব্লুভিআর, এসডিএম, সিএনভি দ্বিমুখী শ্রেণীবিভাগে গাণিতিকভাবে সমতুল্য ३. উচ্চ আত্মবিশ্বাসের অনুমান: উচ্চ আত্মবিশ্বাসের বহু-শ্রেণী পূর্বাভাসের জন্য, একাধিক পরিসংখ্যান অনুমানিক সমতুল্য ४. কর্মক্ষমতা-অনিশ্চয়তা সম্পর্ক: শ্রেণীবিভাগ কর্মক্ষমতা যত খারাপ, অনিশ্চয়তা পরিসংখ্যান মূল্য তত বেশি
१. পিএমএফ নামমাত্র বৈশিষ্ট্য অনিশ্চয়তার সম্পূর্ণ প্রকাশ: ক্রমাগত পরিবর্তনশীলের পিডিএফের সাথে সাদৃশ্যপূর্ণ, পিএমএফ শ্রেণীবিভাগ পূর্বাভাস অনিশ্চয়তার সম্পূর্ণ তথ্য প্রদান করে।
२. একাধিক পরিসংখ্যানের নিজস্ব সুবিধা রয়েছে: তথ্য এন্ট্রপি সবচেয়ে সংবেদনশীল কিন্তু অত্যধিক সংবেদনশীল হতে পারে; মোডাল সম্ভাব্যতার উপর ভিত্তি করে ডাব্লুভিআর ইত্যাদি পরিসংখ্যান আরও স্বজ্ঞাত; নির্বাচন নির্দিষ্ট প্রয়োগের প্রয়োজনের উপর ভিত্তি করে হওয়া উচিত।
३. কাঠামো ব্যবহারিক: দুটি কেস স্টাডি বিভিন্ন ক্ষেত্র এবং মডেল ধরনে কাঠামোর প্রয়োজনীয়তা প্রমাণ করে।
४. অনিশ্চয়তা প্রচার সমর্থন করে: পিএমএফের মাধ্যমে বহু-পর্যায়ের মডেলে নামমাত্র বৈশিষ্ট্যের অনিশ্চয়তা প্রচার বাস্তবায়ন করা যায়।
१. আই.আই.ডি. অনুমান: কাঠামো প্রশিক্ষণ এবং পরীক্ষার ডেটা স্বাধীন এবং সমানভাবে বিতরণ করা অনুমান করে, বিতরণ স্থানান্তর নির্ভরযোগ্যতা প্রভাবিত করে २. গণনা জটিলতা: কিছু পদ্ধতি (যেমন সম্পূর্ণ বেয়েসিয়ান অনুমান) গণনা খরচ বেশি ३. মডেল নির্বাচন অনিশ্চয়তা: বেশিরভাগ পদ্ধতি মডেল স্থাপত্য নির্বাচনের অনিশ্চয়তা যথাযথভাবে বিবেচনা করে না ४. ইনপুট অনিশ্চয়তা মডেলিং: গভীর শিক্ষা পদ্ধতিতে ইনপুট অনিশ্চয়তা স্পষ্টভাবে মডেলিং করা এখনও কঠিন
१. জিইউএম সম্প্রসারণ: নামমাত্র বৈশিষ্ট্য অনিশ্চয়তা মূল্যায়ন আনুষ্ঠানিকভাবে জিইউএম কাঠামোতে অন্তর্ভুক্ত করা २. মানকীকরণ: এমএল শ্রেণীবিভাগ মডেল অনিশ্চয়তা মূল্যায়নের জন্য আন্তর্জাতিক মান প্রণয়ন করা ३. পদ্ধতি উন্নতি: আরও দক্ষ অনিশ্চয়তা পরিমাপ পদ্ধতি বিকাশ করা ४. প্রয়োগ সম্প্রসারণ: আরও অনেক গুরুত্বপূর্ণ প্রয়োগ ক্ষেত্রে কাঠামোর কার্যকারিতা যাচাই করা
१. গুরুত্বপূর্ণ ফাঁক পূরণ করা: প্রথমবারের মতো এমএল শ্রেণীবিভাগ মডেলের জন্য পদ্ধতিগতভাবে একটি মেট্রোলজিক্যাল অনিশ্চয়তা মূল্যায়ন কাঠামো স্থাপন করা, জিইউএম/ভিআইএম মানের গুরুত্বপূর্ণ ফাঁক পূরণ করা।
२. তাত্ত্বিক কঠোরতা: সম্ভাব্যতা তত্ত্বের ভিত্তিতে, পিএমএফ থেকে সংক্ষিপ্ত পরিসংখ্যান পর্যন্ত একটি সম্পূর্ণ তাত্ত্বিক ব্যবস্থা স্থাপন করা, বিদ্যমান মেট্রোলজিক্যাল মানের সাথে সামঞ্জস্য বজায় রাখা।
३. শক্তিশালী ব্যবহারিকতা: দুটি কেস স্টাডি বিভিন্ন প্রয়োগ ক্ষেত্র, ডেটা ধরন এবং মডেল স্থাপত্য কভার করে, কাঠামোর বিস্তৃত প্রয়োজনীয়তা প্রমাণ করে।
४. পদ্ধতিগত তুলনা: সাতটি অনিশ্চয়তা পরিসংখ্যানের ব্যাপক তুলনা, ব্যবহারিক প্রয়োগের জন্য নির্বাচন নির্দেশনা প্রদান করে।
५. দূরদর্শী: উচ্চ ঝুঁকিপূর্ণ প্রয়োগে এমএল প্রযুক্তির বিশ্বাসযোগ্য স্থাপনার জন্য গুরুত্বপূর্ণ সহায়তা প্রদান করে।
१. সীমিত অনিশ্চয়তার উৎস: যদিও পাঁচটি অনিশ্চয়তার উৎস চিহ্নিত করা হয়েছে, ব্যবহারিক কেসে সবগুলি মডেল করা হয়নি, বিশেষত মডেল নির্বাচন অনিশ্চয়তা।
२. অনুমান শর্ত: আই.আই.ডি. অনুমান বাস্তব প্রয়োগে প্রায়ই লঙ্ঘিত হয়, কিন্তু পেপারটি এটি সম্পর্কে যথেষ্ট গভীরভাবে আলোচনা করে না।
३. গণনা দক্ষতা: কিছু পদ্ধতির গণনা জটিলতা (যেমন সম্পূর্ণ বেয়েসিয়ান অনুমান) ব্যবহারিক প্রয়োগ সীমিত করে।
४. সীমিত যাচাইকরণ: শুধুমাত্র দুটি কেস স্টাডি, আরও ক্ষেত্র এবং পরিস্থিতিতে কাঠামোর কার্যকারিতা যাচাই করা প্রয়োজন।
१. মান প্রণয়ন: আন্তর্জাতিক মেট্রোলজিক্যাল মান আপডেট চালিত করার সম্ভাবনা, এমএল শ্রেণীবিভাগ আনুষ্ঠানিক কাঠামোতে অন্তর্ভুক্ত করা।
२. শিল্প প্রয়োগ: চিকিৎসা, পরিবেশ পর্যবেক্ষণ ইত্যাদি গুরুত্বপূর্ণ ক্ষেত্রের এমএল প্রয়োগের জন্য বিশ্বাসযোগ্যতা নিশ্চয়তা প্রদান করে।
३. একাডেমিক মূল্য: মেট্রোলজি এবং মেশিন লার্নিং দুটি ক্ষেত্র সংযুক্ত করে, আন্তঃশৃঙ্খলা সহযোগিতা প্রচার করে।
४. পুনরুৎপাদনযোগ্যতা: স্পষ্ট তাত্ত্বিক কাঠামো এবং বাস্তবায়ন বিবরণ প্রদান করে, অন্যান্য গবেষকদের গ্রহণ সহজতর করে।
१. উচ্চ ঝুঁকিপূর্ণ প্রয়োগ: চিকিৎসা নির্ণয়, নিরাপত্তা পর্যবেক্ষণ ইত্যাদি বিশ্বাসযোগ্যতার প্রয়োজনীয়তা অত্যন্ত উচ্চ দৃশ্যকল্প २. নিয়ন্ত্রক পরিবেশ: মেট্রোলজিক্যাল মান মেনে চলার প্রয়োজনীয় শিল্প এবং গবেষণা প্রয়োগ ३. বহু-পর্যায়ের সিস্টেম: শ্রেণীবিভাগ ফলাফল পরবর্তী প্রক্রিয়াকরণ পদক্ষেপে প্রচার করা প্রয়োজন এমন জটিল সিস্টেম ४. গুণমান নিশ্চিতকরণ: পূর্বাভাস বিশ্বাসযোগ্যতা পরিমাপ করা প্রয়োজন এমন উৎপাদন এবং সেবা সিস্টেম
পেপারটি ८६টি সংদর্ভ উদ্ধৃত করে, যা মেট্রোলজিক্যাল মান, মেশিন লার্নিং তত্ত্ব, অনিশ্চয়তা পরিমাপ পদ্ধতি এবং নির্দিষ্ট প্রয়োগ ক্ষেত্র অন্তর্ভুক্ত করে, এই গবেষণার জন্য একটি শক্তিশালী তাত্ত্বিক ভিত্তি এবং বিস্তৃত প্রয়োগ পটভূমি প্রদান করে। মূল সংদর্ভগুলি জিইউএম সিরিজ নথি, ভিআইএম শব্দভাণ্ডার, বেয়েসিয়ান মেশিন লার্নিং পদ্ধতি এবং অনিশ্চয়তা পরিমাপ কৌশল অন্তর্ভুক্ত করে।