শিশুদের অনলাইন মিডিয়া ব্যবহারের দ্রুত বৃদ্ধির সাথে সাথে, শিক্ষাবিদরা অনলাইন শিক্ষামূলক সামগ্রী পরীক্ষা করার জন্য ডেটা-চালিত সরঞ্জামের জরুরি প্রয়োজন অনুভব করছেন যা প্রাথমিক শিক্ষার্থীদের জন্য উপযুক্ত। এই পেপারটি অনলাইন ভিডিওতে শিক্ষামূলক সামগ্রী সনাক্ত করার একটি পদ্ধতি প্রস্তাব করে, যা দুটি ব্যাপকভাবে ব্যবহৃত শিক্ষামূলক সামগ্রী বিভাগে ফোকাস করে: সাক্ষরতা এবং গণিত। কমন কোর স্ট্যান্ডার্ডের উপর ভিত্তি করে নির্বাচিত বিশিষ্ট কোড (উপ-বিভাগ), যেমন সাক্ষরতা কোডে "অক্ষর নাম", "অক্ষর উচ্চারণ" এবং গণিত কোডে "গণনা", "শ্রেণীবিভাগ" অন্তর্ভুক্ত। যেহেতু ভিডিওগুলি একাধিক শিক্ষামূলক সামগ্রী ধারণ করতে পারে এবং সামগ্রী বিভাগ দৃষ্টিগতভাবে অনুরূপ হতে পারে, এই পেপারটি এটিকে একটি সূক্ষ্ম-দানাদার বহু-লেবেল শ্রেণীবিভাগ সমস্যা হিসাবে মডেল করে। একটি উপন্যাস শ্রেণী প্রোটোটাইপ-ভিত্তিক তত্ত্বাবধানকৃত বৈসাদৃশ্যমূলক শিক্ষা পদ্ধতি প্রস্তাব করা হয়েছে যা একাধিক লেবেলের সাথে যুক্ত সূক্ষ্ম-দানাদার নমুনা পরিচালনা করতে পারে। প্রতিটি শ্রেণীর শ্রেণী প্রোটোটাইপ শিখে, একটি ক্ষতি ফাংশন ব্যবহার করে শ্রেণী প্রোটোটাইপ এবং সেই শ্রেণীর নমুনাগুলির মধ্যে দূরত্ব কমানো হয়, একই সাথে অন্যান্য শ্রেণীর নমুনাগুলির সাথে দূরত্ব সর্বাধিক করা হয়। ভিডিওতে কার্যকর বোঝার জন্য দৃশ্যমান এবং অডিও সংকেতের গুরুত্ব বিবেচনা করে, বহু-মোডাল ট্রান্সফর্মার নেটওয়ার্ক ভিডিওতে দৃশ্যমান এবং অডিও সংকেতের মিথস্ক্রিয়া ক্যাপচার করতে ব্যবহার করা হয়। মূল্যায়ন APPROVE ডেটাসেট ব্যবহার করে পরিচালিত হয়েছে, যাতে ১৯৩ ঘন্টা শিক্ষা গবেষকদের দ্বারা মন্তব্য করা ইউটিউব শিক্ষামূলক ভিডিও রয়েছে, মোট ১৯টি বিভাগ সহ।
১. মূল সমস্যা: অনলাইন ভিডিওতে শিক্ষামূলক সামগ্রী স্বয়ংক্রিয়ভাবে সনাক্ত এবং শ্রেণীবদ্ধ করা, বিশেষত কিন্ডারগার্টেন পর্যায়ের সাক্ষরতা এবং গণিত সামগ্রীর জন্য ২. বাস্তব চাহিদা: ১১ বছরের নিচে ৮৯% শিশুর অভিভাবক রিপোর্ট করেছেন যে তাদের সন্তান ইউটিউব ভিডিও দেখে, ২-৪ বছর বয়সী শিশুরা গড়ে প্রতিদিন ২.৫ ঘন্টা দেখে, ৫-৮ বছর বয়সী শিশুরা গড়ে প্রতিদিন ৩.০ ঘন্টা দেখে ३. শিক্ষামূলক মূল্য: উপযুক্ত শিক্ষামূলক ভিডিও দেখা স্বাস্থ্যকর শিশু বিকাশ এবং শিক্ষা সমর্থন করে, যা অর্থপূর্ণ শিক্ষা লাভ প্রদান করতে প্রমাণিত হয়েছে
१. সূক্ষ্ম-দানাদার বৈষম্য: শিক্ষামূলক কোডগুলির মধ্যে উচ্চ সাদৃশ্য বিদ্যমান, যেমন "অক্ষর নাম" বনাম "অক্ষর উচ্চারণ" २. বহু-লেবেল বৈশিষ্ট্য: একটি একক ভিডিও একাধিক শিক্ষামূলক সামগ্রী প্রকার ধারণ করতে পারে ३. বহু-মোডাল প্রয়োজনীয়তা: শিক্ষামূলক সামগ্রী বোঝার জন্য দৃশ্যমান এবং অডিও সংকেত একযোগে বিশ্লেষণ করা প্রয়োজন ४. ডেটা স্বল্পতা: বিশেষজ্ঞ-মন্তব্য সূক্ষ্ম-দানাদার শিক্ষামূলক ভিডিও ডেটাসেটের অভাব
१. মান তত্ত্বাবধানকৃত বৈসাদৃশ্যমূলক শিক্ষা: SupCon এর মতো পদ্ধতি বহু-লেবেল পরিস্থিতিতে সরাসরি প্রসারিত হতে পারে না २. একক-মোডাল পদ্ধতি: শুধুমাত্র দৃশ্যমান সংকেতের উপর নির্ভর করা সূক্ষ্ম-দানাদার শিক্ষামূলক সামগ্রী আলাদা করার জন্য অপর্যাপ্ত ३. সাধারণ ভিডিও শ্রেণীবিভাগ: UCF101, Kinetics এর মতো বিদ্যমান ডেটাসেটগুলি প্রধানত ক্রিয়া স্বীকৃতিতে ফোকাস করে, শিক্ষামূলক সামগ্রী বিশ্লেষণের জন্য উপযুক্ত নয়
१. APPROVE ডেটাসেট: প্রথম সূক্ষ্ম-দানাদার বহু-লেবেল শিক্ষামূলক ভিডিও ডেটাসেট তৈরি করা হয়েছে, যাতে ১৯৩ ঘন্টা বিশেষজ্ঞ-মন্তব্য ভিডিও, ১৯টি বিভাগ, প্রতিটি ভিডিওতে গড়ে ৩টি লেবেল রয়েছে २. শ্রেণী প্রোটোটাইপ বৈসাদৃশ্যমূলক শিক্ষা কাঠামো: বহু-লেবেল সূক্ষ্ম-দানাদার শ্রেণীবিভাগের জন্য প্রযোজ্য শ্রেণী প্রোটোটাইপ তত্ত্বাবধানকৃত বৈসাদৃশ্যমূলক শিক্ষা পদ্ধতি প্রস্তাব করা হয়েছে ३. বহু-মোডাল সংমিশ্রণ স্থাপত্য: দৃশ্যমান এবং পাঠ্য (ASR প্রতিলিপি) তথ্য কার্যকরভাবে সংমিশ্রিত করার জন্য একটি বহু-মোডাল ট্রান্সফর্মার নেটওয়ার্ক ডিজাইন করা হয়েছে ४. কর্মক্ষমতা উন্নতি: APPROVE, YouTube-8M এবং COIN ডেটাসেটে শক্তিশালী বেসলাইন পদ্ধতির চেয়ে উন্নত কর্মক্ষমতা অর্জন করা হয়েছে
ঐতিহ্যবাহী তত্ত্বাবধানকৃত বৈসাদৃশ্যমূলক শিক্ষা (SupCon) একই শ্রেণীর নমুনাগুলির মধ্যে দূরত্ব কমিয়ে এবং বিভিন্ন শ্রেণীর নমুনাগুলির মধ্যে দূরত্ব সর্বাধিক করে প্রতিনিধিত্ব শিখে:
কিন্তু বহু-লেবেল পরিস্থিতিতে, নমুনা জোড়গুলি সহজেই ইতিবাচক এবং নেতিবাচক নমুনায় বিভক্ত করা যায় না। এই পেপারটি শ্রেণী প্রোটোটাইপ-ভিত্তিক বৈসাদৃশ্যমূলক শিক্ষা প্রস্তাব করে:
যেখানে:
শ্রেণী প্রোটোটাইপ নিম্নলিখিত উপায়ে পুনরাবৃত্তিমূলকভাবে আপডেট করা হয়:
যেখানে হল লেবেল ম্যাট্রিক্স, হল সূচকীয় গতিশীল গড়ের ক্ষয় প্যারামিটার।
নেটওয়ার্কে তিনটি উপাদান রয়েছে:
চূড়ান্ত নমুনা প্রতিনিধিত্ব হল:
१. বহু-লেবেল বৈসাদৃশ্যমূলক শিক্ষা: প্রথমবারের মতো বৈসাদৃশ্যমূলক শিক্ষা প্রকৃত বহু-লেবেল পরিস্থিতিতে প্রসারিত করা হয়েছে, আংশিক ওভারল্যাপিং লেবেলের সমস্যা সমাধান করে २. শ্রেণী প্রোটোটাইপ ডিজাইন: প্রতিটি শ্রেণীর শ্রেণী প্রোটোটাইপ শিখে, বহু-লেবেল পরিস্থিতিতে ইতিবাচক এবং নেতিবাচক নমুনা সংজ্ঞার অসুবিধা এড়ানো হয়েছে ३. বহু-মোডাল সংমিশ্রণ: শিক্ষামূলক সামগ্রীর বৈশিষ্ট্যের জন্য, দৃশ্যমান প্রদর্শনী এবং অডিও ব্যাখ্যা কার্যকরভাবে একত্রিত করা হয়েছে ४. দুই-পর্যায়ের প্রশিক্ষণ: প্রথমে একক-মোডাল সারিবদ্ধকরণ পরিচালনা করা হয়, তারপর সম্পূর্ণ বহু-মোডাল শিক্ষা পরিচালনা করা হয়
| মোডালিটি | পদ্ধতি | AUPR | LRAP | R@80 |
|---|---|---|---|---|
| V+T | BCE | 84.3 | 88.4 | 76.3 |
| V+T | ফোকাল | 86.1 | 89.1 | 82.2 |
| V+T | অ্যাসিম. | 86.0 | 89.2 | 82.4 |
| V+T | আমাদের | 88.4 | 90.7 | 85.5 |
এই পদ্ধতি সমস্ত মেট্রিক্সে সর্বোত্তম কর্মক্ষমতা অর্জন করে, সবচেয়ে শক্তিশালী বেসলাইনের তুলনায় উন্নতি:
| আরম্ভকরণ পদ্ধতি | APPROVE | COIN |
|---|---|---|
| র্যান্ডম | 84.1 | 56.6 |
| অর্থোগোনাল | 84.8 | 57.0 |
| শিখা | 85.5 | 57.5 |
| শ্রেণিবিন্যাসগত | 86.0 | 57.8 |
পাঠ্য মোডালিটি আরও বেশি অবদান রাখে, কিন্তু বহু-মোডাল সংমিশ্রণ উল্লেখযোগ্য উন্নতি নিয়ে আসে।
१. পদ্ধতি কার্যকারিতা: শ্রেণী প্রোটোটাইপ বৈসাদৃশ্যমূলক শিক্ষা সফলভাবে বহু-লেবেল সূক্ষ্ম-দানাদার শ্রেণীবিভাগ সমস্যা সমাধান করে २. বহু-মোডাল প্রয়োজনীয়তা: দৃশ্যমান এবং অডিও সংকেতের সংমিশ্রণ শিক্ষামূলক সামগ্রী বোঝার জন্য অত্যন্ত গুরুত্বপূর্ণ ३. ডেটাসেট অবদান: APPROVE শিক্ষামূলক ভিডিও বিশ্লেষণের জন্য একটি মূল্যবান বেঞ্চমার্ক ডেটাসেট ४. ব্যবহারিক মূল্য: পদ্ধতি শিক্ষাবিদদের উপযুক্ত শিক্ষামূলক সামগ্রী পরীক্ষা করতে সহায়তা করতে পারে
१. ডোমেইন সীমাবদ্ধতা: বর্তমানে শুধুমাত্র সাক্ষরতা এবং গণিত দুটি ডোমেইনে ফোকাস করে २. বয়স পরিসীমা: প্রধানত কিন্ডারগার্টেন পর্যায়ের জন্য, অন্যান্য বয়স পরিসীমার প্রযোজ্যতা অজানা ३. ভাষা নির্ভরতা: ASR প্রতিলিপি গুণমান কর্মক্ষমতা প্রভাবিত করে, অ-ইংরেজি সামগ্রীতে প্রযোজ্যতা সীমিত ४. গণনামূলক জটিলতা: বহু-মোডাল প্রক্রিয়াকরণ এবং প্রোটোটাইপ শিক্ষা গণনামূলক ওভারহেড বৃদ্ধি করে
१. ডোমেইন সম্প্রসারণ: বিজ্ঞান, সামাজিক গবেষণা ইত্যাদি অন্যান্য শিক্ষামূলক ডোমেইনে সম্প্রসারণ २. বহুভাষিক সমর্থন: বহুভাষিক শিক্ষামূলক সামগ্রী বিশ্লেষণ সমর্থন ३. রিয়েল-টাইম অ্যাপ্লিকেশন: রিয়েল-টাইম সামগ্রী পরীক্ষার জন্য মডেল অপ্টিমাইজ করা ४. ব্যক্তিগতকৃত সুপারিশ: শিশুর শিক্ষার অগ্রগতির সাথে ব্যক্তিগতকৃত সামগ্রী সুপারিশ
१. সমস্যার গুরুত্ব: শিশু শিক্ষায় প্রকৃত চাহিদা সমাধান করে, উল্লেখযোগ্য সামাজিক মূল্য রয়েছে २. প্রযুক্তিগত উদ্ভাবন: প্রথমবারের মতো বৈসাদৃশ্যমূলক শিক্ষা কার্যকরভাবে বহু-লেবেল সূক্ষ্ম-দানাদার পরিস্থিতিতে প্রসারিত করা হয়েছে ३. ডেটাসেট গুণমান: APPROVE ডেটাসেট উচ্চ মন্তব্য গুণমান, ডোমেইন উন্নয়নের জন্য গুরুত্বপূর্ণ সম্পদ প্রদান করে ४. পরীক্ষা সম্পূর্ণতা: বিলোপন পরীক্ষা ব্যাপক, বহু-ডেটাসেট যাচাইকরণ পদ্ধতির সাধারণীকরণ ক্ষমতা প্রদর্শন করে ५. পদ্ধতি সাধারণীকরণ: প্রোটোটাইপ বৈসাদৃশ্যমূলক শিক্ষা কাঠামো অন্যান্য বহু-লেবেল শ্রেণীবিভাগ কাজে প্রসারিত করা যায়
१. তাত্ত্বিক বিশ্লেষণ অপূর্ণ: শ্রেণী প্রোটোটাইপ শিক্ষা সংমিশ্রণের তাত্ত্বিক বিশ্লেষণের অভাব २. গণনামূলক দক্ষতা: বহু-মোডাল প্রক্রিয়াকরণের গণনামূলক ওভারহেড এবং অনুমান গতি বিস্তারিত বিশ্লেষণ নেই ३. ত্রুটি বিশ্লেষণ: শ্রেণীবিভাগ ত্রুটির গভীর বিশ্লেষণ এবং ব্যাখ্যাযোগ্যতা গবেষণার অভাব ४. বেসলাইন তুলনা: আরও সাম্প্রতিক বহু-লেবেল শ্রেণীবিভাগ পদ্ধতির সাথে তুলনা অন্তর্ভুক্ত করা যেতে পারে ५. দীর্ঘ-লেজ বিতরণ: শ্রেণী ভারসাম্যহীনতা কর্মক্ষমতায় প্রভাব পর্যাপ্তভাবে আলোচনা করা হয়নি
१. একাডেমিক অবদান: বহু-লেবেল বৈসাদৃশ্যমূলক শিক্ষার জন্য নতুন সমাধান প্রদান করে २. ব্যবহারিক মূল্য: শিক্ষা প্রযুক্তি পণ্য উন্নয়নে সরাসরি প্রয়োগ করা যায় ३. ডেটাসেট প্রভাব: APPROVE শিক্ষামূলক ভিডিও বিশ্লেষণের গুরুত্বপূর্ণ বেঞ্চমার্ক হয়ে উঠবে ४. পুনরুৎপাদনযোগ্যতা: কোড এবং ডেটাসেট প্রকাশ্য, পরবর্তী গবেষণা সহজতর করে
१. শিক্ষা প্ল্যাটফর্ম: YouTube Kids এর মতো শিশু সামগ্রী প্ল্যাটফর্মের সামগ্রী পরীক্ষা २. অনলাইন শিক্ষা: শিক্ষামূলক ভিডিও সামগ্রী স্বয়ংক্রিয় মন্তব্য এবং সুপারিশ ३. অভিভাবক সরঞ্জাম: অভিভাবকদের উপযুক্ত শিক্ষামূলক সামগ্রী পরীক্ষা করতে সহায়তা করা ४. গবেষণা সরঞ্জাম: শিক্ষা গবেষণায় ভিডিও সামগ্রী বিশ্লেষণ
পেপারটি ৬৮টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, প্রধানত অন্তর্ভুক্ত:
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের কম্পিউটার দৃষ্টিভঙ্গি পেপার যা শিক্ষা প্রযুক্তিতে একটি গুরুত্বপূর্ণ সমস্যা সমাধান করে। পদ্ধতি শক্তিশালী উদ্ভাবন, যুক্তিসঙ্গত পরীক্ষামূলক ডিজাইন এবং বিশ্বাসযোগ্য ফলাফল রয়েছে। APPROVE ডেটাসেটের অবদান বিশেষভাবে উল্লেখযোগ্য, সম্পর্কিত গবেষণার জন্য মূল্যবান সম্পদ প্রদান করে। পেপারটি প্রযুক্তিগত গভীরতা এবং ব্যবহারিক মূল্যের মধ্যে ভাল ভারসাম্য অর্জন করেছে এবং শিক্ষামূলক ভিডিও বিশ্লেষণ ডোমেইনে উল্লেখযোগ্য প্রভাব ফেলবে বলে প্রত্যাশিত।