এই পেপারটি মানব বিকাশের গতিপথ (৫-১০ বছর) এর উপর ভিত্তি করে একটি ব্যাপক ক্রমাগত শিক্ষা ডেটাসেট এবং বেঞ্চমার্ক কাঠামো CurLL প্রস্তাব করে, যা মডেলগুলি ক্রমান্বয়ে নতুন দক্ষতা অর্জনের ক্ষমতা সিস্টেমেটিকভাবে সূক্ষ্ম-দানাদার মূল্যায়ন করতে পারে। CurLL পাঁচটি বিকাশমূলক পর্যায় (০-৪) অন্তর্ভুক্ত করে, যা দক্ষতা গ্রাফ দ্বারা সমর্থিত, বিস্তৃত দক্ষতাগুলিকে ছোট ক্ষমতা, নির্দিষ্ট লক্ষ্য এবং পরিমাপযোগ্য সূচকগুলিতে বিভক্ত করে, একই সাথে দক্ষতার মধ্যে নির্ভরতা সম্পর্ক ক্যাপচার করে। গবেষণাটি ২৩.৪B টোকেনের সিন্থেটিক ডেটাসেট তৈরি করেছে, যা নিয়ন্ত্রিত দক্ষতা অগ্রগতি, শব্দভাণ্ডার জটিলতা এবং ফর্ম্যাট বৈচিত্র্য সহ, যার মধ্যে রয়েছে অনুচ্ছেদ, বোধগম্যতা প্রশ্নোত্তর (CQA), দক্ষতা পরীক্ষা প্রশ্নোত্তর (CSQA) এবং নির্দেশনা-প্রতিক্রিয়া (IR) জোড়া। প্রতিটি পর্যায়ে টোকেন সংখ্যা ২.১২B থেকে ৬.৭৮B পর্যন্ত বিস্তৃত, বিস্মৃতি, এগিয়ে যাওয়া স্থানান্তর এবং পিছিয়ে যাওয়া স্থানান্তরের নির্ভুল বিশ্লেষণ সমর্থন করে।
বর্তমান বড় ভাষা মডেলগুলির মুখোমুখি মূল চ্যালেঞ্জ হল ক্রমাগত শিক্ষা সমস্যা: ১. স্ট্যাটিক জ্ঞান সীমাবদ্ধতা: বিদ্যমান LLM-গুলির জ্ঞান এবং দক্ষতা প্রশিক্ষণের পরে স্ট্যাটিক হয়ে যায়, মানুষের মতো ক্রমাগত নতুন জ্ঞান শিখতে পারে না ২. বিপর্যয়কর বিস্মৃতি: নতুন কাজ শিখার সময়, মডেলগুলি প্রায়শই আগে শেখা দক্ষতা ভুলে যায় ३. দক্ষতা নির্ভরতা মডেলিং অভাব: বিদ্যমান পদ্ধতিগুলি দক্ষতার মধ্যে নির্ভরতা সম্পর্কের নির্ভুল নিয়ন্ত্রণ এবং মডেলিং অভাব করে
ক্রমাগত শিক্ষার ক্ষমতা মানব বুদ্ধিমত্তার একটি গুরুত্বপূর্ণ বৈশিষ্ট্য, সত্যিকারের বুদ্ধিমান AI সিস্টেম তৈরির জন্য অত্যন্ত গুরুত্বপূর্ণ:
१. দক্ষতা নিয়ন্ত্রণ অনির্ভুল: বিদ্যমান বেঞ্চমার্কগুলি নির্দিষ্ট দক্ষতার নির্ভুল নিয়ন্ত্রণের অভাব করে २. জ্ঞান নির্ভরতা সম্পর্ক অস্পষ্ট: দক্ষতার মধ্যে সম্পর্ক খুব কমই স্পষ্টভাবে মডেল করা হয় ३. বিস্মৃতি পরিমাপ অপর্যাপ্ত: অনেক মূল্যায়ন ক্রম শিক্ষা কাজ জুড়ে বিপর্যয়কর বিস্মৃতি সঠিকভাবে পরিমাপ করতে পারে না
१. উদ্ভাবনী কাঠামো: প্রথমবারের মতো মানব শিক্ষা পাঠ্যক্রম ব্যবস্থা ক্রমাগত শিক্ষা মূল্যায়নে প্রবর্তন করে, বিকাশমূলক মনোবিজ্ঞানের উপর ভিত্তি করে দক্ষতা কাঠামো প্রদান করে २. বড় আকারের সিন্থেটিক ডেটাসেট: ২३.४B টোকেনের মাল্টি-ফর্ম্যাট সিন্থেটিক ডেটাসেট তৈরি করে, ৫টি বিকাশমূলক পর্যায় জুড়ে, নিয়ন্ত্রিত শব্দভাণ্ডার জটিলতা এবং দক্ষতা অগ্রগতি সহ ३. দক্ষতা গ্রাফ মডেলিং: স্পষ্ট দক্ষতা নির্ভরতা গ্রাফ তৈরি করে, ১३००+ সূক্ষ্ম-দানাদার দক্ষতা সহ, পূর্বশর্ত সম্পর্কের পরিমাণগত বিশ্লেষণ সমর্থন করে ४. সূক্ষ্ম-দানাদার মূল্যায়ন ব্যবস্থা: সূচক, দক্ষতা এবং পর্যায় তিনটি স্তরে সূক্ষ্ম মূল্যায়ন সমর্থন করে, বিস্মৃতি, স্থানান্তর এবং নমুনা দক্ষতা নির্ভুলভাবে পরিমাপ করতে পারে
ক্রমাগত শিক্ষা কাজ: বিকাশমূলক পর্যায় দ্বারা সংগঠিত শিক্ষা কাজের একটি সিরিজ দেওয়া, মডেলটি প্রয়োজন:
দুটি শিক্ষা কাঠামোর উপর ভিত্তি করে চার-স্তরের দক্ষতা কাঠামো তৈরি করা:
বীজ নির্মাণ:
প্রজন্ম কৌশল:
१. বিকাশমূলক মনোবিজ্ঞান চালিত: প্রথমবারের মতো Cambridge Primary Curriculum এবং ELOF কাঠামো AI মূল্যায়নে প্রবর্তন করা २. মাল্টি-স্তরের দক্ষতা মডেলিং: বিমূর্ত দক্ষতা থেকে নির্দিষ্ট সূচক পর্যন্ত স্তরযুক্ত বিয়োজন ३. নির্ভরতা সম্পর্ক পরিমাণীকরণ: ওজনযুক্ত নির্দেশিত গ্রাফ ব্যবহার করে দক্ষতার মধ্যে পূর্বশর্ত সম্পর্ক স্পষ্টভাবে মডেল করা ४. মাল্টি-ফর্ম্যাট ডেটা সংমিশ্রণ: অনুচ্ছেদ, প্রশ্নোত্তর এবং নির্দেশনা প্রতিক্রিয়া পরিচালনা করার জন্য একীভূত চ্যাট টেমপ্লেট
| পর্যায় | দক্ষতা সংখ্যা | উপ-দক্ষতা সংখ্যা | লক্ষ্য সংখ্যা | সূচক সংখ্যা | CQA সংখ্যা | CSQA সংখ্যা | IR সংখ্যা | টোকেন সংখ্যা (বিলিয়ন) |
|---|---|---|---|---|---|---|---|---|
| ० | ७ | २४ | ५९ | १८२ | १.०M | ३.०१M | ३.३०M | २.१२ |
| १ | ७ | २९ | ८६ | २९२ | २०.२M | ४.०४M | ४.१०M | ३.४७ |
| २ | ६ | २६ | ६७ | २४९ | २३.५M | ४.७०M | ४.७८M | ४.५६ |
| ३ | ६ | २६ | ६८ | २७१ | ३१.२M | ६.२४M | ६.२९M | ६.४७ |
| ४ | ६ | २३ | ७० | ३४९ | २७.४M | ५.४९M | ५.५२M | ६.७८ |
Figure ४ এর তাপমাত্রা মানচিত্র থেকে দেখা যায়:
१. স্বাধীন প্রশিক্ষণ (Independent):
२. যৌথ প্রশিক্ষণ (Joint):
३. ক্রমাগত প্রশিক্ষণ (Continual):
Figure ५ যৌথ প্রশিক্ষণ এবং ক্রমাগত প্রশিক্ষণের কর্মক্ষমতা পার্থক্য প্রদর্শন করে:
মূল আবিষ্কার:
বিদ্যমান বেঞ্চমার্কের সীমাবদ্ধতা:
এই কাজের অনন্যতা: १. মানব বিকাশ পাঠ্যক্রমের উপর ভিত্তি করে দক্ষতা সংগঠন २. স্পষ্ট দক্ষতা নির্ভরতা গ্রাফ ३. বড় আকারের নিয়ন্ত্রিত সিন্থেটিক ডেটা প্রজন্ম
१. ডেটা ক্রম গুরুত্ব: শুধুমাত্র ডেটা ক্রম পরিবর্তন করে বিস্মৃতি এবং সাধারণীকরণ উল্লেখযোগ্যভাবে প্রভাবিত করতে পারে २. দক্ষতা নির্ভরতার ভূমিকা: কম আউটডিগ্রি দক্ষতা ক্রমাগত শিক্ষায় আরও সহজে বিস্মৃত হয় ३. মূল্যায়ন দানাদারতার প্রয়োজনীয়তা: সূক্ষ্ম-দানাদার মূল্যায়ন ম্যাক্রো মেট্রিক্স দ্বারা লুকানো গুরুত্বপূর্ণ প্যাটার্ন প্রকাশ করতে পারে
१. সিন্থেটিক ডেটা সীমাবদ্ধতা: সম্পূর্ণভাবে সিন্থেটিক ডেটা ব্যবহার করা, বাস্তব-বিশ্ব পরিস্থিতি প্রতিফলিত নাও করতে পারে २. মডেল স্কেল: শুধুমাত্র १३५M প্যারামিটার মডেলে যাচাই করা, বড় মডেল আচরণ ভিন্ন হতে পারে ३. ইন্টারেক্টিভ শিক্ষা অভাব: স্ট্যাটিক ডেটাসেট সত্যিকারের ইন্টারেক্টিভ শিক্ষা পরিবেশ অনুকরণ করতে পারে না ४. ভাষা মডেলিং প্যারাডাইম: মডেল একই সাথে নির্দেশনা এবং প্রতিক্রিয়া শিখে, মানব শিক্ষা প্যাটার্নের সাথে সম্পূর্ণভাবে সামঞ্জস্যপূর্ণ নয়
१. বয়স পরিসীমা সম্প্রসারণ: কাঠামো १४ বছর পর্যন্ত সম্প্রসারণ করা (আরও বিকাশমূলক পর্যায়) २. বড় মডেল যাচাইকরণ: বিলিয়ন প্যারামিটার স্তরের মডেলে আবিষ্কার যাচাই করা ३. বাস্তব ডেটা একীকরণ: বাস্তব শিক্ষা ডেটা সহ কাঠামো যাচাই করা ४. ইন্টারেক্টিভ পরিবেশ: গতিশীল ইন্টারেক্শন সমর্থন করে এমন শিক্ষা পরিবেশ বিকাশ করা
१. শক্তিশালী উদ্ভাবনী: প্রথমবারের মতো বিকাশমূলক মনোবিজ্ঞান সিস্টেমেটিকভাবে ক্রমাগত শিক্ষা মূল্যায়নে প্রবর্তন করা २. ডেটাসেট বড় আকার: २३.४B টোকেনের বড় আকারের ডেটাসেট, পর্যাপ্ত পরীক্ষা সমর্থন করে ३. মূল্যায়ন সূক্ষ্ম: মাল্টি-স্তরের, মাল্টি-মাত্রার মূল্যায়ন ব্যবস্থা, গভীর অন্তর্দৃষ্টি প্রদান করে ४. পুনরুৎপাদনযোগ্যতা ভাল: কোড এবং ডেটা জনসাধারণের জন্য উপলব্ধ, পরবর্তী গবেষণা সমর্থন করে ५. তাত্ত্বিক ভিত্তি দৃঢ়: পরিপক্ক শিক্ষা তাত্ত্বিক কাঠামোর উপর ভিত্তি করে
१. পরীক্ষামূলক স্কেল সীমাবদ্ধতা: শুধুমাত্র ছোট মডেলে যাচাই করা, সিদ্ধান্তের সর্বজনীনতা যাচাইকরণের অপেক্ষায় २. সিন্থেটিক ডেটা পক্ষপাত: সম্ভবত প্রজন্ম পক্ষপাত বিদ্যমান, সিদ্ধান্তের নির্ভরযোগ্যতা প্রভাবিত করে ३. মূল্যায়ন পদ্ধতি নির্ভরতা: মূল্যায়নের জন্য LLM ব্যবহার করা, অতিরিক্ত পক্ষপাত প্রবর্তন করতে পারে ४. দক্ষতা গ্রাফ গুণমান: LLM পূর্বাভাস প্রান্ত সম্পর্ক যথেষ্ট নির্ভুল নাও হতে পারে
१. একাডেমিক অবদান: ক্রমাগত শিক্ষা গবেষণার জন্য নতুন মূল্যায়ন প্যারাডাইম প্রদান করে २. ব্যবহারিক মূল্য: বিদ্যমান ক্রমাগত শিক্ষা অ্যালগরিদম মূল্যায়ন এবং উন্নতির জন্য ব্যবহার করা যায় ३. অনুপ্রেরণা অর্থ: AI গবেষণায় আন্তঃশাস্ত্রীয় পদ্ধতির মূল্য প্রদর্শন করে ४. সম্প্রদায় সম্পদ: মূল্যবান ওপেন-সোর্স ডেটাসেট এবং সরঞ্জাম প্রদান করে
१. ক্রমাগত শিক্ষা অ্যালগরিদম উন্নয়ন: মানক মূল্যায়ন প্ল্যাটফর্ম প্রদান করে २. শিক্ষা AI সিস্টেম: শিক্ষা পরিস্থিতিতে AI প্রয়োগের জন্য রেফারেন্স প্রদান করে ३. জ্ঞানীয় মডেলিং গবেষণা: মানব শিক্ষা প্রক্রিয়ার গণনামূলক মডেলিং সমর্থন করে ४. LLM ক্ষমতা মূল্যায়ন: বড় মডেলের শিক্ষা এবং বিস্মৃতি আচরণের সূক্ষ্ম-দানাদার মূল্যায়ন করে
পেপারটি একাধিক গুরুত্বপূর্ণ সম্পর্কিত কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের গবেষণা কাজ, যা উদ্ভাবনীভাবে মানব বিকাশ মনোবিজ্ঞান ক্রমাগত শিক্ষা মূল্যায়নে প্রবর্তন করে, একটি বড় আকারের, কাঠামোগত মূল্যায়ন কাঠামো তৈরি করে। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এটি ক্রমাগত শিক্ষা গবেষণার জন্য নতুন দিকনির্দেশনা খুলে দেয়, উল্লেখযোগ্য একাডেমিক মূল্য এবং ব্যবহারিক তাৎপর্য রয়েছে।