শিক্ষা প্যারাডাইমের বিবর্তন শিক্ষাগত পরিবর্তনকে চালিত করছে। কার্যকর শিক্ষার একটি মৌলিক দিক হল শিক্ষার্থীদের প্রাসঙ্গিক, তাৎক্ষণিক এবং গঠনমূলক প্রতিক্রিয়া প্রদান করা। বৃহৎ আকারের শিক্ষার্থী গোষ্ঠীকে গঠনমূলক প্রতিক্রিয়া প্রদান করা শিক্ষাবিদদের জন্য একটি চলমান চ্যালেঞ্জ। তাই, গবেষকরা তাৎক্ষণিক প্রতিক্রিয়া প্রদানের জন্য স্বয়ংক্রিয় মূল্যায়নের দিকে ঝুঁকছেন। তবে, বর্তমান পদ্ধতিগুলি প্রায়শই সীমিত পরিসরের এবং সরল প্রতিক্রিয়া প্রদান করে যা শিক্ষার্থীদের উন্নতির জন্য ব্যক্তিগতকৃত প্রতিক্রিয়া দিতে পারে না। এই গবেষণাপত্রটি পূর্বনির্ধারিত মূল্যায়ন মানদণ্ড ব্যবহার করে শিক্ষার্থী মূল্যায়ন প্রক্রিয়াকরণ এবং ব্যক্তিগতকৃত প্রতিক্রিয়া উৎপাদনে বড় ভাষা মডেল (LLM) এর কর্মক্ষমতা অধ্যয়ন করে এই সীমাবদ্ধতার সমাধান করে। লেখকরা ব্যক্তিগতকৃত প্রতিক্রিয়ার মাধ্যমে শিক্ষার্থী শিক্ষা বৃদ্ধির জন্য মূল্যায়ন, ট্র্যাকিং এবং মূল্যায়ন (LLM-MATE) এর জন্য বিদ্যমান LLM এর শক্তি ব্যবহার করার লক্ষ্য রাখে।
এই গবেষণা প্রধানত নিম্নলিখিত সমস্যাগুলির সমাধান করে:
বড় ভাষা মডেলের শক্তিশালী পাঠ্য বোঝা এবং উৎপাদন ক্ষমতা ব্যবহার করে, পূর্বনির্ধারিত মূল্যায়ন মানদণ্ডের সাথে মিলিয়ে, কম্পিউটার বিজ্ঞান শিক্ষার্থীদের বহুমুখী মূল্যায়নের (পাঠ্য, চিত্র, প্রোগ্রামিং) জন্য ব্যক্তিগতকৃত, গঠনমূলক প্রতিক্রিয়া প্রদান করা।
১. LLM-MATE ফ্রেমওয়ার্ক প্রস্তাব: একটি বড় ভাষা মডেল-ভিত্তিক মূল্যায়ন, ট্র্যাকিং এবং মূল্যায়ন সিস্টেম যা বহুমুখী শিক্ষার্থী মূল্যায়ন পরিচালনা করতে পারে २. শূন্য-শট প্রম্পট ইঞ্জিনিয়ারিং পদ্ধতি: শিক্ষার্থী মূল্যায়নের জন্য বিশেষায়িত ChatGPT প্রম্পট কৌশল বিকাশ করা, প্রশিক্ষণ ডেটা ছাড়াই উচ্চ মানের প্রতিক্রিয়া উৎপাদন করে ३. বহুমুখী মূল্যায়ন ক্ষমতা: পাঠ্য এবং চার্ট সহ সফটওয়্যার স্থাপত্য মূল্যায়নে LLM এর কার্যকারিতা যাচাই করা ४. শিক্ষক যাচাইকরণ গবেষণা: মানব বিশেষজ্ঞদের সাথে তুলনামূলক যাচাইকরণের মাধ্যমে, AI-উৎপাদিত প্রতিক্রিয়ার নির্ভরযোগ্যতা প্রমাণ করা ५. ব্যবহারিক প্রয়োগ মূল্য: বৃহৎ আকারের কোর্সের স্বয়ংক্রিয় মূল্যায়নের জন্য একটি কার্যকর সমাধান প্রদান করা
ইনপুট: শিক্ষার্থী দ্বারা জমা দেওয়া মূল্যায়ন কাজ (পাঠ্য বর্ণনা, সফটওয়্যার স্থাপত্য চার্ট ইত্যাদি সহ) + মূল্যায়ন মানদণ্ড এবং স্কোরিং বিবরণ আউটপুট: কাঠামোবদ্ধ ব্যক্তিগতকৃত প্রতিক্রিয়া, যার মধ্যে রয়েছে:
সীমাবদ্ধতা:
१. ডেটা সংগ্রহ (ডেটা কালেকশন)
२. প্রম্পট ইঞ্জিনিয়ারিং (প্রম্পট ইঞ্জিনিয়ারিং)
३. ChatGPT মূল্যায়ন সম্পাদন (মূল্যায়ন মূল্যায়ন ChatGPT প্রম্পট সহ)
४. মূল্যায়ন এবং আলোচনা প্রক্রিয়া (মূল্যায়ন এবং আলোচনা প্রক্রিয়া)
শূন্য-শট শেখার কৌশল:
সিস্টেম প্রম্পট + মূল্যায়ন পরিচয় + স্কোরিং মানদণ্ড + শিক্ষার্থীর উত্তর + আউটপুট ফর্ম্যাট প্রয়োজনীয়তা
প্রম্পট কাঠামো ডিজাইন:
१. বহুমুখী প্রক্রিয়াকরণ ক্ষমতা: GPT-4o ব্যবহার করে একযোগে পাঠ্য এবং চিত্র সামগ্রী প্রক্রিয়া করা, সফটওয়্যার প্রকৌশল মূল্যায়নের জন্য উপযুক্ত २. শূন্য-শট অভিযোজনযোগ্যতা: নির্দিষ্ট প্রশিক্ষণ ডেটা ছাড়াই, শুধুমাত্র প্রম্পট ইঞ্জিনিয়ারিং এর মাধ্যমে বিভিন্ন মূল্যায়ন কাজের সাথে খাপ খাইয়ে নেওয়া ३. কাঠামোবদ্ধ প্রতিক্রিয়া উৎপাদন: শক্তি, দুর্বলতা, উন্নতির পরামর্শ এবং স্কোরিং যুক্তি সহ সম্পূর্ণ প্রতিক্রিয়া উৎপাদন করা ४. মানব-যন্ত্র সহযোগিতা যাচাইকরণ: AI এবং মানব বিশেষজ্ঞদের মধ্যে আলোচনা প্রক্রিয়া স্থাপন করা, প্রতিক্রিয়া গুণমান নিশ্চিত করা
আবিষ্কার: ChatGPT ব্যক্তিগতকৃত গঠনমূলক প্রতিক্রিয়া উৎপাদনে ভাল কর্মক্ষমতা প্রদর্শন করে
তুলনামূলক বিশ্লেষণ:
শিক্ষক যাচাইকরণ ফলাফল:
সাধারণ AI প্রতিক্রিয়া বৈশিষ্ট্য: १. শক্তি চিহ্নিতকরণ: শিক্ষার্থীর কাজে সঠিক বাস্তবায়ন সঠিকভাবে চিহ্নিত করা २. সমস্যা নির্ণয়: প্রযুক্তিগত ত্রুটি এবং ধারণাগত ভুল বোঝাপড়া নির্দিষ্টভাবে নির্দেশ করা ३. উন্নতির পরামর্শ: কার্যকর নির্দিষ্ট উন্নতি পরিকল্পনা প্রদান করা ४. স্কোরিং যুক্তি: স্কোরিং ভিত্তি বিস্তারিতভাবে ব্যাখ্যা করা
१. সামঞ্জস্য সুবিধা: AI মূল্যায়ন মানব মূল্যায়নের চেয়ে আরও সামঞ্জস্যপূর্ণ প্রতিক্রিয়া মানদণ্ড প্রদান করতে পারে २. বিস্তারিত স্তর: AI-উৎপাদিত প্রতিক্রিয়া ঐতিহ্যবাহী মানব প্রতিক্রিয়ার চেয়ে আরও বিস্তারিত এবং নির্দিষ্ট ३. সময়োপযোগীতা: তাৎক্ষণিক প্রতিক্রিয়া উৎপাদন করতে পারে, বৃহৎ আকারের শিক্ষার প্রয়োজন পূরণ করে ४. ব্যক্তিগতকরণ: প্রতিটি শিক্ষার্থীর নির্দিষ্ট পরিস্থিতির জন্য কাস্টমাইজড পরামর্শ প্রদান করে
१. বুদ্ধিমান প্রতিক্রিয়া সিস্টেম:
२. স্বয়ংক্রিয় মূল্যায়ন:
३. ব্যক্তিগতকৃত শিক্ষা:
| দিক | বিদ্যমান কাজ | এই গবেষণার অবদান |
|---|---|---|
| মূল্যায়ন প্রকার | প্রধানত গঠনমূলক মূল্যায়নে ফোকাস | সংক্ষিপ্ত মূল্যায়নে ফোকাস |
| প্রতিক্রিয়া বিস্তারিত স্তর | সরল স্কোরিং বা শ্রেণীবিভাগ | বিস্তারিত কাঠামোবদ্ধ প্রতিক্রিয়া |
| বহুমুখী প্রক্রিয়াকরণ | বেশিরভাগ শুধুমাত্র পাঠ্য প্রক্রিয়া করে | একযোগে পাঠ্য এবং চিত্র প্রক্রিয়া করে |
| যাচাইকরণ পদ্ধতি | শিক্ষার্থী সন্তুষ্টি সমীক্ষা | বিশেষজ্ঞ আস্থা মূল্যায়ন |
१. প্রযুক্তিগত সম্ভাব্যতা: ChatGPT কম্পিউটার বিজ্ঞান শিক্ষার্থীদের বহুমুখী মূল্যায়ন কার্যকরভাবে পরিচালনা করতে এবং উচ্চ মানের ব্যক্তিগতকৃত প্রতিক্রিয়া উৎপাদন করতে পারে २. শিক্ষাগত মূল্য: AI-উৎপাদিত প্রতিক্রিয়া ঐতিহ্যবাহী মানব প্রতিক্রিয়ার চেয়ে আরও বিস্তারিত এবং গঠনমূলক, শিক্ষার্থী শিক্ষা উন্নতিতে সহায়তা করে ३. ব্যবহারিকতা: LLM-MATE পদ্ধতি বৃহৎ আকারের কোর্সের মূল্যায়ন চ্যালেঞ্জ সমাধানে সহায়তা করতে পারে, শিক্ষার দক্ষতা উন্নত করে ४. সামঞ্জস্য: AI মূল্যায়ন একাধিক মানব মূল্যায়নকারীর চেয়ে আরও সামঞ্জস্যপূর্ণ মূল্যায়ন মানদণ্ড প্রদান করতে পারে
१. ডেটা আকার সীমাবদ্ধতা: শুধুমাত্র ২३ জন শিক্ষার্থীর সম্মতি পাওয়া গেছে, নমুনা আকার তুলনামূলকভাবে ছোট २. মূল্যায়ন পরিসর: প্রধানত ব্যবহারকারী কেস চার্ট মূল্যায়ন যাচাই করা হয়েছে, ক্লাস চার্ট এবং স্থাপত্য চার্টের যাচাইকরণ অপর্যাপ্ত ३. হ্যালুসিনেশন ঝুঁকি: LLM কর্তৃপক্ষপূর্ণ কিন্তু প্রকৃতপক্ষে ত্রুটিপূর্ণ সামগ্রী উৎপাদন করতে পারে ४. ডোমেইন নির্ভরতা: সর্বোত্তম প্রভাব অর্জনের জন্য সাবধানে ডিজাইন করা মূল্যায়ন মানদণ্ড প্রয়োজন ५. শিক্ষার্থী দৃষ্টিভঙ্গির অভাব: AI প্রতিক্রিয়ার প্রতি শিক্ষার্থীর গ্রহণযোগ্যতা এবং শিক্ষার প্রভাব সরাসরি মূল্যায়ন করা হয়নি
१. পরীক্ষা সম্প্রসারণ:
२. প্রযুক্তিগত উন্নতি:
३. শিক্ষাগত প্রভাব মূল্যায়ন:
१. বাস্তব সমস্যা-ভিত্তিক: শিক্ষায় প্রকৃত ব্যথার পয়েন্টগুলিকে লক্ষ্য করে, স্পষ্ট প্রয়োগ মূল্য রয়েছে २. পদ্ধতি উদ্ভাবন: বহুমুখী শিক্ষা মূল্যায়নে LLM প্রয়োগ একটি নতুন প্রচেষ্টা ३. যাচাইকরণ সম্পূর্ণতা: বিশেষজ্ঞ যাচাইকরণের মাধ্যমে গবেষণা ফলাফলের বিশ্বাসযোগ্যতা নিশ্চিত করা ४. শক্তিশালী ব্যবহারিকতা: প্রস্তাবিত ফ্রেমওয়ার্ক সরাসরি প্রকৃত শিক্ষা পরিবেশে প্রয়োগ করা যায়
१. সীমিত পরীক্ষা আকার: নমুনা সংখ্যা কম, ফলাফলের সর্বজনীনতা প্রভাবিত করতে পারে २. একক মূল্যায়ন মাত্রা: প্রধানত প্রতিক্রিয়া গুণমানে ফোকাস করে, শিক্ষার প্রভাবের সরাসরি পরিমাপের অভাব রয়েছে ३. অপর্যাপ্ত প্রযুক্তিগত গভীরতা: প্রধানত বিদ্যমান API ব্যবহার করে, গভীর প্রযুক্তিগত উদ্ভাবনের অভাব রয়েছে ४. খরচ-সুবিধা বিশ্লেষণের অভাব: বৃহৎ আকারের স্থাপনার খরচ এবং স্থায়িত্ব আলোচনা করা হয়নি
१. একাডেমিক অবদান: শিক্ষা প্রযুক্তি ক্ষেত্রে LLM প্রয়োগের নতুন চিন্তাভাবনা প্রদান করে २. ব্যবহারিক মূল্য: উচ্চতর শিক্ষায় বৃহৎ আকারের কোর্স মূল্যায়নে সরাসরি প্রয়োগ করা যায় ३. পুনরুৎপাদনযোগ্যতা: পদ্ধতি বর্ণনা স্পষ্ট, অন্যান্য গবেষকদের জন্য পুনরুৎপাদন এবং উন্নতি সহজ ४. প্রচার সম্ভাবনা: ফ্রেমওয়ার্ক ভাল সর্বজনীনতা রয়েছে, অন্যান্য শৃঙ্খলায় প্রসারিত করা যায়
१. বৃহৎ আকারের কোর্স: বিশেষত অনেক শিক্ষার্থী সহ কম্পিউটার বিজ্ঞান কোর্সের জন্য উপযুক্ত २. মানক মূল্যায়ন: স্পষ্ট মূল্যায়ন মানদণ্ড সহ প্রযুক্তিগত কোর্সের জন্য উপযুক্ত ३. বহুমুখী কাজ: চার্ট, কোড এবং পাঠ্য সহ ব্যাপক মূল্যায়নের জন্য উপযুক্ত ४. অনলাইন শিক্ষা: দূরবর্তী শিক্ষা প্ল্যাটফর্মের জন্য স্বয়ংক্রিয় মূল্যায়ন সমাধান প্রদান করে
এই গবেষণাপত্রটি ৩८ টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, প্রধানত অন্তর্ভুক্ত:
মূল সংদর্ভ: १. González-Calatayud ইত্যাদি (२०२१) - AI শিক্ষার্থী মূল্যায়ন সিস্টেম পর্যালোচনা २. Maier এবং Klotz (२०२२) - ডিজিটাল শিক্ষা পরিবেশে ব্যক্তিগতকৃত প্রতিক্রিয়া ३. Biswas এবং Bhattacharya (२०२४) - ML-ভিত্তিক বুদ্ধিমান রিয়েল-টাইম প্রতিক্রিয়া সিস্টেম ४. Liu ইত্যাদি (२०२३) - প্রম্পট ইঞ্জিনিয়ারিং পদ্ধতি সিস্টেম পর্যালোচনা
প্রযুক্তিগত সহায়ক সংদর্ভ:
সামগ্রিক মূল্যায়ন: এটি একটি ব্যবহারিক প্রয়োগ মূল্য সহ গবেষণাপত্র, যদিও প্রযুক্তিগত উদ্ভাবন এবং পরীক্ষার আকারে নির্দিষ্ট সীমাবদ্ধতা রয়েছে, তবে শিক্ষা প্রযুক্তি ক্ষেত্রে মূল্যবান অন্বেষণ এবং ব্যবহারিক অভিজ্ঞতা প্রদান করে। গবেষণা পদ্ধতি যুক্তিসঙ্গত, ফলাফল বিশ্বাসযোগ্য, শিক্ষা মূল্যায়নে AI প্রয়োগ প্রচারে ইতিবাচক অর্থ রয়েছে।