বৃহৎ ভাষা মডেল (LLMs) এর আবির্ভাব গেম পরিবেশে গতিশীল অ-খেলোয়াড় চরিত্র (NPCs) তৈরির নতুন সুযোগ উন্মোচন করেছে, যা কার্যকরী কাজ সম্পাদন এবং চরিত্র-সামঞ্জস্যপূর্ণ সংলাপ উৎপাদন উভয়ই সক্ষম করে। এই নিবন্ধটি কমনসেন্স চরিত্র-ভিত্তিক সংলাপ চ্যালেঞ্জ (CPDC) ২০২৫ এর দ্বিতীয় পর্যায়ে TU_Character_lab দলের অংশগ্রহণ রিপোর্ট করে, যা তিনটি ট্র্যাকে এজেন্টের কর্মক্ষমতা মূল্যায়ন করে: কাজ-ভিত্তিক সংলাপ, প্রসঙ্গ-সচেতন সংলাপ এবং তাদের একীকরণ। গবেষণা পদ্ধতি দুটি পরিপূরক কৌশল একত্রিত করে: (১) API ট্র্যাকে হালকা-ওজনের প্রম্পটিং কৌশল, যার মধ্যে অত্যধিক চরিত্র অভিনয় দমন করা এবং কাজের নির্ভুলতা বৃদ্ধির জন্য ডিফ্ল্যান্ডারাইজেশন প্রম্পটিং পদ্ধতি অন্তর্ভুক্ত; (২) GPU ট্র্যাকে সূক্ষ্ম-সুর করা বৃহৎ মডেল, তত্ত্বাবধানকৃত সূক্ষ্ম-সুর (SFT) এবং নিম্ন-র্যাঙ্ক অভিযোজন (LoRA) এর জন্য Qwen3-14B ব্যবহার করে। সর্বোত্তম জমা কাজ ১-এ ২য় স্থান, কাজ ৩ (API ট্র্যাক) এ ২য় স্থান এবং কাজ ৩ (GPU ট্র্যাক) এ ৪র্থ স্থান অর্জন করেছে।
ঐতিহ্যবাহী গেম উন্নয়ন পূর্ব-প্রোগ্রাম করা যুক্তির উপর ব্যাপকভাবে নির্ভর করে, গেম-এর ইভেন্ট এবং চরিত্র মিথস্ক্রিয়া পূর্বনির্ধারিত স্ক্রিপ্ট এবং সংলাপ গাছ অনুসরণ করে। খেলোয়াড়ের নিমজ্জন এবং বর্ণনামূলক গভীরতা বৃদ্ধি করতে, বিকাশকারীরা NPCs এর মূল উপাদান হিসাবে LLMs ব্যবহার করতে শুরু করেছেন, যা তাদের মানব-সদৃশ আচরণ প্রদর্শন করতে এবং খেলোয়াড়দের সাথে গতিশীল, প্রসঙ্গ-সচেতন সংলাপে জড়িত হতে সক্ষম করে।
দীর্ঘমেয়াদী মিথস্ক্রিয়ায় গতিশীল চরিত্রের সামঞ্জস্য এবং গভীরতা বজায় রাখা উল্লেখযোগ্য চ্যালেঞ্জের সম্মুখীন, বিশেষত "ফ্ল্যান্ডারাইজেশন" (Flanderization) ঘটনা। এই শব্দটি "দ্য সিম্পসন্স" এর চরিত্র নেড ফ্ল্যান্ডার্স থেকে উদ্ভূত, যা জটিল চরিত্রগুলি সময়ের সাথে ক্রমান্বয়ে সরলীকৃত হওয়া নির্দেশ করে, শেষ পর্যন্ত একটি একক অতিরঞ্জিত বৈশিষ্ট্য দ্বারা সংজ্ঞায়িত কার্টুন চিত্রে পরিণত হয়।
১. চরিত্র প্রামাণিকতা এবং কাজ সম্পাদনের ভারসাম্য: বিদ্যমান LLM-চালিত NPCs অত্যধিক চরিত্র অভিনয়ের সময় প্রায়শই কার্যকরী সঠিকতা উপেক্ষা করে ২. দীর্ঘমেয়াদী সংলাপ সামঞ্জস্য: বর্ধিত সংলাপে চরিত্র সংযোগ বজায় রাখার প্রয়োজন ३. বহু-কাজ একীকরণ: কাজ-ভিত্তিক সংলাপ এবং চরিত্র-সামঞ্জস্যপূর্ণ সংলাপ উভয়ই পরিচালনা করার চ্যালেঞ্জ
१. ডিফ্ল্যান্ডারাইজেশন প্রম্পটিং কৌশল প্রস্তাব: অত্যধিক চরিত্র অভিনয় দমন করা, সংলাপ উৎপাদন এবং কার্যকরী প্রজন্ম ক্ষমতার মধ্যে ভারসাম্য অর্জন २. হালকা-ওজনের প্রম্পটিং এবং সূক্ষ্ম-সুরের পরিপূরক কৌশল অন্বেষণ: API ট্র্যাকে প্রম্পট ইঞ্জিনিয়ারিং, GPU ট্র্যাকে মডেল সূক্ষ্ম-সুর ३. হাইব্রিড RAG+মেমরি পদ্ধতি নির্মাণ: পুনরুদ্ধার-বর্ধিত প্রজন্ম এবং স্মৃতি প্রক্রিয়া একত্রিত করে সংলাপ ভিত্তি উন্নত করা ४. CPDC ২०२५ প্রতিযোগিতায় উৎকৃষ্ট ফলাফল অর্জন: একাধিক কাজে শীর্ষ র্যাঙ্কিং, পদ্ধতির কার্যকারিতা যাচাই করা
CPDC প্রতিযোগিতায় তিনটি কাজ অন্তর্ভুক্ত রয়েছে:
মূল ধারণা হল মডেলকে প্রাকৃতিক সংক্ষিপ্ত প্রতিক্রিয়া প্রদান করতে নির্দেশনা দেওয়া, অতিরঞ্জিত চরিত্র অভিনয় এড়ানো। ত্রুটি বিশ্লেষণ দেখায় যে বেসলাইন সেটিংস প্রায়শই অত্যন্ত বিস্তারিত এবং প্রসঙ্গ-বিচ্ছিন্ন আউটপুট তৈরি করে, বর্ণনামূলক সেটিংয়ে অত্যধিক মনোযোগ দেয় খেলোয়াড়ের সরাসরি অনুরোধের পরিবর্তে।
প্রধান প্রম্পটিং কৌশল:
চিত্র २ এ দেখানো হয়েছে, API ট্র্যাক একটি পাঁচ-ধাপের পাইপলাইন ব্যবহার করে: १. কার্যকরী কল প্রম্পট প্রস্তুত করা २. কার্যকরী প্রজন্ম (API কল #१) ३. ফাংশন সম্পাদন ४. সংলাপ প্রম্পট প্রস্তুত করা ५. সংলাপ প্রজন্ম (API কল #२)
গণনামূলক সীমাবদ্ধতার কারণে (AWS g5e.2xlarge উদাহরণ, L40s GPU), সেই পরিবেশে চলতে পারে এমন মডেল নির্বাচন করা হয়েছিল, চূড়ান্তভাবে Qwen3-14B প্রধান মডেল হিসাবে নির্বাচিত হয়েছিল।
সূক্ষ্ম-সুর কৌশল: १. সম্পূর্ণ SFT: প্রাথমিক এবং সংশ্লেষিত বহু-পালা সংলাপ ডেটায় তত্ত্বাবধানকৃত সূক্ষ্ম-সুর २. LoRA সূক্ষ্ম-সুর: সংলাপ এবং কার্যকরী কল ডেটাসেটে নিম্ন-র্যাঙ্ক অভিযোজন (rank=३२, α=३२)
gemini-2.5-pro-preview ব্যবহার করে কার্যকরী কল ডেটা তৈরি করা, GPT-4o-mini ব্যবহার করে সংলাপ ডেটা তৈরি করা:
| কাজ | পদ্ধতি | CPDCscore |
|---|---|---|
| কাজ १ | ZeroShot | ०.४२२ |
| কাজ १ | সর্বোত্তম পদ্ধতি (D+RW) | ०.५८६ |
| কাজ ३ | ZeroShot | ०.५१० |
| কাজ ३ | সর্বোত্তম পদ্ধতি | ०.६०१ |
মূল অনুসন্ধান: १. ডিফ্ল্যান্ডারাইজেশন প্রভাব উল্লেখযোগ্য: D কৌশল কাজ ३ এ শূন্য-শট বেসলাইনের তুলনায় +०.०१३ CPDCscore উন্নতি অর্জন করে २. নমুনা প্রম্পটিং আরও উন্নতি করে: কম-নমুনা উদাহরণ যোগ করা (F) কাজ १ এ যথাক্রমে +०.०९२ এবং +०.१३३ উন্নতি অর্জন করে ३. জটিল প্রম্পটিং সীমিত সুবিধা: CoT, গাইড প্রতিক্রিয়া ইত্যাদি জটিল কৌশল সীমিত বা অসামঞ্জস্যপূর্ণ সুবিধা প্রদান করে
| মডেল | পদ্ধতি | কাজ १ স্কোর | কাজ २ স্কোর | মোট স্কোর |
|---|---|---|---|---|
| LLaMA३.१-८B | baseline | ०.४३९ | ०.३३३ | ०.३८६ |
| Qwen३-१४B | SFT + LoRA | ०.५९० | ०.६०६ | ०.५९८ |
মূল অনুসন্ধান: १. মডেল আকার এবং সূক্ষ্ম-সুর গুরুত্বপূর্ণ: Qwen३-१४B SFT এবং LoRA এর সাথে ०.५९८ মোট স্কোর অর্জন করে, ४র্থ স্থান २. পুনরুদ্ধার বর্ধন মধ্যম উন্নতি প্রদান করে: RAG পদ্ধতি Qwen३-८B কর্মক্ষমতা ०.५२२ এ উন্নীত করে ३. কাজ মধ্যে ট্রেড-অফ: RAG+পরিমার্জন কাজ १ এ সর্বোত্তম কর্মক্ষমতা কিন্তু কাজ २ কর্মক্ষমতা হ্রাস, LoRA-SFT আরও ভাল ভারসাম্য অর্জন করে
বিভিন্ন উপাদানের অবদান যাচাই করতে সিস্টেমেটিক বিলোপন পরীক্ষা পরিচালিত হয়েছে:
१. হালকা-ওজনের ডিফ্ল্যান্ডারাইজেশন কৌশল কার্যকর: API সেটিংয়ে অত্যধিক চরিত্র অভিনয় দমন করে উল্লেখযোগ্য কর্মক্ষমতা উন্নতি २. সূক্ষ্ম-সুর করা বৃহৎ মডেল GPU ট্র্যাকে আধিপত্য বিস্তার করে: Qwen३-१४B SFT এবং LoRA এর সাথে সর্বোত্তম ফলাফল অর্জন করে ३. কাজ মধ্যে ভারসাম্য মূল চ্যালেঞ্জ: চরিত্র অভিনয় নির্ভুলতা উন্নত করার পদ্ধতি কখনও কখনও প্যারামিটার সঠিকতা ক্ষতিগ্রস্ত করে
१. গণনামূলক সম্পদ সীমাবদ্ধতা: GPU ট্র্যাক L40s মেমরি বাজেট দ্বারা সীমাবদ্ধ, বৃহত্তর মডেলের ব্যবহার সীমাবদ্ধ করে २. পুনরুদ্ধার কর্পাস আকার: RAG পদ্ধতি পুনরুদ্ধার কর্পাসের আকার এবং গুণমান দ্বারা সীমাবদ্ধ ३. মূল্যায়ন মেট্রিক্স সীমাবদ্ধতা: স্বয়ংক্রিয় মূল্যায়ন মেট্রিক্স সংলাপ সিস্টেমের গুণমান সম্পূর্ণভাবে প্রতিফলিত করতে পারে না, মানব মূল্যায়নের প্রয়োজন
१. হাইব্রিড কৌশল অন্বেষণ: হালকা-ওজনের প্রম্পটিং এবং পুনরুদ্ধার-বর্ধিত সূক্ষ্ম-সুরের একীভূত হাইব্রিড কৌশল २. দীর্ঘমেয়াদী সামঞ্জস্য: দীর্ঘতর সংলাপে চরিত্র সামঞ্জস্য বজায় রাখার পদ্ধতি ३. বহু-মোডাল সম্প্রসারণ: দৃশ্য এবং অডিও তথ্য একত্রিত করে বহু-মোডাল NPC সিস্টেম
१. সমস্যা সংজ্ঞা স্পষ্ট: Flanderization ধারণা প্রবর্তন উদ্ভাবনী, LLM চরিত্র অভিনয়ে মূল সমস্যা নির্ভুলভাবে বর্ণনা করে २. পদ্ধতি পরিপূরকতা শক্তিশালী: API এবং GPU ট্র্যাক বিভিন্ন কিন্তু পরিপূরক কৌশল ব্যবহার করে, ব্যাপক প্রযুক্তিগত দৃষ্টিভঙ্গি প্রদর্শন করে ३. পরীক্ষা পর্যাপ্ত: সিস্টেমেটিক বিলোপন পরীক্ষা এবং বহু-মাত্রিক মূল্যায়ন পদ্ধতির কার্যকারিতা যাচাই করে ४. ব্যবহারিক মূল্য উচ্চ: প্রকৃত প্রতিযোগিতায় উৎকৃষ্ট ফলাফল, পদ্ধতির ব্যবহারিকতা প্রমাণ করে
१. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: Flanderization ঘটনার গভীর তাত্ত্বিক বিশ্লেষণের অভাব २. সাধারণীকরণ যাচাই করা হয়নি: পদ্ধতি প্রধানত CPDC ডেটাসেটে যাচাই করা হয়েছে, অন্যান্য গেম দৃশ্যে সাধারণীকরণের অভাব ३. গণনামূলক দক্ষতা বিশ্লেষণ অনুপস্থিত: বিভিন্ন পদ্ধতির গণনামূলক খরচ এবং অনুমান দক্ষতার বিস্তারিত বিশ্লেষণ নেই ४. ব্যবহারকারী অভিজ্ঞতা মূল্যায়ন অপর্যাপ্ত: প্রকৃত খেলোয়াড়দের বিষয়গত অভিজ্ঞতা মূল্যায়নের অভাব
१. একাডেমিক অবদান: গেম AI ক্ষেত্রে নতুন গবেষণা দিক এবং সমাধান প্রবর্তন করে २. ব্যবহারিক মূল্য: পদ্ধতি গেম উন্নয়নে NPC ডিজাইনে সরাসরি প্রয়োগ করা যায় ३. পুনরুৎপাদনযোগ্যতা: বিস্তারিত বাস্তবায়ন বিবরণ এবং প্রম্পট টেমপ্লেট প্রদান করে, পুনরুৎপাদন সহজতর করে
१. RPG গেম: বিশেষত সমৃদ্ধ চরিত্র মিথস্ক্রিয়া প্রয়োজন এমন ভূমিকা-খেলা গেমের জন্য উপযুক্ত २. শিক্ষামূলক গেম: বুদ্ধিমান শিক্ষণ সহায়ক এবং ভার্চুয়াল শিক্ষক তৈরিতে ব্যবহার করা যায় ३. সামাজিক প্ল্যাটফর্ম: Discord ইত্যাদি সামাজিক প্ল্যাটফর্মে চ্যাটবটে সম্প্রসারণ করা যায়
१. Kazi et al. (२०२४): Large language models as user-agents for evaluating task-oriented-dialogue systems २. Lee et al. (२०२५): AMAN: Agent for mentoring and assisting newbies in MMORPG ३. Phillips et al. (२०२५): Goal-oriented interactions in games using llms ४. Park et al. (२०२३): Generative agents: Interactive simulacra of human behavior ५. Sony AI (२०२५): The commonsense persona-grounded dialogue challenge 2025
এই পেপারটি গেম AI ক্ষেত্রে একটি উদ্ভাবনী সমাধান প্রস্তাব করে, ডিফ্ল্যান্ডারাইজেশন প্রযুক্তির মাধ্যমে NPC এর চরিত্র প্রামাণিকতা এবং কাজ সম্পাদন ক্ষমতার মধ্যে কার্যকরভাবে ভারসাম্য অর্জন করে, ভবিষ্যতে গেমে বুদ্ধিমান চরিত্র ডিজাইনের জন্য গুরুত্বপূর্ণ রেফারেন্স প্রদান করে।