চেইন-অফ-থট প্রম্পটিং বড় ভাষা মডেলে ধাপে ধাপে যুক্তিবিদ্ধতা প্রচার করেছে, কিন্তু সমস্যার জটিলতা এবং প্রসঙ্গের দৈর্ঘ্য বৃদ্ধির সাথে সাথে মডেলের কর্মক্ষমতা হ্রাস পায়। দীর্ঘ প্রসঙ্গের কঠিন কাজগুলিকে ছোট, আরও পরিচালনাযোগ্য উপকাজে বিভক্ত করে, সম্প্রতির মাল্টি-এজেন্ট প্যারাডাইম এই সমস্যার জন্য একটি প্রতিশ্রুতিশীল সমাধান প্রদান করে। তবে এই ধরনের সিস্টেমের মৌলিক ক্ষমতা এখনও সম্পূর্ণভাবে বোঝা যায়নি। এই পেপারটি মাল্টি-এজেন্ট সিস্টেমের প্রকাশক্ষমতা বিশ্লেষণের জন্য একটি তাত্ত্বিক কাঠামো প্রস্তাব করে। লেখকরা এই কাঠামোটি তিনটি অ্যালগরিদম পরিবারে প্রয়োগ করেন: অবস্থা ট্র্যাকিং, স্মরণ এবং কে-হপ যুক্তিবিদ্ধতা। গবেষণা নিম্নলিখিত দিকগুলির সীমানা প্রকাশ করে: (i) কাজটি সঠিকভাবে সমাধান করার জন্য প্রয়োজনীয় এজেন্টের সংখ্যা, (ii) এজেন্টদের মধ্যে যোগাযোগের পরিমাণ এবং কাঠামো, (iii) সমস্যার আকার এবং প্রসঙ্গ প্রসারিত হওয়ার সাথে সাথে অর্জনযোগ্য ত্বরণ। ফলাফলগুলি যোগাযোগ প্রমাণিতভাবে উপকারী হওয়ার প্রক্রিয়াগুলি চিহ্নিত করে, এজেন্টের সংখ্যা এবং ব্যান্ডউইথের মধ্যে ট্রেড-অফ চিত্রিত করে এবং যখন কোনও সম্পদ সীমাবদ্ধ থাকে তখন অন্তর্নিহিত সীমাবদ্ধতা প্রকাশ করে।
এই গবেষণার মূল সমস্যা হল: মাল্টি-এজেন্ট যুক্তিবিদ্ধতা সিস্টেমে, যোগাযোগ এবং গতিশীল সম্পদ বরাদ্দ অ্যালগরিদমিক স্তরে প্রমাণিতভাবে উপকারী কাজগুলি বিদ্যমান কিনা?
১. বিদ্যমান সীমাবদ্ধতা: যদিও চেইন-অফ-থট (CoT) প্রম্পটিং জটিল যুক্তিবিদ্ধতা সমস্যা মোকাবেলার জন্য একটি মান হয়ে উঠেছে, বড় যুক্তিবিদ্ধতা মডেল (LRM) এর যুক্তিবিদ্ধতা ক্ষমতা সমস্যার উদাহরণের জটিলতা বৃদ্ধি বা প্রসঙ্গের দৈর্ঘ্য বৃদ্ধির সাথে হ্রাস পায়
२. ব্যবহারিক চাহিদা: মাল্টি-এজেন্ট সহযোগিতা পদ্ধতি জটিল কাজগুলিকে সহজ উপসমস্যায় বিভক্ত করে শক্তিশালী কর্মক্ষমতা অর্জন করে, কিন্তু এর তাত্ত্বিক ভিত্তি গভীর বোঝার অভাব রয়েছে
३. তাত্ত্বিক শূন্যতা: যদিও CoT প্রম্পটিং সহ ট্রান্সফর্মার প্রকাশক্ষমতা গভীরভাবে অধ্যয়ন করা হয়েছে, মাল্টি-এজেন্ট যুক্তিবিদ্ধতা স্কিমে যোগাযোগ এবং সম্পদ বরাদ্দের মৌলিক সীমাবদ্ধতা এবং ট্রেড-অফ সম্পর্কে খুব কম জানা যায়
লেখকরা ট্রান্সফর্মার-ভিত্তিক মাল্টি-এজেন্ট সিস্টেমে মনোনিবেশ করেন যা w এজেন্টদের মধ্যে N আকারের ইনপুট সমানভাবে বিভক্ত করে, যা অনেক সেটিংসের একটি বিমূর্তকরণ, যার মধ্যে রয়েছে দীর্ঘ প্রসঙ্গ সংক্ষিপ্তকরণ, মাল্টি-এজেন্ট RAG, ব্রাউজার-শৈলীর এজেন্ট এবং ম্যাপ-রিডিউস পাইপলাইনের মতো ব্যবহারিক প্রয়োগ পরিস্থিতি।
१. তাত্ত্বিক কাঠামো: ট্রান্সফর্মার প্রকাশক্ষমতার সমৃদ্ধ সাহিত্যের উপর ভিত্তি করে মাল্টি-এজেন্ট যুক্তিবিদ্ধতা সিস্টেমের একটি আনুষ্ঠানিকীকরণ প্রস্তাব করে
२. অ্যালগরিদমিক সীমানা: তিনটি ভিন্ন অ্যালগরিদম কাজের পরিবারের জন্য (স্মরণ, অবস্থা ট্র্যাকিং এবং কে-হপ যুক্তিবিদ্ধতা) এজেন্টের সংখ্যা এবং যোগাযোগের চাহিদার সীমানা প্রকাশ করে, এই সম্পদগুলির মধ্যে ট্রেড-অফ তুলে ধরে
३. অভিজ্ঞতামূলক যাচাইকরণ: তাত্ত্বিক দ্বারা দেওয়া সর্বোত্তম যোগাযোগ প্রোটোকল বাস্তবায়ন করে, তাত্ত্বিক অন্তর্দৃষ্টির অভিজ্ঞতামূলক যাচাইকরণ প্রদান করে, যা নির্ভুলতা, যোগাযোগ এবং টোকেন ব্যবহারের ক্ষেত্রে কর্মক্ষমতা তাত্ত্বিক পূর্বাভাসের সাথে ঘনিষ্ঠভাবে সামঞ্জস্যপূর্ণ
४. তিনটি প্রক্রিয়া চিহ্নিতকরণ: মাল্টি-এজেন্ট কাজের তিনটি ভিন্ন প্রক্রিয়া প্রকাশ করে, প্রতিটি প্রাকৃতিক কাজের উদাহরণ দ্বারা তাৎক্ষণিক যা ব্যাপক প্রাসঙ্গিকতা রয়েছে
লেখকরা কার্যকারণ মাস্ক (শুধুমাত্র ডিকোডার) অনন্য হার্ড অ্যাটেনশন ট্রান্সফর্মার (UHAT) অনুমান করেন, যা একটি জনপ্রিয় বিমূর্তকরণ যেখানে অ্যাটেনশন হেড মনোযোগ সর্বাধিক করে এমন অবস্থানে মনোযোগ কেন্দ্রীভূত করে:
UHAT(A)_{i,j} = {1 if j = argmax A_{i,:}, 0 else}
সংজ্ঞা ३.१ (মাল্টি-এজেন্ট সিস্টেম): একটি মাল্টি-এজেন্ট সিস্টেম A স্ট্রিং x ∈ S কে w(x) ≤ |x| এজেন্ট সহ লেবেল করা DAG A(x) এ ম্যাপ করে, যেখানে:
সংজ্ঞা ३.२ (জটিলতা):
কাজ: একাধিক কী-মূল্য জোড়া এবং একটি প্রশ্ন কী দেওয়া হলে, এজেন্টগুলি অবশ্যই সম্পর্কিত মূল্য ফেরত দেবে।
ফলাফল:
কাজ: একটি সীমিত মনোয়েড উপর অবস্থা ট্র্যাকিং সমস্যা, m₀ · m₁ · ... · mₖ মূল্যায়ন হিসাবে আনুষ্ঠানিক।
ফলাফল:
কাজ: N টি তথ্য এবং কে-হপ প্রশ্ন f₁(...(fₖ(x))...) দেওয়া হলে, এজেন্টগুলি পুনরাবৃত্তিমূলক অনুসন্ধান করতে হবে।
ফলাফল:
লেখকরা তাত্ত্বিক পূর্বাভাস যাচাই করতে সিন্থেটিক বেঞ্চমার্ক ব্যবহার করেন: १. সহযোগী স্মরণ: এলোমেলোভাবে উত্পাদিত কী-মূল্য স্ট্রিং, প্রশ্নগুলি কী থেকে সমানভাবে নমুনা করা হয় २. প্যারিটি গণনা: নির্দিষ্ট দৈর্ঘ্যের এলোমেলো বাইনারি স্ট্রিং ३. S5 পার্মুটেশন ট্র্যাকিং: ५ টি বাক্সে ५ টি বলের বিনিময় কমান্ডের ক্রম ४. কে-হপ যুক্তিবিদ্ধতা: সত্য এবং সম্পর্কের তথ্য ভিত্তি, বৈধ কে-হপ প্রশ্ন তৈরি করে
লেখকরা উপসর্গ যোগফল প্রোটোকলের শাখা ফ্যাক্টর পরিবর্তন করে প্যারেটো সীমান্ত গ্রাফ তৈরি করে, গণনা গভীরতা এবং যোগাযোগের মধ্যে ট্রেড-অফ সম্পর্ক যাচাই করে।
१. তিনটি প্রক্রিয়া যাচাইকরণ: পরীক্ষা তাত্ত্বিক পূর্বাভাসের তিনটি ভিন্ন প্রক্রিয়া নিশ্চিত করে २. যোগাযোগ-গভীরতা ট্রেড-অফ: অভিজ্ঞতামূলক ফলাফল তাত্ত্বিক প্রাপ্ত ট্রেড-অফ সম্পর্ক সমর্থন করে ३. মডেল নির্দেশ অনুসরণ: উচ্চ যোগাযোগ প্রক্রিয়ায়, মডেল ধ্রুবক টোকেন ওভারহেড বৃদ্ধি করে, যা তাত্ত্বিক বিশ্লেষণে বিবেচনা করা প্রয়োজন
१. চেইন-অফ-থট যুক্তিবিদ্ধতা: Wei et al. (२०२२) এবং অন্যদের দ্বারা প্রতিষ্ঠিত ধাপে ধাপে যুক্তিবিদ্ধতা মান २. মাল্টি-এজেন্ট সহযোগিতা: Zhang et al. (२०२४b), Tran et al. (२०२५) এবং অন্যদের কাজ বিভাজন পদ্ধতি ३. ট্রান্সফর্মার প্রকাশক্ষমতা: Merrill & Sabharwal (२०२३), Amiri et al. (२०२५) এবং অন্যদের তাত্ত্বিক বিশ্লেষণ
१. তিনটি প্রক্রিয়া চিহ্নিতকরণ: মাল্টি-এজেন্ট যুক্তিবিদ্ধতার তিনটি ভিন্ন প্রক্রিয়া প্রকাশ করে, প্রতিটির নির্দিষ্ট গভীরতা-যোগাযোগ ট্রেড-অফ বৈশিষ্ট্য রয়েছে २. তাত্ত্বিক সীমানা: এজেন্টের সংখ্যা, যোগাযোগের চাহিদা এবং গণনা গভীরতার জন্য কঠোর গাণিতিক সীমানা প্রদান করে ३. ব্যবহারিক নির্দেশনা: স্কেলেবল মাল্টি-এজেন্ট যুক্তিবিদ্ধতা সিস্টেম ডিজাইনের জন্য নীতিগত নির্দেশনা প্রদান করে
१. কাজের পরিসীমা: শুধুমাত্র তিনটি অ্যালগরিদম পরিবার বিশ্লেষণ করে, সমস্ত ব্যবহারিক যুক্তিবিদ্ধতা কাজ কভার করতে পারে না २. মডেল অনুমান: UHAT এর উপর ভিত্তি করে বিশ্লেষণ প্রকৃত softmax ট্রান্সফর্মারের সম্পূর্ণভাবে প্রযোজ্য নাও হতে পারে ३. যোগাযোগ সীমাবদ্ধতা: অনুমান করে যে প্রতিবার শুধুমাত্র একটি টোকেন পাঠানো যায়, প্রকৃত সিস্টেম আরও জটিল যোগাযোগ প্যাটার্ন সমর্থন করতে পারে
१. সম্প্রসারিত কাজ: গ্রাফ পৌঁছানোর মতো অন্যান্য অ্যালগরিদমিক কাজে কাঠামো প্রয়োগ করা २. মাল্টি-এজেন্ট প্যারাডাইম: প্রতিদ্বন্দ্বী খেলা বা সহযোগী শক্তিশালী শেখার কাজে সম্প্রসারণ ३. ব্যবহারিক প্রোটোকল ডিজাইন: তাত্ত্বিক অন্তর্দৃষ্টির উপর ভিত্তি করে নতুন মাল্টি-এজেন্ট সিস্টেম ডিজাইন করা
१. তাত্ত্বিক কঠোরতা: সম্পূর্ণ গাণিতিক প্রমাণ এবং কঠোর সীমানা বিশ্লেষণ প্রদান করে २. পর্যাপ্ত অভিজ্ঞতামূলক যাচাইকরণ: তাত্ত্বিক পূর্বাভাস পরীক্ষামূলক ফলাফলের সাথে উচ্চ সামঞ্জস্য ३. উচ্চ ব্যবহারিক মূল্য: মাল্টি-এজেন্ট সিস্টেম ডিজাইনের জন্য নির্দিষ্ট নির্দেশনা প্রদান করে ४. স্পষ্ট লেখা: জটিল তাত্ত্বিক বিষয়বস্তু স্পষ্টভাবে প্রকাশ করা হয়, গ্রাফ বোঝার প্রভাব ভালো
१. কাজের সীমাবদ্ধতা: তিনটি অ্যালগরিদম পরিবার সমস্ত গুরুত্বপূর্ণ যুক্তিবিদ্ধতা পরিস্থিতি কভার করতে যথেষ্ট নাও হতে পারে २. ব্যবহারিক প্রয়োগ ফাঁক: সিন্থেটিক কাজ এবং প্রকৃত NLP কাজের মধ্যে পার্থক্য বিদ্যমান ३. মডেল সরলীকরণ: UHAT মডেল তাত্ত্বিকভাবে যুক্তিসঙ্গত হলেও প্রকৃত মডেলের সাথে এখনও পার্থক্য রয়েছে
१. তাত্ত্বিক অবদান: মাল্টি-এজেন্ট যুক্তিবিদ্ধতা সিস্টেমের জন্য প্রথম সিস্টেমেটিক তাত্ত্বিক কাঠামো প্রদান করে २. ব্যবহারিক মূল্য: প্রকৃত সিস্টেম ডিজাইন নির্দেশনা, বিশেষত দীর্ঘ প্রসঙ্গ প্রক্রিয়াকরণে ३. পুনরুৎপাদনযোগ্যতা: সম্পূর্ণ কোড এবং পরীক্ষামূলক সেটআপ প্রদান করে
१. দীর্ঘ নথি প্রক্রিয়াকরণ: নথি সংক্ষিপ্তকরণ, প্রশ্ন-উত্তর সিস্টেম २. জ্ঞান গ্রাফ যুক্তিবিদ্ধতা: মাল্টি-হপ সম্পর্ক প্রশ্ন ३. জটিল গণনা কাজ: বিভাজন প্রয়োজন এমন বড় আকারের যুক্তিবিদ্ধতা সমস্যা
१. Wei, J. et al. (२०२२). Chain-of-thought prompting elicits reasoning in large language models. NeurIPS. २. Zhang, Y. et al. (२०२४b). Chain of agents: Large language models collaborating on long-context tasks. NeurIPS. ३. Merrill, W. & Sabharwal, A. (२०२३). The expressive power of transformers with chain of thought. arXiv preprint. ४. Amiri, A. et al. (२०२५). Lower bounds for chain-of-thought reasoning in hard-attention transformers. ICML.
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ মানের তাত্ত্বিক এবং অভিজ্ঞতামূলক সমন্বিত পেপার যা মাল্টি-এজেন্ট যুক্তিবিদ্ধতা সিস্টেমের জন্য গুরুত্বপূর্ণ তাত্ত্বিক ভিত্তি প্রদান করে। যদিও কাজের কভারেজ এবং ব্যবহারিক প্রয়োগের ক্ষেত্রে উন্নতির অবকাশ রয়েছে, তবে এর কঠোর তাত্ত্বিক বিশ্লেষণ এবং স্পষ্ট ব্যবহারিক নির্দেশনা এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ অবদান করে তোলে।