এই পেপারটি অপারেন্ড কোয়ান্ট উপস্থাপন করে, যা একটি আইডিই-ভিত্তিক একক-এজেন্ট স্বায়ত্তশাসিত মেশিন লার্নিং ইঞ্জিনিয়ারিং আর্কিটেকচার। ঐতিহ্যবাহী বহু-এজেন্ট অর্কেস্ট্রেশন ফ্রেমওয়ার্কের বিপরীতে, অপারেন্ড কোয়ান্ট মেশিন লার্নিং ইঞ্জিনিয়ারিং জীবনচক্রের সমস্ত পর্যায় — অন্বেষণ, মডেলিং, পরীক্ষা এবং স্থাপনা — একটি একক প্রসঙ্গ-সচেতন এজেন্টে একীভূত করে। এমএলই-বেঞ্চমার্ক (২০২৫)-এ, অপারেন্ড কোয়ান্ট নতুন অত্যাধুনিক ফলাফল অর্জন করেছে, ৭৫টি সমস্যায় ০.৩৯৫৬ ± ০.০৫৬৫ এর সামগ্রিক পদক হার সহ, যা এখন পর্যন্ত মূল্যায়িত সমস্ত সিস্টেমে রেকর্ড করা সর্বোচ্চ কর্মক্ষমতা।
মেশিন লার্নিং ইঞ্জিনিয়ারিং (এমএলই) পাইপলাইনের স্বয়ংক্রিয়করণ এজেন্ট এআই গবেষণার একটি মূল লক্ষ্য হয়ে উঠেছে। বিদ্যমান সিস্টেমগুলি প্রধানত বহু-এজেন্ট অর্কেস্ট্রেশনের উপর নির্ভর করে, যেখানে বিশেষায়িত এজেন্টগুলি ডেটা বিশ্লেষণ, মডেলিং, মূল্যায়ন এবং স্থাপনার মতো কাজগুলি স্বাধীনভাবে পরিচালনা করে।
১. সমন্বয় খরচ বেশি: বহু-এজেন্ট ফ্রেমওয়ার্ক কাজকে সমান্তরালকরণ করতে পারে, কিন্তু প্রায়শই সমন্বয় খরচ তৈরি করে २. প্রসঙ্গ খণ্ডিতকরণ: এজেন্টদের মধ্যে প্রসঙ্গ স্থানান্তর তথ্য হ্রাসের দিকে পরিচালিত করে ३. সিঙ্ক্রোনাইজেশন ত্রুটি: বিতরণকৃত সিস্টেমে সিঙ্ক্রোনাইজেশন সমস্যা সামগ্রিক কর্মক্ষমতা প্রভাবিত করে ४. অবস্থা অসামঞ্জস্য: একাধিক এজেন্ট বিভিন্ন অবস্থার দৃশ্য বজায় রাখে
অপারেন্ড কোয়ান্ট একটি বিকল্প প্যারাডাইম অন্বেষণ করে: একটি একক স্বায়ত্তশাসিত এজেন্ট তার একীভূত উন্নয়ন পরিবেশ (আইডিই) এর মধ্যে ক্রমাগত পর্যবেক্ষণ, পরিকল্পনা, সম্পাদনা, সম্পাদন এবং মূল্যায়ন করে। এই ডিজাইন অনুমান বিশ্বাস করে যে প্রান্ত-থেকে-প্রান্ত প্রসঙ্গ ধারাবাহিকতা বিতরণকৃত অর্কেস্ট্রেশন ছাড়াই নির্ভরযোগ্য এবং দক্ষ কর্মক্ষমতা তৈরি করতে পারে।
१. একক-এজেন্ট এমএলই আর্কিটেকচার প্রস্তাব: প্রথমবারের মতো সিস্টেমেটিকভাবে প্রমাণ করা হয়েছে যে একক-এজেন্ট এমএলই কাজে বহু-এজেন্ট সিস্টেমকে অতিক্রম করতে পারে २. অ-ব্লকিং সম্পাদন প্রক্রিয়া ডিজাইন: অ্যাসিঙ্ক্রোনাস নোটবুক এবং স্ক্রিপ্ট সম্পাদন সমর্থন করে সমসাময়িক প্রক্রিয়াকরণ ক্ষমতা বাস্তবায়ন করা হয়েছে ३. গভীর চিন্তাভাবনা একীকরণ প্রবর্তন: দীর্ঘ অনুমান সেশনে প্রসঙ্গ পক্ষপাত প্রশমিত করতে বহু-মডেল একীকরণের মাধ্যমে ४. এসওটিএ কর্মক্ষমতা অর্জন: এমএলই-বেঞ্চমার্ক ২০२५-এ নতুন সর্বোচ্চ রেকর্ড তৈরি করা হয়েছে (३९.५६% পদক হার) ५. সম্পূর্ণ পুনরুৎপাদনযোগ্যতা প্রদান: সমস্ত পরীক্ষামূলক লগ, কোড এবং মূল্যায়ন উপকরণ প্রকাশ করা হয়েছে
ইনপুট: মেশিন লার্নিং সমস্যার বর্ণনা এবং ডেটাসেট আউটপুট: সম্পূর্ণ এমএল সমাধান, যার মধ্যে রয়েছে ডেটা বিশ্লেষণ, মডেল প্রশিক্ষণ, মূল্যায়ন এবং চূড়ান্ত পূর্বাভাস সীমাবদ্ধতা: २४ ঘন্টা সম্পাদন সময়, কোনো নেটওয়ার্ক অ্যাক্সেস নেই, মানক হার্ডওয়্যার পরিবেশ
প্রতিটি অনুমান চক্র নিম্নলিখিত পদক্ষেপ অন্তর্ভুক্ত করে: १. পর্যবেক্ষণ: বর্তমান আইডিই অবস্থা পান (খোলা ফাইল, কার্নেল অবস্থা, সক্রিয় প্রক্রিয়া এবং আউটপুট) २. সিদ্ধান্ত: যাচাইকরণ প্যাটার্নের সাথে সামঞ্জস্যপূর্ণ কাঠামোগত জেএসওএন কমান্ড তৈরি করুন ३. সম্পাদন: নির্দিষ্ট অপারেশন অ্যাসিঙ্ক্রোনভাবে যাচাই এবং সম্পাদন করুন ४. স্থায়িত্ব: ফলাফলগুলি ডিস্কে সংরক্ষণ করুন এবং ইতিহাসে একীভূত করুন ५. সংকোচন: প্রসঙ্গ দৈর্ঘ্যের সীমার কাছাকাছি থাকলে সংকোচন ট্রিগার করুন
if primary_notebook and primary_notebook.is_cell_executing():
continue_result = primary_notebook.continue_execution_if_running()
if continue_result["status"] == "completed":
final_output = continue_result.get("output", "[No Output]")
elif continue_result["status"] == "still_executing":
current_output = continue_result["current_output"]
duration = continue_result["execution_duration_seconds"]
এটি এজেন্টকে প্রশিক্ষণ চলার সময় সম্পাদনা, পরিকল্পনা বা আউটপুট বিশ্লেষণ চালিয়ে যেতে সক্ষম করে।
সম্পাদন নিম্নলিখিত ক্ষেত্রে বাধাগ্রস্ত হয়:
একটি স্তরযুক্ত মেমরি সংকোচন কৌশল ব্যবহার করা হয়: १. দীর্ঘ নোটবুক সামগ্রী বাদ দিন २. পুরানো রাউন্ড সংক্ষিপ্ত করতে নিবেদিত সরঞ্জাম ব্যবহার করুন ३. সংক্ষিপ্তকরণের নির্ভুলতা যাচাই করুন ४. সফল যাচাইয়ের পরে মূল ইতিহাস প্রতিস্থাপন করুন
বড় ভাষার মডেলগুলি প্রসঙ্গ পক্ষপাত প্রদর্শন করে, অর্থাৎ প্রম্পট দৈর্ঘ্য বৃদ্ধির সাথে সাথে অনুমান নমনীয়তা হ্রাস পায়। দীর্ঘ অনুমান সেশনে, মডেল সুরঙ্গ দৃষ্টি তৈরি করতে পারে, ডিবাগিং বা পূর্ববর্তী অনুমানগুলি পুনর্মূল্যায়ন করার ক্ষমতা হ্রাস করে।
যখন এজেন্ট একটি অনুমান বাধার সম্মুখীন হয়, সমস্যাটি উচ্চ-ক্ষমতা মডেল একীকরণে অর্পণ করা হয়:
এই মডেলগুলি স্বাধীনভাবে বিশ্লেষণ বা অনুমান তৈরি করে, তারপরে আউটপুটগুলি একটি একীভূত "বিশেষজ্ঞ পর্যালোচনা" তে সংশ্লেষিত করা হয়, যা পরামর্শ ইনপুট হিসাবে এজেন্টের অনুমান প্রসঙ্গে পুনরায় প্রবর্তিত হয়।
এমএলই-বেঞ্চমার্ক २०२५: ७५টি মেশিন লার্নিং সমস্যা অন্তর্ভুক্ত করে, তিনটি কঠিনতা স্তরে বিভক্ত:
পদক হার (মেডেল রেট): সমস্যা সফলভাবে সমাধান করা এবং পদক অর্জনের অনুপাত, প্রধান মূল্যায়ন মেট্রিক হিসাবে
এমএলই-বেঞ্চমার্ক २०२५ গভর্নেন্স প্রয়োজনীয়তা কঠোরভাবে মেনে চলা হয়:
submit_final_answer এন্ডপয়েন্টের মাধ্যমে মানক জমা দেওয়া| সাবসেট | পদক হার (গড় ± মান বিচ্যুতি) | সমস্যা সংখ্যা |
|---|---|---|
| সামগ্রিক | ०.३९५६ ± ०.०५६५ | ७५ |
| লাইট | ०.६३६४ ± ०.१०५० | २२ |
| মাঝারি | ०.३३३३ ± ०.०७६५ | ३८ |
| কঠিন | ०.२००० ± ०.१०६९ | १५ |
| এজেন্ট | লাইট | মধ্য | কঠিন | সব | ঘন্টা | তারিখ |
|---|---|---|---|---|---|---|
| অপারেন্ড কোয়ান্ট | ६३.६४ | ३३.३३ | २०.०० | ३९.५६ | २४ | ०९-२८ |
| ইন্টার্নএজেন্ট (ডিপসিক-আর१) | ६२.१२ | २६.३२ | २४.४४ | ३६.४४ | १२ | ०९-१२ |
| আর অ্যান্ড ডি-এজেন্ট (জিপিটি-५) | ६८.१८ | २१.०५ | २२.२२ | ३५.११ | १२ | ०९-२६ |
| নিও মাল্টি-এজেন্ট | ४८.४८ | २९.८२ | २४.४४ | ३४.२२ | ३६ | ०७-२८ |
| আর অ্যান্ড ডি-এজেন্ট (ও३ + জিপিটি-४.१) | ५१.५२ | १९.३० | २६.६७ | ३०.२२ | २४ | ०८-१५ |
নিম্নলিখিত কাজগুলি ডেটা বা পরিবেশগত সমস্যার কারণে ব্যর্থ হয়েছে, সমস্ত বীজে "কোনো পদক" হিসাবে রিপোর্ট করা হয়েছে:
একটি বহিরাগত মূল্য — মাল্টি-মোডাল জেসচার স্বীকৃতি — একটি অবৈধ নিখুঁত স্কোর সৃষ্টি করে এমন ডেটাসেট ফাঁস ত্রুটি সনাক্ত করার কারণে বাদ দেওয়া হয়েছে।
१. একক-এজেন্ট সুবিধা: একীভূত প্রসঙ্গ অনুমান এবং নির্ধারক অবস্থা স্থায়িত্ব বিতরণকৃত সমন্বয়ের উপর নির্ভর না করে প্রতিযোগিতামূলক কর্মক্ষমতা অর্জনের জন্য যথেষ্ট २. অ-ব্লকিং সম্পাদন কার্যকারিতা: সমসাময়িক প্রক্রিয়াকরণ ক্ষমতা সম্পদ ব্যবহারের দক্ষতা উল্লেখযোগ্যভাবে উন্নত করে ३. গভীর চিন্তাভাবনা একীকরণ মূল্য: বহু-মডেল একীকরণ দীর্ঘ অনুমান সেশনে প্রসঙ্গ পক্ষপাত কার্যকরভাবে প্রশমিত করে
অপারেন্ড কোয়ান্ট স্বায়ত্তশাসিত মেশিন লার্নিং ইঞ্জিনিয়ারিং ক্ষেত্রে নতুন অত্যাধুনিক স্তর স্থাপন করেছে। ০.३९५६ ± ०.०५६५ এর মোট স্কোর এটিকে এমএলই-বেঞ্চমার্ক २०२५ লিডারবোর্ডে প্রথম স্থানে রাখে, একই গভর্নেন্স শর্তে একক-এজেন্ট এবং বহু-এজেন্ট বেসলাইনকে অতিক্রম করে। স্বায়ত্তশাসিত এমএলই সিস্টেমগুলি ক্রমাগত অনুমান, সমসাময়িক সম্পাদন এবং কাঠামোগত প্রসঙ্গ ব্যবস্থাপনার উপর ভিত্তি করে একটি একীভূত একক-এজেন্ট আর্কিটেকচার ব্যবহার করে নেতৃস্থানীয় কর্মক্ষমতা অর্জন করতে পারে তা সফলভাবে প্রমাণ করেছে।
१. প্রসঙ্গ অবক্ষয়: সংকোচন প্রক্রিয়া থাকা সত্ত্বেও, দীর্ঘ সময়ের অনুমান এখনও প্রসঙ্গ গুণমান হ্রাসের দিকে পরিচালিত করতে পারে २. অভিব্যক্তি ক্ষমতা সীমাবদ্ধতা: প্রতি রাউন্ড একক-সরঞ্জাম নিয়ম জটিল অপারেশনের অভিব্যক্তি সীমাবদ্ধ করে ३. গণনা খরচ বেশি: २४ ঘন্টা চলা উচ্চ গণনা খরচ নিয়ে আসে ४. ত্রুটি সহনশীলতা অপর্যাপ্ত: পরিবেশ বা কার্নেল ত্রুটির প্রতি ত্রুটি সহনশীলতা সীমিত
१. অভিযোজিত একীকরণ অনুমান: একীকরণ কৌশল গতিশীলভাবে সামঞ্জস্য করুন २. গতিশীল সংকোচন: আরও বুদ্ধিমান প্রসঙ্গ ব্যবস্থাপনা ३. ত্রুটি-সহনশীল সম্পাদন: সিস্টেম শক্তিশালীতা বৃদ্ধি করুন
१. আর্কিটেকচার উদ্ভাবন শক্তিশালী: প্রথমবারের মতো সিস্টেমেটিকভাবে এমএলই কাজে একক-এজেন্টের সুবিধা প্রমাণ করা হয়েছে, বহু-এজেন্ট প্যারাডাইমের আধিপত্যকে চ্যালেঞ্জ করে २. প্রযুক্তিগত ডিজাইন চতুর: অ-ব্লকিং সম্পাদন, গভীর চিন্তাভাবনা একীকরণ এবং অন্যান্য প্রক্রিয়া যুক্তিসঙ্গতভাবে ডিজাইন করা হয়েছে, ব্যবহারিক সমস্যাগুলি কার্যকরভাবে সমাধান করে ३. পরীক্ষা যথেষ্ট কঠোর: বেঞ্চমার্ক প্রোটোকল কঠোরভাবে মেনে চলা হয়েছে, ফলাফল শক্তিশালী প্ররোচনামূলক শক্তি রয়েছে ४. পুনরুৎপাদনযোগ্যতা চমৎকার: সম্পূর্ণ লগ, কোড এবং মূল্যায়ন উপকরণ প্রদান করা হয়েছে ५. কর্মক্ষমতা উন্নতি উল্লেখযোগ্য: মানক বেঞ্চমার্কে স্পষ্ট এসওটিএ ফলাফল অর্জন করা হয়েছে
१. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: কেন একক-এজেন্ট বহু-এজেন্টের চেয়ে ভাল তার গভীর তাত্ত্বিক বিশ্লেষণ অনুপস্থিত २. সাধারণীকরণ ক্ষমতা অজানা: শুধুমাত্র এমএলই-বেঞ্চমার্কে মূল্যায়ন করা হয়েছে, অন্যান্য ক্ষেত্রে কর্মক্ষমতা অজানা ३. গণনা দক্ষতা সমস্যা: २४ ঘন্টা চলার সময় কিছু বেসলাইন পদ্ধতির তুলনায় দীর্ঘ, দক্ষতা উন্নতির প্রয়োজন ४. ত্রুটি পরিচালনা প্রক্রিয়া: সিস্টেম ব্যর্থতার জন্য পরিচালনা কৌশল তুলনামূলকভাবে সহজ ५. একীকরণ প্রক্রিয়া নির্ভরতা: গভীর চিন্তাভাবনা একীকরণ একাধিক বড় মডেলের উপর নির্ভর করে, সিস্টেম জটিলতা বৃদ্ধি করে
१. একাডেমিক অবদান: এজেন্ট আর্কিটেকচার ডিজাইনের জন্য নতুন চিন্তাভাবনা প্রদান করে, ভবিষ্যত গবেষণা দিকনির্দেশনা প্রভাবিত করতে পারে २. ব্যবহারিক মূল্য: স্বয়ংক্রিয় মেশিন লার্নিং ইঞ্জিনিয়ারিংয়ে সরাসরি প্রয়োগ মূল্য রয়েছে ३. পদ্ধতিগত তাৎপর্য: নির্দিষ্ট কাজে সরলীকৃত আর্কিটেকচার জটিল অর্কেস্ট্রেশনের চেয়ে আরও কার্যকর হতে পারে তা প্রমাণ করে
१. স্বয়ংক্রিয় এমএল ইঞ্জিনিয়ারিং: এন্ড-টু-এন্ড এমএল সমাধানের প্রয়োজন এমন পরিস্থিতির জন্য উপযুক্ত २. গবেষণা পরীক্ষা: দ্রুত প্রোটোটাইপিং এবং পরীক্ষার জন্য ব্যবহার করা যেতে পারে ३. শিক্ষা প্রশিক্ষণ: এমএল ইঞ্জিনিয়ারিং স্বয়ংক্রিয়করণের রেফারেন্স বাস্তবায়ন হিসাবে ४. সীমাবদ্ধ পরিবেশ: নেটওয়ার্ক অ্যাক্সেস ছাড়াই অফলাইন পরিবেশের জন্য উপযুক্ত
পেপারটি সম্পর্কিত ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে এমএলই-বেঞ্চমার্ক বেঞ্চমার্ক পরীক্ষা, অটোএমএল-জিপিটি সিরিজ, এসডাব্লিউই-এজেন্ট, বিভিন্ন এজেন্ট ফ্রেমওয়ার্ক ইত্যাদি, যা গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি এবং তুলনামূলক বেসলাইন প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি স্বায়ত্তশাসিত মেশিন লার্নিং ইঞ্জিনিয়ারিং ক্ষেত্রে গুরুত্বপূর্ণ অবদান সহ একটি পেপার। চতুর একক-এজেন্ট আর্কিটেকচার ডিজাইন এবং কঠোর পরীক্ষামূলক যাচাইয়ের মাধ্যমে, এটি বহু-এজেন্ট প্যারাডাইমের আধিপত্যকে সফলভাবে চ্যালেঞ্জ করেছে, এই ক্ষেত্রের উন্নয়নের জন্য নতুন চিন্তাভাবনা এবং দিকনির্দেশনা প্রদান করেছে। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এর প্রযুক্তিগত উদ্ভাবন এবং কর্মক্ষমতা উন্নতি এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ মাইলফলক করে তোলে।