বৃহৎ ভাষা মডেল (এলএলএম)-এর আবির্ভাব একটি নতুন ধরনের ওয়েব সার্চ তৈরি করেছে: জেনারেটিভ সার্চ, যেখানে এলএলএম-গুলি প্রশ্নের সাথে সম্পর্কিত ওয়েবপেজ পুনরুদ্ধার করে এবং একটি একক, সুসংগত পাঠ্য প্রতিক্রিয়া হিসাবে তৈরি করে। এই আউটপুট মোড ঐতিহ্যবাহী ওয়েব সার্চের সাথে তীব্র বৈপরীত্য তৈরি করে, যা স্বাধীন ওয়েবপেজের র্যাঙ্কিং তালিকা প্রদান করে। এই পেপারটি জেনারেটিভ সার্চ আউটপুট এবং ঐতিহ্যবাহী ওয়েব সার্চের মধ্যে কোন মাত্রায় পার্থক্য বিদ্যমান তা অন্বেষণ করে। গবেষণা গুগলের ঐতিহ্যবাহী সার্চ ইঞ্জিন এবং গুগল ও ওপেনএআই-এর চারটি জেনারেটিভ সার্চ ইঞ্জিনের তুলনা করে, চারটি ডোমেন জুড়ে প্রশ্নগুলি কভার করে। বিশ্লেষণ উল্লেখযোগ্য পার্থক্য প্রকাশ করে: বেশিরভাগ জেনারেটিভ সার্চ ইঞ্জিন ঐতিহ্যবাহী ওয়েব সার্চের চেয়ে বিস্তৃত তথ্য উৎস কভার করে; জেনারেটিভ সার্চ ইঞ্জিনগুলি মডেল প্যারামিটারের অভ্যন্তরীণ জ্ঞান এবং নেটওয়ার্ক থেকে পুনরুদ্ধারকৃত বাহ্যিক জ্ঞানের উপর নির্ভরতায় পার্থক্য প্রদর্শন করে; জেনারেটিভ সার্চ ইঞ্জিনগুলি বিভিন্ন ধারণা সেট উপস্থাপন করে, যা সার্চ বৈচিত্র্য এবং আকস্মিক আবিষ্কার বৃদ্ধির জন্য নতুন সুযোগ তৈরি করে।
জেনারেটিভ এআই-এর উত্থানের সাথে সাথে ওয়েব সার্চ বৃহৎ ভাষা মডেলের উপর আরও বেশি নির্ভরশীল দিকে বিকশিত হচ্ছে। ঐতিহ্যবাহী সার্চ ইঞ্জিনগুলি প্রায় ১০টি সার্চ ফলাফলের র্যাঙ্কিং তালিকা প্রদান করে, যখন জেনারেটিভ সার্চ সিস্টেমগুলি এলএলএম চ্যাটবটের মাধ্যমে প্রাকৃতিক ভাষার উত্তর প্রদান করে। এই প্যারাডাইম পরিবর্তন তিনটি মূল পার্থক্য নিয়ে আসে:
১. আউটপুট ফরম্যাটের পার্থক্য: ঐতিহ্যবাহী সার্চ স্বাধীন ওয়েবপেজ প্রদান করে, জেনারেটিভ সার্চ একটি একক সুসংগত পাঠ্য ব্লক গঠন করে २. বিস্তৃত কভারেজ: জেনারেটিভ সার্চ ১০টিরও বেশি উৎস থেকে বিষয়বস্তু সংহত করতে পারে ३. মিশ্র জ্ঞান উৎস: বাহ্যিক পুনরুদ্ধার তথ্য এবং এলএলএম অভ্যন্তরীণ জ্ঞান একত্রিত করে
এই পার্থক্যগুলি বোঝা সার্চ গুণমান, তথ্য বৈচিত্র্য এবং ব্যবহারকারীর অভিজ্ঞতা মূল্যায়নের জন্য গুরুত্বপূর্ণ। বিদ্যমান সার্চ মূল্যায়ন মেট্রিক্স প্রধানত র্যাঙ্কিং তালিকার জন্য ডিজাইন করা হয়েছে এবং জেনারেটিভ সার্চের সমন্বিত আউটপুটে সরাসরি প্রয়োগ করা যায় না।
१. প্রথম পদ্ধতিগত তুলনা: ঐতিহ্যবাহী সার্চ এবং জেনারেটিভ সার্চের ব্যাপক উৎস বিশ্লেষণ এবং বিষয়বস্তু বিশ্লেষণ २. বহুমাত্রিক বিশ্লেষণ কাঠামো: তথ্য উৎস বৈচিত্র্য, অভ্যন্তরীণ-বাহ্যিক জ্ঞান নির্ভরতা, ধারণা কভারেজ তিনটি মাত্রা থেকে সার্চ সিস্টেম মূল্যায়ন ३. বৃহৎ-স্কেল অভিজ্ঞতামূলক গবেষণা: ৬টি ডেটাসেট, ৪,৬০६টি প্রশ্ন জুড়ে ব্যাপক পরীক্ষা ४. সময়োপযোগীতা বিশ্লেষণ: বিভিন্ন সার্চ সিস্টেমের সময়-সংবেদনশীল প্রশ্ন পরিচালনার ক্ষমতা মূল্যায়ন ५. মূল্যায়ন পদ্ধতি উদ্ভাবন: জেনারেটিভ সার্চের জন্য প্রযোজ্য নতুন মূল্যায়ন মান এবং পদ্ধতি প্রস্তাব
এই গবেষণা তিনটি মূল গবেষণা প্রশ্নের উত্তর দেওয়ার লক্ষ্য রাখে:
१. তথ্য উৎস বিশ্লেষণ:
२. বিষয়বস্তু বিশ্লেষণ:
१. ধারণা প্রবর্তন পদ্ধতি: ধারণা আবিষ্কার এবং শ্রেণীবিভাগের জন্য এলএলওওএম (এলএলএম-চালিত বিষয় অনুমান কাঠামো) গ্রহণ २. বহু-স্তরীয় ওভারল্যাপ বিশ্লেষণ: ইউআরএল স্তর থেকে ডোমেইন স্তর পর্যন্ত ওভারল্যাপ ডিগ্রি গণনা ३. সময় মাত্রা মূল্যায়ন: ট্রেন্ড প্রশ্ন এবং সময় স্থিতিশীলতা বিশ্লেষণের মাধ্যমে সময়োপযোগীতা মূল্যায়ন ४. ক্রস-ভৌগোলিক যাচাইকরণ: মার্কিন যুক্তরাষ্ট্র এবং জার্মানি দুটি ভৌগোলিক অবস্থানে পরীক্ষা পরিচালনা
গবেষণা ৬টি ডেটাসেট ব্যবহার করে, মোট ৪,६०६টি প্রশ্ন:
१. এমএস মার্কো (১,०००টি প্রশ্ন): প্রকৃত বিং সার্চ প্রশ্ন থেকে খোলা ডোমেইন পুনরুদ্ধার ডেটাসেট २. ওয়াইল্ডচ্যাট (१,७५०টি প্রশ্ন): চ্যাটজিপিটি ব্যবহারকারী ইন্টারঅ্যাকশন থেকে ফিল্টার করা তথ্য-সন্ধান প্রশ্ন ३. অলসাইডস (३३२টি প্রশ্ন): রাজনৈতিক বিষয়ের উপর ভিত্তি করে তৈরি প্রশ্ন ४. নিয়ন্ত্রক পদক্ষেপ (६४९টি প্রশ্ন): ট্রাম্প প্রশাসনের প্রশাসনিক আদেশ সম্পর্কে সময়োপযোগী প্রশ্ন ५. বিজ্ঞান প্রশ্ন (४५३টি প্রশ্ন): এসিএম কম্পিউটিং শ্রেণীবিভাগ সিস্টেমের উপর ভিত্তি করে বৈজ্ঞানিক বিষয় প্রশ্ন ६. পণ্য (४२२টি প্রশ্ন): २०२३ সালের সবচেয়ে জনপ্রিয় অ্যামাজন পণ্যের উপর ভিত্তি করে কেনাকাটার প্রশ্ন
१. তথ্য উৎস মেট্রিক্স:
२. বিষয়বস্তু মেট্রিক্স:
३. সময়োপযোগীতা মেট্রিক্স:
१. বাহ্যিক জ্ঞান নির্ভরতা পার্থক্য:
२. তথ্য উৎস জনপ্রিয়তা:
३. তথ্য উৎস ওভারল্যাপ হার কম:
१. প্রতিক্রিয়া দৈর্ঘ্য পার্থক্য:
२. ধারণা কভারেজ অনুরূপ:
३. অস্পষ্ট প্রশ্ন প্রক্রিয়াকরণ:
१. ট্রেন্ড প্রশ্ন প্রক্রিয়াকরণ:
२. সময় স্থিতিশীলতা:
জিপিটি মডেলের বিভিন্ন সার্চ প্রসঙ্গ আকার (কম/মধ্যম/উচ্চ) এর প্রভাব অধ্যয়ন করা হয়েছে:
१. তথ্য উৎস বৈচিত্র্য: জেনারেটিভ সার্চ ইঞ্জিনগুলি বিস্তৃত তথ্য উৎস অ্যাক্সেস করে, কিন্তু অগত্যা ধারণা কভারেজ বৃদ্ধি করে না २. অভ্যন্তরীণ-বাহ্যিক জ্ঞান ভারসাম্য: বিভিন্ন জেনারেটিভ সার্চ ইঞ্জিন অভ্যন্তরীণ বনাম বাহ্যিক জ্ঞানের উপর নির্ভরতায় বিশাল পার্থক্য প্রদর্শন করে ३. ধারণা কভারেজ সমতুল্য: তথ্য উৎস পার্থক্য সত্ত্বেও, সামগ্রিক ধারণা কভারেজ ঐতিহ্যবাহী সার্চের অনুরূপ ४. অস্পষ্ট প্রশ্ন চ্যালেঞ্জ: ঐতিহ্যবাহী সার্চ অস্পষ্ট প্রশ্ন পরিচালনায় এখনও সুবিধা রাখে ५. সময়োপযোগীতা পার্থক্য: অভ্যন্তরীণ জ্ঞানের উপর নির্ভরশীল মডেলগুলি সময়োপযোগী প্রশ্নে দুর্বল পারফরম্যান্স করে
१. প্রশ্ন পরিসীমা সীমাবদ্ধতা: নির্বাচিত প্রশ্ন কর্মভার শুধুমাত্র কভার করে, বহু-পালা সংলাপ সার্চ বিবেচনা করে না २. ভাষা এবং ভৌগোলিক সীমাবদ্ধতা: শুধুমাত্র ইংরেজি প্রশ্ন ব্যবহার করে, শুধুমাত্র দুটি দেশে পরীক্ষা করা হয়েছে ३. বিষয়বস্তু বিশ্লেষণ গভীরতা: শুধুমাত্র শীর্ষ १० ঐতিহ্যবাহী সার্চ ফলাফল বিশ্লেষণ করে, ব্যবহারকারীরা খুব কমই লিংক ক্লিক করে এই অনুমান ४. সময় উইন্ডো সীমাবদ্ধতা: মূল্যায়ন সময় উইন্ডো সীমিত, দীর্ঘমেয়াদী অনুদৈর্ঘ্য গবেষণার প্রয়োজন ५. আউটপুট নির্ধারণ: প্রতিটি প্রশ্নের জন্য শুধুমাত্র একটি আউটপুট ব্যবহার করা হয়, আউটপুট পরিবর্তনশীলতা পরিমাপ করা হয়নি
१. নতুন মূল্যায়ন পদ্ধতি: তথ্য উৎস বৈচিত্র্য, ধারণা কভারেজ এবং সমন্বিত আচরণ বিবেচনা করে এমন মূল্যায়ন পদ্ধতি বিকাশ করুন २. বহুভাষিক সম্প্রসারণ: বহুভাষিক প্রশ্ন এবং বহু-পালা ইন্টারঅ্যাকশনে সম্প্রসারণ করুন ३. গভীর বিষয়বস্তু বিশ্লেষণ: সারসংক্ষেপ বিশ্লেষণ এবং সম্পূর্ণ পৃষ্ঠা বিষয়বস্তু মূল্যায়নের তুলনা করুন ४. অনুদৈর্ঘ্য গবেষণা: মডেল আপডেট এবং উদীয়মান ইভেন্টের সময় প্রবাহ ক্যাপচার করুন ५. তথ্য যাচাইকরণ একীকরণ: কভারেজ মেট্রিক্সের সাথে তথ্য যাচাইকরণ এবং বিশ্বাসযোগ্যতা মূল্যায়ন একত্রিত করুন
१. গবেষণা ডিজাইন ব্যাপক: একাধিক সার্চ ইঞ্জিন, একাধিক ডেটাসেট, একাধিক ভৌগোলিক অবস্থানের পদ্ধতিগত তুলনা २. পদ্ধতি উদ্ভাবন: প্রথমবারের মতো সার্চ ইঞ্জিন তুলনায় ধারণা প্রবর্তন পদ্ধতি প্রয়োগ করা ३. ব্যবহারিক মূল্য উচ্চ: সার্চ ইঞ্জিন ডিজাইন এবং মূল্যায়নের জন্য গুরুত্বপূর্ণ অন্তর্দৃষ্টি প্রদান করে ४. সময়োপযোগীতা মনোযোগ: বিশেষভাবে সময়-সংবেদনশীল প্রশ্ন পরিচালনার ক্ষমতায় মনোযোগ দেয় ५. উদ্দেশ্যমূলক নিরপেক্ষতা: জেনারেটিভ সার্চের সুবিধা এবং সীমাবদ্ধতা উভয়ই প্রদর্শন করে
१. ধারণা বিশ্লেষণ এলএলএম-নির্ভর: ধারণা প্রবর্তনের জন্য এলএলএম ব্যবহার পক্ষপাত প্রবর্তন করতে পারে २. শক্তিশালী অনুমান শর্ত: ব্যবহারকারীরা লিংক ক্লিক করে না, শীর্ষ ১০ ফলাফল অতিক্রম করে না ইত্যাদি অনুমান ३. একক মূল্যায়ন মেট্রিক: প্রধানত ধারণা কভারেজে ফোকাস করে, নির্ভুলতা এবং বিশ্বাসযোগ্যতা মূল্যায়নের অভাব ४. সংক্ষিপ্ত সময় স্প্যান: মাত্র দুই মাসের সময় স্থিতিশীলতা বিশ্লেষণ যথেষ্ট নাও হতে পারে
१. একাডেমিক অবদান: জেনারেটিভ সার্চ মূল্যায়নের জন্য নতুন তাত্ত্বিক কাঠামো এবং পদ্ধতি প্রদান করে २. ব্যবহারিক মূল্য: সার্চ ইঞ্জিন বিকাশকারী এবং ব্যবহারকারীদের জন্য গুরুত্বপূর্ণ রেফারেন্স প্রদান করে ३. নীতি অন্তর্দৃষ্টি: সার্চ ইঞ্জিন নিয়ন্ত্রণ এবং মান নির্ধারণের জন্য বৈজ্ঞানিক প্রমাণ প্রদান করে ४. ভবিষ্যত গবেষণা: পরবর্তী সম্পর্কিত গবেষণার ভিত্তি স্থাপন করে
१. সার্চ ইঞ্জিন মূল্যায়ন: ঐতিহ্যবাহী এবং জেনারেটিভ সার্চ ইঞ্জিনের তুলনামূলক মূল্যায়নের জন্য প্রযোজ্য २. পণ্য উন্নয়ন: সার্চ পণ্য ডিজাইন এবং অপ্টিমাইজেশনের জন্য নির্দেশনা প্রদান করে ३. একাডেমিক গবেষণা: তথ্য পুনরুদ্ধার এবং এআই ক্ষেত্রের গবেষণার জন্য পদ্ধতি এবং ডেটা প্রদান করে ४. ব্যবহারকারী শিক্ষা: ব্যবহারকারীদের বিভিন্ন সার্চ সরঞ্জামের বৈশিষ্ট্য এবং প্রযোজ্য পরিস্থিতি বুঝতে সাহায্য করে
পেপারটি ৪१টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা ঐতিহ্যবাহী সার্চ মূল্যায়ন, বৃহৎ ভাষা মডেল মূল্যায়ন, জেনারেটিভ সার্চ ইত্যাদি একাধিক গবেষণা ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, যা গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
এই গবেষণা জেনারেটিভ এআই যুগে ওয়েব সার্চের বৈশিষ্ট্য বোঝার জন্য গুরুত্বপূর্ণ অবদান প্রদান করে, শুধুমাত্র ঐতিহ্যবাহী সার্চ এবং জেনারেটিভ সার্চের মূল পার্থক্যই প্রকাশ করে না, বরং ভবিষ্যত সার্চ সিস্টেমের ডিজাইন এবং মূল্যায়নের জন্য নতুন চিন্তাভাবনা এবং পদ্ধতি প্রদান করে।