2025-11-24T16:16:18.122167

Characterizing Web Search in The Age of Generative AI

Kirsten, Perdekamp, Upadhyay et al.
The advent of LLMs has given rise to a new type of web search: Generative search, where LLMs retrieve web pages related to a query and generate a single, coherent text as a response. This output modality stands in stark contrast to traditional web search, where results are returned as a ranked list of independent web pages. In this paper, we ask: Along what dimensions do generative search outputs differ from traditional web search? We compare Google, a traditional web search engine, with four generative search engines from two providers (Google and OpenAI) across queries from four domains. Our analysis reveals intriguing differences. Most generative search engines cover a wider range of sources compared to web search. Generative search engines vary in the degree to which they rely on internal knowledge contained within the model parameters v.s. external knowledge retrieved from the web. Generative search engines surface varying sets of concepts, creating new opportunities for enhancing search diversity and serendipity. Our results also highlight the need for revisiting evaluation criteria for web search in the age of Generative AI.
academic

জেনারেটিভ এআই যুগে ওয়েব সার্চের বৈশিষ্ট্য নির্ধারণ

মৌলিক তথ্য

  • পেপার আইডি: 2510.11560
  • শিরোনাম: Characterizing Web Search in The Age of Generative AI
  • লেখক: Elisabeth Kirsten, Jost Grosse Perdekamp, Mihir Upadhyay, Krishna P. Gummadi, Muhammad Bilal Zafar
  • প্রতিষ্ঠান: Ruhr University Bochum, UAR RC Trust, MPI-SWS
  • শ্রেণীবিভাগ: cs.IR cs.AI
  • প্রকাশনার সময়: ২০২৫ সালের ১৩ অক্টোবর
  • পেপার লিংক: https://arxiv.org/abs/2510.11560

সারসংক্ষেপ

বৃহৎ ভাষা মডেল (এলএলএম)-এর আবির্ভাব একটি নতুন ধরনের ওয়েব সার্চ তৈরি করেছে: জেনারেটিভ সার্চ, যেখানে এলএলএম-গুলি প্রশ্নের সাথে সম্পর্কিত ওয়েবপেজ পুনরুদ্ধার করে এবং একটি একক, সুসংগত পাঠ্য প্রতিক্রিয়া হিসাবে তৈরি করে। এই আউটপুট মোড ঐতিহ্যবাহী ওয়েব সার্চের সাথে তীব্র বৈপরীত্য তৈরি করে, যা স্বাধীন ওয়েবপেজের র‍্যাঙ্কিং তালিকা প্রদান করে। এই পেপারটি জেনারেটিভ সার্চ আউটপুট এবং ঐতিহ্যবাহী ওয়েব সার্চের মধ্যে কোন মাত্রায় পার্থক্য বিদ্যমান তা অন্বেষণ করে। গবেষণা গুগলের ঐতিহ্যবাহী সার্চ ইঞ্জিন এবং গুগল ও ওপেনএআই-এর চারটি জেনারেটিভ সার্চ ইঞ্জিনের তুলনা করে, চারটি ডোমেন জুড়ে প্রশ্নগুলি কভার করে। বিশ্লেষণ উল্লেখযোগ্য পার্থক্য প্রকাশ করে: বেশিরভাগ জেনারেটিভ সার্চ ইঞ্জিন ঐতিহ্যবাহী ওয়েব সার্চের চেয়ে বিস্তৃত তথ্য উৎস কভার করে; জেনারেটিভ সার্চ ইঞ্জিনগুলি মডেল প্যারামিটারের অভ্যন্তরীণ জ্ঞান এবং নেটওয়ার্ক থেকে পুনরুদ্ধারকৃত বাহ্যিক জ্ঞানের উপর নির্ভরতায় পার্থক্য প্রদর্শন করে; জেনারেটিভ সার্চ ইঞ্জিনগুলি বিভিন্ন ধারণা সেট উপস্থাপন করে, যা সার্চ বৈচিত্র্য এবং আকস্মিক আবিষ্কার বৃদ্ধির জন্য নতুন সুযোগ তৈরি করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

জেনারেটিভ এআই-এর উত্থানের সাথে সাথে ওয়েব সার্চ বৃহৎ ভাষা মডেলের উপর আরও বেশি নির্ভরশীল দিকে বিকশিত হচ্ছে। ঐতিহ্যবাহী সার্চ ইঞ্জিনগুলি প্রায় ১০টি সার্চ ফলাফলের র‍্যাঙ্কিং তালিকা প্রদান করে, যখন জেনারেটিভ সার্চ সিস্টেমগুলি এলএলএম চ্যাটবটের মাধ্যমে প্রাকৃতিক ভাষার উত্তর প্রদান করে। এই প্যারাডাইম পরিবর্তন তিনটি মূল পার্থক্য নিয়ে আসে:

১. আউটপুট ফরম্যাটের পার্থক্য: ঐতিহ্যবাহী সার্চ স্বাধীন ওয়েবপেজ প্রদান করে, জেনারেটিভ সার্চ একটি একক সুসংগত পাঠ্য ব্লক গঠন করে २. বিস্তৃত কভারেজ: জেনারেটিভ সার্চ ১০টিরও বেশি উৎস থেকে বিষয়বস্তু সংহত করতে পারে ३. মিশ্র জ্ঞান উৎস: বাহ্যিক পুনরুদ্ধার তথ্য এবং এলএলএম অভ্যন্তরীণ জ্ঞান একত্রিত করে

গবেষণার গুরুত্ব

এই পার্থক্যগুলি বোঝা সার্চ গুণমান, তথ্য বৈচিত্র্য এবং ব্যবহারকারীর অভিজ্ঞতা মূল্যায়নের জন্য গুরুত্বপূর্ণ। বিদ্যমান সার্চ মূল্যায়ন মেট্রিক্স প্রধানত র‍্যাঙ্কিং তালিকার জন্য ডিজাইন করা হয়েছে এবং জেনারেটিভ সার্চের সমন্বিত আউটপুটে সরাসরি প্রয়োগ করা যায় না।

বিদ্যমান সীমাবদ্ধতা

  • জেনারেটিভ সার্চ এবং ঐতিহ্যবাহী সার্চ সিস্টেমের পদ্ধতিগত তুলনার গবেষণার অভাব
  • বিদ্যমান মূল্যায়ন কাঠামো জেনারেটিভ সার্চ আউটপুটের জন্য উপযুক্ত নয়
  • জেনারেটিভ সার্চের তথ্য উৎস নির্বাচন এবং ধারণা কভারেজে গভীর বিশ্লেষণের অভাব

মূল অবদান

१. প্রথম পদ্ধতিগত তুলনা: ঐতিহ্যবাহী সার্চ এবং জেনারেটিভ সার্চের ব্যাপক উৎস বিশ্লেষণ এবং বিষয়বস্তু বিশ্লেষণ २. বহুমাত্রিক বিশ্লেষণ কাঠামো: তথ্য উৎস বৈচিত্র্য, অভ্যন্তরীণ-বাহ্যিক জ্ঞান নির্ভরতা, ধারণা কভারেজ তিনটি মাত্রা থেকে সার্চ সিস্টেম মূল্যায়ন ३. বৃহৎ-স্কেল অভিজ্ঞতামূলক গবেষণা: ৬টি ডেটাসেট, ৪,৬০६টি প্রশ্ন জুড়ে ব্যাপক পরীক্ষা ४. সময়োপযোগীতা বিশ্লেষণ: বিভিন্ন সার্চ সিস্টেমের সময়-সংবেদনশীল প্রশ্ন পরিচালনার ক্ষমতা মূল্যায়ন ५. মূল্যায়ন পদ্ধতি উদ্ভাবন: জেনারেটিভ সার্চের জন্য প্রযোজ্য নতুন মূল্যায়ন মান এবং পদ্ধতি প্রস্তাব

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

এই গবেষণা তিনটি মূল গবেষণা প্রশ্নের উত্তর দেওয়ার লক্ষ্য রাখে:

  • RQ1: জেনারেটিভ এআই মডেলগুলি কত পরিমাণে আরও বেশি সার্চ ফলাফল প্রক্রিয়া করার তাদের ক্ষমতা ব্যবহার করে আরও বৈচিত্র্যময় তথ্য উৎস অ্যাক্সেস করতে?
  • RQ2: জেনারেটিভ সার্চ ইঞ্জিনগুলি কত অনুপাতে বাহ্যিক নেটওয়ার্ক জ্ঞান বনাম অভ্যন্তরীণ এলএলএম জ্ঞানের উপর নির্ভর করে?
  • RQ3: আরও বৈচিত্র্যময় তথ্য উৎসের উপর নির্ভরতা এবং অভ্যন্তরীণ জ্ঞানের ব্যবহার কি জেনারেটিভ এআই মডেলগুলিকে আরও বৈচিত্র্যময় আউটপুট তৈরি করতে সক্ষম করে?

পরীক্ষামূলক স্থাপত্য

সার্চ ইঞ্জিন নির্বাচন

  • ঐতিহ্যবাহী সার্চ: গুগল জৈব সার্চ ফলাফল (অর্গানিক)
  • জেনারেটিভ সার্চ:
    • গুগল এআই ওভারভিউ (এআইও)
    • গুগল সার্চ সহ জেমিনি-২.५-ফ্ল্যাশ
    • জিপিটি-४ও সার্চ (জিপিটি-সার্চ)
    • সার্চ টুল সহ জিপিটি-४ও (জিপিটি-টুল)

বিশ্লেষণ মাত্রা

१. তথ্য উৎস বিশ্লেষণ:

  • লিংক সংখ্যা পরিসংখ্যান
  • ওয়েবসাইট জনপ্রিয়তা র‍্যাঙ্কিং (ট্রাঙ্কো তালিকার উপর ভিত্তি করে)
  • তথ্য উৎস প্রকার শ্রেণীবিভাগ (গুগল বিষয়বস্তু বিভাগ এবং কাস্টম শ্রেণীবিভাগ ব্যবহার করে)
  • ঐতিহ্যবাহী সার্চ ফলাফলের সাথে ওভারল্যাপ বিশ্লেষণ

२. বিষয়বস্তু বিশ্লেষণ:

  • প্রতিক্রিয়া দৈর্ঘ্য এবং কাঠামো বিশ্লেষণ
  • ধারণা কভারেজ মূল্যায়ন (এলএলওওএম কাঠামো ব্যবহার করে)
  • ধারণা ঘনত্ব গণনা
  • ক্রস-ইঞ্জিন ধারণা ওভারল্যাপ বিশ্লেষণ

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. ধারণা প্রবর্তন পদ্ধতি: ধারণা আবিষ্কার এবং শ্রেণীবিভাগের জন্য এলএলওওএম (এলএলএম-চালিত বিষয় অনুমান কাঠামো) গ্রহণ २. বহু-স্তরীয় ওভারল্যাপ বিশ্লেষণ: ইউআরএল স্তর থেকে ডোমেইন স্তর পর্যন্ত ওভারল্যাপ ডিগ্রি গণনা ३. সময় মাত্রা মূল্যায়ন: ট্রেন্ড প্রশ্ন এবং সময় স্থিতিশীলতা বিশ্লেষণের মাধ্যমে সময়োপযোগীতা মূল্যায়ন ४. ক্রস-ভৌগোলিক যাচাইকরণ: মার্কিন যুক্তরাষ্ট্র এবং জার্মানি দুটি ভৌগোলিক অবস্থানে পরীক্ষা পরিচালনা

পরীক্ষামূলক সেটআপ

ডেটাসেট

গবেষণা ৬টি ডেটাসেট ব্যবহার করে, মোট ৪,६०६টি প্রশ্ন:

१. এমএস মার্কো (১,०००টি প্রশ্ন): প্রকৃত বিং সার্চ প্রশ্ন থেকে খোলা ডোমেইন পুনরুদ্ধার ডেটাসেট २. ওয়াইল্ডচ্যাট (१,७५०টি প্রশ্ন): চ্যাটজিপিটি ব্যবহারকারী ইন্টারঅ্যাকশন থেকে ফিল্টার করা তথ্য-সন্ধান প্রশ্ন ३. অলসাইডস (३३२টি প্রশ্ন): রাজনৈতিক বিষয়ের উপর ভিত্তি করে তৈরি প্রশ্ন ४. নিয়ন্ত্রক পদক্ষেপ (६४९টি প্রশ্ন): ট্রাম্প প্রশাসনের প্রশাসনিক আদেশ সম্পর্কে সময়োপযোগী প্রশ্ন ५. বিজ্ঞান প্রশ্ন (४५३টি প্রশ্ন): এসিএম কম্পিউটিং শ্রেণীবিভাগ সিস্টেমের উপর ভিত্তি করে বৈজ্ঞানিক বিষয় প্রশ্ন ६. পণ্য (४२२টি প্রশ্ন): २०२३ সালের সবচেয়ে জনপ্রিয় অ্যামাজন পণ্যের উপর ভিত্তি করে কেনাকাটার প্রশ্ন

মূল্যায়ন মেট্রিক্স

१. তথ্য উৎস মেট্রিক্স:

  • প্রতি-প্রশ্ন লিংক সংখ্যা
  • ওয়েবসাইট জনপ্রিয়তা র‍্যাঙ্কিং
  • তথ্য উৎস প্রকার বিতরণ
  • ইউআরএল/ডোমেইন ওভারল্যাপ হার

२. বিষয়বস্তু মেট্রিক্স:

  • প্রতিক্রিয়া দৈর্ঘ্য (অক্ষর সংখ্যা)
  • ধারণা কভারেজ হার
  • ধারণা ঘনত্ব (ধারণা সংখ্যা/পাঠ্য দৈর্ঘ্য)
  • ধারণা ওভারল্যাপ ডিগ্রি (জ্যাকার্ড সাদৃশ্য)

३. সময়োপযোগীতা মেট্রিক্স:

  • ট্রেন্ড প্রশ্ন প্রক্রিয়াকরণ সাফল্যের হার
  • সময় স্থিতিশীলতা (সময় পয়েন্ট জুড়ে সামঞ্জস্য)

বাস্তবায়ন বিবরণ

  • সমস্ত প্রশ্ন ইংরেজিতে পরিচালিত
  • মার্কিন যুক্তরাষ্ট্র এবং জার্মানি দুটি ভৌগোলিক অবস্থানে সম্পাদিত
  • জেনারেটিভ মডেল তাপমাত্রা প্যারামিটার ০-তে সেট করা (যদি সমর্থিত হয়)
  • সর্বাধিক নতুন টোকেন সংখ্যা ১,००० এ সেট করা
  • পরীক্ষার সময়: জুলাই-সেপ্টেম্বর ২०२५

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

তথ্য উৎস পার্থক্য উল্লেখযোগ্য

१. বাহ্যিক জ্ঞান নির্ভরতা পার্থক্য:

  • জিপিটি-টুল গড়ে প্রতি-প্রশ্ন মাত্র ०.४টি ওয়েবপেজ উদ্ধৃত করে
  • এআইও, জেমিনি, জিপিটি-সার্চ যথাক্রমে ८.६, ८.५, ४.१টি ওয়েবপেজ উদ্ধৃত করে
  • ঐতিহ্যবাহী সার্চ স্থিরভাবে १०টি ফলাফল প্রদান করে

२. তথ্য উৎস জনপ্রিয়তা:

  • ঐতিহ্যবাহী সার্চ: ৮९% ওয়েবসাইট ট্রাঙ্কো १এম তালিকায়
  • জেনারেটিভ সার্চ: ८१%-८६% তালিকায়
  • জিপিটি-টুল উদ্ধৃত ওয়েবসাইটগুলি উচ্চতর র‍্যাঙ্ক করা (মধ্যমা ११२४ বনাম ঐতিহ্যবাহী সার্চ २३५२)

३. তথ্য উৎস ওভারল্যাপ হার কম:

  • এআইও এবং ঐতিহ্যবাহী সার্চ শীর্ষ १० ফলাফলের সাথে ওভারল্যাপ <५०%
  • শীর্ষ १०० ফলাফলের সাথে ওভারল্যাপ ६०% অতিক্রম করে না
  • পণ্য ডেটাসেট ওভারল্যাপ হার মাত্র ३०%

বিষয়বস্তু বিশ্লেষণ অনুসন্ধান

१. প্রতিক্রিয়া দৈর্ঘ্য পার্থক্য:

  • জেমিনি দীর্ঘতম (গড় २५०५±५५२ অক্ষর)
  • জিপিটি-টুল সংক্ষিপ্ততম (গড় १०१८±२१९ অক্ষর)
  • এআইও মধ্যম দৈর্ঘ্য কিন্তু বেশি লিংক সংখ্যা

२. ধারণা কভারেজ অনুরূপ:

  • ঐতিহ্যবাহী সার্চ (সমস্ত ফলাফল): ७८%±१४%
  • জিপিটি-সার্চ: ७८%±१६%
  • জেমিনি: ७७%±१४%
  • এআইও: ७४%±१६%
  • জিপিটি-টুল: ७१%±१६%

३. অস্পষ্ট প্রশ্ন প্রক্রিয়াকরণ:

  • ঐতিহ্যবাহী সার্চ কম কভারেজ প্রশ্নে সর্বোত্তম পারফরম্যান্স (६७% মধ্যমা কভারেজ হার)
  • এআইও: ५५%
  • জিপিটি-টুল: ४८%

সময়োপযোগীতা বিশ্লেষণ

१. ট্রেন্ড প্রশ্ন প্রক্রিয়াকরণ:

  • এআইও মাত্র ३% ট্রেন্ড প্রশ্নে ট্রিগার হয়
  • জিপিটি-সার্চ সর্বোচ্চ ধারণা কভারেজ হার অর্জন করে (७२%)
  • জিপিটি-টুল সময়োপযোগী প্রশ্নে দুর্বল পারফরম্যান্স (५१%)

२. সময় স্থিতিশীলতা:

  • ঐতিহ্যবাহী সার্চ সবচেয়ে স্থিতিশীল (४५% ওভারল্যাপ হার)
  • জেমিনি দ্বিতীয় (४०%)
  • এআইও সর্বাধিক পরিবর্তনশীল (१८% ওভারল্যাপ হার)

বিলোপন পরীক্ষা

জিপিটি মডেলের বিভিন্ন সার্চ প্রসঙ্গ আকার (কম/মধ্যম/উচ্চ) এর প্রভাব অধ্যয়ন করা হয়েছে:

  • সার্চ প্রসঙ্গ আকার তথ্য উৎস নির্বাচনে কোনো উল্লেখযোগ্য প্রভাব ফেলে না
  • বিষয়বস্তু প্রজন্মের গুণমানে কোনো স্পষ্ট পার্থক্য নেই
  • ধারণা কভারেজ হার মূলত সামঞ্জস্যপূর্ণ থাকে

সম্পর্কিত কাজ

ঐতিহ্যবাহী সার্চ মূল্যায়ন

  • প্রাসঙ্গিকতা, বৈচিত্র্য, নতুনত্ব, কভারেজ ইত্যাদি ঐতিহ্যবাহী মেট্রিক্স
  • এনডিসিজি, α-এনডিসিজি ইত্যাদি র‍্যাঙ্কিং মূল্যায়ন পদ্ধতি
  • রাজনৈতিক পক্ষপাত, ভৌগোলিক পক্ষপাত, বাণিজ্যিক পক্ষপাত ইত্যাদি বৈচিত্র্য গবেষণা

বৃহৎ ভাষা মডেল মূল্যায়ন

  • প্রশ্নোত্তর, সারসংক্ষেপ, তথ্য ভিত্তি, সরঞ্জাম ব্যবহার ইত্যাদি ক্ষমতা মূল্যায়ন
  • পুনরুদ্ধার-বর্ধিত প্রজন্ম (আরএজি) প্রযুক্তি
  • প্রশ্ন বোঝা এবং র‍্যাঙ্কিং প্রয়োগ

জেনারেটিভ সার্চ গবেষণা

  • যাচাইযোগ্যতা, বিশ্বাসযোগ্যতা, নির্ভুলতা মূল্যায়ন
  • প্রতিদ্বন্দ্বী তথ্য প্রশ্নের দৃঢ়তা
  • পক্ষপাত এবং অন্যায্যতা সমস্যা
  • নতুন মূল্যায়ন নীতি এবং বেঞ্চমার্ক

উপসংহার এবং আলোচনা

প্রধান সিদ্ধান্ত

१. তথ্য উৎস বৈচিত্র্য: জেনারেটিভ সার্চ ইঞ্জিনগুলি বিস্তৃত তথ্য উৎস অ্যাক্সেস করে, কিন্তু অগত্যা ধারণা কভারেজ বৃদ্ধি করে না २. অভ্যন্তরীণ-বাহ্যিক জ্ঞান ভারসাম্য: বিভিন্ন জেনারেটিভ সার্চ ইঞ্জিন অভ্যন্তরীণ বনাম বাহ্যিক জ্ঞানের উপর নির্ভরতায় বিশাল পার্থক্য প্রদর্শন করে ३. ধারণা কভারেজ সমতুল্য: তথ্য উৎস পার্থক্য সত্ত্বেও, সামগ্রিক ধারণা কভারেজ ঐতিহ্যবাহী সার্চের অনুরূপ ४. অস্পষ্ট প্রশ্ন চ্যালেঞ্জ: ঐতিহ্যবাহী সার্চ অস্পষ্ট প্রশ্ন পরিচালনায় এখনও সুবিধা রাখে ५. সময়োপযোগীতা পার্থক্য: অভ্যন্তরীণ জ্ঞানের উপর নির্ভরশীল মডেলগুলি সময়োপযোগী প্রশ্নে দুর্বল পারফরম্যান্স করে

সীমাবদ্ধতা

१. প্রশ্ন পরিসীমা সীমাবদ্ধতা: নির্বাচিত প্রশ্ন কর্মভার শুধুমাত্র কভার করে, বহু-পালা সংলাপ সার্চ বিবেচনা করে না २. ভাষা এবং ভৌগোলিক সীমাবদ্ধতা: শুধুমাত্র ইংরেজি প্রশ্ন ব্যবহার করে, শুধুমাত্র দুটি দেশে পরীক্ষা করা হয়েছে ३. বিষয়বস্তু বিশ্লেষণ গভীরতা: শুধুমাত্র শীর্ষ १० ঐতিহ্যবাহী সার্চ ফলাফল বিশ্লেষণ করে, ব্যবহারকারীরা খুব কমই লিংক ক্লিক করে এই অনুমান ४. সময় উইন্ডো সীমাবদ্ধতা: মূল্যায়ন সময় উইন্ডো সীমিত, দীর্ঘমেয়াদী অনুদৈর্ঘ্য গবেষণার প্রয়োজন ५. আউটপুট নির্ধারণ: প্রতিটি প্রশ্নের জন্য শুধুমাত্র একটি আউটপুট ব্যবহার করা হয়, আউটপুট পরিবর্তনশীলতা পরিমাপ করা হয়নি

ভবিষ্যত দিকনির্দেশনা

१. নতুন মূল্যায়ন পদ্ধতি: তথ্য উৎস বৈচিত্র্য, ধারণা কভারেজ এবং সমন্বিত আচরণ বিবেচনা করে এমন মূল্যায়ন পদ্ধতি বিকাশ করুন २. বহুভাষিক সম্প্রসারণ: বহুভাষিক প্রশ্ন এবং বহু-পালা ইন্টারঅ্যাকশনে সম্প্রসারণ করুন ३. গভীর বিষয়বস্তু বিশ্লেষণ: সারসংক্ষেপ বিশ্লেষণ এবং সম্পূর্ণ পৃষ্ঠা বিষয়বস্তু মূল্যায়নের তুলনা করুন ४. অনুদৈর্ঘ্য গবেষণা: মডেল আপডেট এবং উদীয়মান ইভেন্টের সময় প্রবাহ ক্যাপচার করুন ५. তথ্য যাচাইকরণ একীকরণ: কভারেজ মেট্রিক্সের সাথে তথ্য যাচাইকরণ এবং বিশ্বাসযোগ্যতা মূল্যায়ন একত্রিত করুন

গভীর মূল্যায়ন

শক্তি

१. গবেষণা ডিজাইন ব্যাপক: একাধিক সার্চ ইঞ্জিন, একাধিক ডেটাসেট, একাধিক ভৌগোলিক অবস্থানের পদ্ধতিগত তুলনা २. পদ্ধতি উদ্ভাবন: প্রথমবারের মতো সার্চ ইঞ্জিন তুলনায় ধারণা প্রবর্তন পদ্ধতি প্রয়োগ করা ३. ব্যবহারিক মূল্য উচ্চ: সার্চ ইঞ্জিন ডিজাইন এবং মূল্যায়নের জন্য গুরুত্বপূর্ণ অন্তর্দৃষ্টি প্রদান করে ४. সময়োপযোগীতা মনোযোগ: বিশেষভাবে সময়-সংবেদনশীল প্রশ্ন পরিচালনার ক্ষমতায় মনোযোগ দেয় ५. উদ্দেশ্যমূলক নিরপেক্ষতা: জেনারেটিভ সার্চের সুবিধা এবং সীমাবদ্ধতা উভয়ই প্রদর্শন করে

অপূর্ণতা

१. ধারণা বিশ্লেষণ এলএলএম-নির্ভর: ধারণা প্রবর্তনের জন্য এলএলএম ব্যবহার পক্ষপাত প্রবর্তন করতে পারে २. শক্তিশালী অনুমান শর্ত: ব্যবহারকারীরা লিংক ক্লিক করে না, শীর্ষ ১০ ফলাফল অতিক্রম করে না ইত্যাদি অনুমান ३. একক মূল্যায়ন মেট্রিক: প্রধানত ধারণা কভারেজে ফোকাস করে, নির্ভুলতা এবং বিশ্বাসযোগ্যতা মূল্যায়নের অভাব ४. সংক্ষিপ্ত সময় স্প্যান: মাত্র দুই মাসের সময় স্থিতিশীলতা বিশ্লেষণ যথেষ্ট নাও হতে পারে

প্রভাব

१. একাডেমিক অবদান: জেনারেটিভ সার্চ মূল্যায়নের জন্য নতুন তাত্ত্বিক কাঠামো এবং পদ্ধতি প্রদান করে २. ব্যবহারিক মূল্য: সার্চ ইঞ্জিন বিকাশকারী এবং ব্যবহারকারীদের জন্য গুরুত্বপূর্ণ রেফারেন্স প্রদান করে ३. নীতি অন্তর্দৃষ্টি: সার্চ ইঞ্জিন নিয়ন্ত্রণ এবং মান নির্ধারণের জন্য বৈজ্ঞানিক প্রমাণ প্রদান করে ४. ভবিষ্যত গবেষণা: পরবর্তী সম্পর্কিত গবেষণার ভিত্তি স্থাপন করে

প্রযোজ্য পরিস্থিতি

१. সার্চ ইঞ্জিন মূল্যায়ন: ঐতিহ্যবাহী এবং জেনারেটিভ সার্চ ইঞ্জিনের তুলনামূলক মূল্যায়নের জন্য প্রযোজ্য २. পণ্য উন্নয়ন: সার্চ পণ্য ডিজাইন এবং অপ্টিমাইজেশনের জন্য নির্দেশনা প্রদান করে ३. একাডেমিক গবেষণা: তথ্য পুনরুদ্ধার এবং এআই ক্ষেত্রের গবেষণার জন্য পদ্ধতি এবং ডেটা প্রদান করে ४. ব্যবহারকারী শিক্ষা: ব্যবহারকারীদের বিভিন্ন সার্চ সরঞ্জামের বৈশিষ্ট্য এবং প্রযোজ্য পরিস্থিতি বুঝতে সাহায্য করে

সংদর্ভ

পেপারটি ৪१টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা ঐতিহ্যবাহী সার্চ মূল্যায়ন, বৃহৎ ভাষা মডেল মূল্যায়ন, জেনারেটিভ সার্চ ইত্যাদি একাধিক গবেষণা ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, যা গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।


এই গবেষণা জেনারেটিভ এআই যুগে ওয়েব সার্চের বৈশিষ্ট্য বোঝার জন্য গুরুত্বপূর্ণ অবদান প্রদান করে, শুধুমাত্র ঐতিহ্যবাহী সার্চ এবং জেনারেটিভ সার্চের মূল পার্থক্যই প্রকাশ করে না, বরং ভবিষ্যত সার্চ সিস্টেমের ডিজাইন এবং মূল্যায়নের জন্য নতুন চিন্তাভাবনা এবং পদ্ধতি প্রদান করে।