أدى ظهور نماذج اللغة الكبيرة (LLMs) إلى ظهور شكل جديد من أشكال البحث عن الويب: البحث التوليدي، حيث تقوم نماذج اللغة الكبيرة باسترجاع صفحات الويب ذات الصلة بالاستعلام وتوليد نص واحد متماسك كرد. يتناقض هذا نمط الإخراج بشكل حاد مع البحث التقليدي عن الويب، الذي يعيد قائمة مرتبة من صفحات الويب المستقلة. يستكشف هذا البحث الأبعاد التي يختلف فيها إخراج البحث التوليدي عن البحث التقليدي عن الويب. تقارن الدراسة محرك البحث التقليدي من Google مع أربعة محركات بحث توليدية من Google و OpenAI، تغطي استعلامات في أربعة مجالات. يكشف التحليل عن اختلافات ملحوظة: تغطي معظم محركات البحث التوليدية نطاقاً أوسع من المصادر مقارنة بالبحث التقليدي عن الويب؛ تختلف محركات البحث التوليدية في اعتمادها على المعرفة الداخلية لمعاملات النموذج مقابل المعرفة الخارجية المسترجعة من الويب؛ تقدم محركات البحث التوليدية مجموعات مفاهيم مختلفة، مما يخلق فرصاً جديدة لتعزيز تنوع البحث والاكتشاف العرضي.
مع ظهور الذكاء الاصطناعي التوليدي، يتطور البحث عن الويب نحو الاعتماد بشكل أكبر على نماذج اللغة الكبيرة. تعيد محركات البحث التقليدية قائمة مرتبة من حوالي 10 نتائج بحث، بينما توفر أنظمة البحث التوليدية إجابات باللغة الطبيعية من خلال روبوتات الدردشة المدعومة بالذكاء الاصطناعي. يحمل هذا التحول في النموذج ثلاثة اختلافات رئيسية:
يعتبر فهم هذه الاختلافات حاسماً لتقييم جودة البحث وتنوع المعلومات وتجربة المستخدم. تم تصميم مقاييس تقييم البحث الحالية بشكل أساسي للقوائم المرتبة ولا يمكن تطبيقها مباشرة على الإخراج المركب للبحث التوليدي.
يهدف هذا البحث إلى الإجابة على ثلاث أسئلة بحثية أساسية:
تستخدم الدراسة 6 مجموعات بيانات، إجمالي 4,606 استعلام:
تم دراسة تأثير أحجام السياق البحثي المختلفة (منخفض/متوسط/مرتفع) لنموذج GPT:
يستشهد البحث بـ 41 مرجعاً ذا صلة، يغطي أعمالاً مهمة في مجالات متعددة مثل تقييم البحث التقليدي وتقييم نماذج اللغة الكبيرة والبحث التوليدي، مما يوفر أساساً نظرياً متيناً للبحث.
يوفر هذا البحث مساهمة مهمة لفهم خصائص البحث عن الويب في عصر الذكاء الاصطناعي التوليدي، حيث لا يكشف فقط عن الاختلافات الرئيسية بين البحث التقليدي والتوليدي، بل يوفر أيضاً أفكاراً وطرقاً جديدة لتصميم وتقييم أنظمة البحث المستقبلية.