Introducing Semantic Capability in LinkedIn's Content Search Engine
Yang, Zheng, Mohan et al.
In the past, most search queries issued to a search engine were short and simple. A keyword based search engine was able to answer such queries quite well. However, members are now developing the habit of issuing long and complex natural language queries. Answering such queries requires evolution of a search engine to have semantic capability. In this paper we present the design of LinkedIn's new content search engine with semantic capability, and its impact on metrics.
academic
إدخال القدرة الدلالية في محرك بحث المحتوى في LinkedIn
مع تطور سلوك البحث لدى المستخدمين، لم تعد محركات البحث التقليدية القائمة على الكلمات الرئيسية قادرة على تلبية احتياجات الاستعلامات باللغة الطبيعية المتزايدة التعقيد. تقدم هذه الورقة محرك بحث محتوى جديد مصمم خصيصاً في LinkedIn بقدرات فهم دلالي، وتوضح تأثيره الملحوظ على المؤشرات الأساسية.
اتجاه تعقيد استعلامات البحث: انتقل المستخدمون من الاستعلامات القصيرة بالكلمات الرئيسية إلى استعلامات باللغة الطبيعية المعقدة، مثل "كيفية طلب زيادة راتب؟" و"الانقطاع عن الدراسة في الذكاء الاصطناعي"
قيود البحث التقليدي: تواجه محركات البحث القائمة على مطابقة الكلمات الرئيسية مشكلتين رئيسيتين عند التعامل مع الاستعلامات المعقدة:
إرجاع نتائج فارغة عندما لا توجد جميع الكلمات الرئيسية من الاستعلام في أي منشور
حتى عندما توجد منشورات تحتوي على جميع الكلمات الرئيسية، قد تفشل في الإجابة الصحيحة على السؤال بسبب نقص الفهم المفاهيمي
اكتشفت LinkedIn من خلال التحليل أن فهرس البحث يحتوي فعلياً على منشورات قادرة على الإجابة الصحيحة على الاستعلام، لكن هذه المنشورات قد لا تحتوي على جميع الكلمات الرئيسية من الاستعلام. هذا دفع الفريق إلى تطوير محرك بحث محتوى بقدرات مطابقة دلالية لفهم نية الاستعلام بشكل أفضل وإرجاع محتوى ذي صلة.
تستشهد الورقة بالتقنيات والأدوات الرئيسية التالية:
Apache Samza - إطار معالجة البيانات المتدفقة
MTEB Leaderboard - معيار تقييم تضمين النصوص
Venice - منصة تخزين البيانات في LinkedIn
Multilingual E5 - نموذج تضمين النصوص متعدد اللغات
الملخص: هذه ورقة تقرير تقني نموذجي من الصناعة، تركز على مشاركة خبرة LinkedIn الهندسية في البحث الدلالي. على الرغم من أن الابتكار التقني نسبياً محدود، فإن تصميمها الشامل للنظام وتحسينات الأداء الملحوظة والنظر العميق في التحديات الهندسية تجعلها ذات قيمة مرجعية مهمة للصناعة.