2025-11-10T03:00:12.487488

Introducing Semantic Capability in LinkedIn's Content Search Engine

Yang, Zheng, Mohan et al.
In the past, most search queries issued to a search engine were short and simple. A keyword based search engine was able to answer such queries quite well. However, members are now developing the habit of issuing long and complex natural language queries. Answering such queries requires evolution of a search engine to have semantic capability. In this paper we present the design of LinkedIn's new content search engine with semantic capability, and its impact on metrics.
academic

إدخال القدرة الدلالية في محرك بحث المحتوى في LinkedIn

المعلومات الأساسية

  • معرّف الورقة: 2412.20366
  • العنوان: إدخال القدرة الدلالية في محرك بحث المحتوى في LinkedIn
  • المؤلفون: Xin Yang, Chujie Zheng, Madhumitha Mohan, Sonali Bhadra, Pansul Bhatt, Lingyu (Claire) Zhang, Rupesh Gupta
  • المؤسسة: LinkedIn Corporation، Mountain View، CA، الولايات المتحدة الأمريكية
  • التصنيف: cs.IR (استرجاع المعلومات)
  • تاريخ النشر: ديسمبر 2024
  • رابط الورقة: https://arxiv.org/abs/2412.20366

الملخص

مع تطور سلوك البحث لدى المستخدمين، لم تعد محركات البحث التقليدية القائمة على الكلمات الرئيسية قادرة على تلبية احتياجات الاستعلامات باللغة الطبيعية المتزايدة التعقيد. تقدم هذه الورقة محرك بحث محتوى جديد مصمم خصيصاً في LinkedIn بقدرات فهم دلالي، وتوضح تأثيره الملحوظ على المؤشرات الأساسية.

خلفية البحث والدافع

تعريف المشكلة

  1. اتجاه تعقيد استعلامات البحث: انتقل المستخدمون من الاستعلامات القصيرة بالكلمات الرئيسية إلى استعلامات باللغة الطبيعية المعقدة، مثل "كيفية طلب زيادة راتب؟" و"الانقطاع عن الدراسة في الذكاء الاصطناعي"
  2. قيود البحث التقليدي: تواجه محركات البحث القائمة على مطابقة الكلمات الرئيسية مشكلتين رئيسيتين عند التعامل مع الاستعلامات المعقدة:
    • إرجاع نتائج فارغة عندما لا توجد جميع الكلمات الرئيسية من الاستعلام في أي منشور
    • حتى عندما توجد منشورات تحتوي على جميع الكلمات الرئيسية، قد تفشل في الإجابة الصحيحة على السؤال بسبب نقص الفهم المفاهيمي

دافع البحث

اكتشفت LinkedIn من خلال التحليل أن فهرس البحث يحتوي فعلياً على منشورات قادرة على الإجابة الصحيحة على الاستعلام، لكن هذه المنشورات قد لا تحتوي على جميع الكلمات الرئيسية من الاستعلام. هذا دفع الفريق إلى تطوير محرك بحث محتوى بقدرات مطابقة دلالية لفهم نية الاستعلام بشكل أفضل وإرجاع محتوى ذي صلة.

المساهمات الأساسية

  1. تصميم محرك بحث دلالي بهندسة ثنائية الطبقات: يتضمن طبقة استرجاع وطبقة ترتيب متعددة المراحل، يجمع بفعالية بين مطابقة الكلمات الرئيسية والفهم الدلالي
  2. تطبيق استراتيجية استرجاع هجينة: استخدام أداة استرجاع قائمة على المصطلحات (TBR) وأداة استرجاع قائمة على التضمينات (EBR) في نفس الوقت
  3. إنشاء إطار عمل تحسين متعدد الأهداف: تحسين معدل الملاءمة الموضوعية (on-topic rate) ومشاركة المستخدم (long-dwells) في نفس الوقت
  4. تحقيق تحسينات أداء ملحوظة: تحسن معدل الملاءمة الموضوعية ومؤشرات التوقف الطويل بأكثر من 10%

شرح الطريقة

تعريف المهمة

إرجاع منشورات محتوى عالية الجودة وجذابة لكل استعلام بحث، مع التقييم من خلال مؤشرين محددين كمياً:

  • معدل الملاءمة الموضوعية (On-topic rate): استخدام GPT لتقييم جودة وملاءمة المنشورات المرجعة
  • التوقف الطويل (Long-dwells): قياس مدة بقاء المستخدم على المنشور

معمارية النموذج

1. طبقة الاسترجاع (Retrieval Layer)

تحتوي طبقة الاسترجاع على أداتي استرجاع متوازيتين:

أداة الاسترجاع القائمة على المصطلحات (TBR):

  • الحفاظ على فهرس معكوس يربط الكلمات الرئيسية بالمنشورات التي تحتويها
  • البحث عن المنشورات التي تحتوي على جميع الكلمات الرئيسية من الاستعلام من خلال عملية التقاطع
  • مناسبة للاستعلامات الملاحية، مثل البحث عن منشور معين

أداة الاسترجاع القائمة على التضمينات (EBR):

  • اعتماد معمارية نموذج البرج المزدوج (Two-tower Model)
  • برج تضمين الاستعلام: معالجة نص الاستعلام وميزات المستخدم، وإنشاء تضمين الاستعلام
  • برج تضمين المنشور: معالجة نص المنشور وميزات المؤلف، وإنشاء تضمين المنشور
  • استخدام نموذج multilingual-e5 لتضمين النصوص
  • حساب درجة المطابقة بين الاستعلام والمنشور من خلال تشابه جيب التمام

المزايا الرئيسية لـ EBR:

  • المطابقة الدلالية: بناءً على المفاهيم وليس مطابقة الكلمات الرئيسية الدقيقة
  • التخصيص: يمكن إرجاع نتائج مخصصة بناءً على خصائص الباحث
  • تحسين الهدف: يدعم تحسين أي دالة هدف

2. طبقة الترتيب متعددة المراحل (Multi-stage Ranking Layer)

تعتمد طبقة الترتيب على تصميم ثنائي المراحل لموازنة الفعالية والكفاءة:

مرحلة الترتيب L1:

  • استخدام نموذج بسيط لترتيب أولي لآلاف المنشورات المرشحة
  • اختيار أفضل مئات المنشورات للمرحلة التالية

مرحلة الترتيب L2:

  • استخدام نموذج معقد لترتيب دقيق للمنشورات المرشحة
  • إنشاء نتائج البحث النهائية

تتضمن معمارية نموذج الترتيب نموذجي تنبؤ:

  • نموذج التنبؤ بالملاءمة الموضوعية: إدخال نص الاستعلام ونص المنشور، وإخراج درجة الملاءمة
  • نموذج التنبؤ بالتوقف الطويل: إدخال مجموعة ميزات أغنى، تشمل:
    • نص الاستعلام والمنشور
    • درجات المطابقة المقترنة مثل BM25
    • ميزات الاستعلام (مثل ما إذا كان يحتوي على اسم وظيفة)
    • ميزات المنشور (مثل شهرة المنشور)
    • ميزات المستخدم (مثل ما إذا كان لديه نية البحث عن عمل)
    • ميزات المؤلف (مثل تأثير المؤلف)
    • ميزات العلاقة بين المستخدم والمؤلف (مثل ما إذا كانا أصدقاء)

صيغة حساب الدرجة النهائية:

score = α × on-topicness_score + (1-α) × long-dwell_score

حيث يعمل α كمعامل تعديل، يتم تحديد قيمته المثلى من خلال التجارب عبر الإنترنت.

نقاط الابتكار التقني

  1. استراتيجية الاسترجاع الهجينة: الجمع بين مزايا المطابقة الدقيقة والمطابقة الدلالية
  2. تصميم نموذج البرج المزدوج: يدعم الحساب المسبق لتضمينات المنشورات، مما يحسن كفاءة الاسترجاع بشكل كبير
  3. تحسين متعدد الأهداف: النظر في جودة المحتوى ومشاركة المستخدم في نفس الوقت
  4. معمارية متدرجة: تحقيق توازن جيد بين الكفاءة والفعالية

إعداد التجارب

مجموعة البيانات

  • استخدام البيانات التاريخية من محرك بحث محتوى LinkedIn
  • تنسيق بيانات التدريب: ثلاثيات (query, post, label)
  • تجمع التسميات بين مؤشري الملاءمة الموضوعية والتوقف الطويل

مؤشرات التقييم

  1. معدل الملاءمة الموضوعية (On-topic rate):
    • استخدام GPT لتقييم أفضل 10 منشورات مرجعة (1 يعني ذي صلة وعالي الجودة، 0 يعني غير ذي صلة)
    • حساب نسبة المنشورات المصنفة بـ 1
  2. التوقف الطويل (Long-dwells):
    • تصنيف ثنائي بناءً على مدة بقاء المستخدم على المنشور
    • إحصاء عدد المنشورات المصنفة بـ 1

تفاصيل التطبيق

  • نموذج تضمين النصوص: multilingual-e5
  • تخزين التضمينات: نظام مخزن المفاتيح والقيم Venice
  • البحث عن أقرب الجيران التقريبي: تحديد عدد المنشورات الممسوحة للتحكم في التأخير
  • تحسين الحساب المسبق: حساب تضمينات المنشورات بشكل غير متصل وقريب من الوقت الفعلي

نتائج التجارب

النتائج الرئيسية

حقق محرك البحث الدلالي الجديد تحسينات أداء ملحوظة:

  • معدل الملاءمة الموضوعية: تحسن بأكثر من 10%
  • التوقف الطويل: تحسن بأكثر من 10%
  • التأثير على مستوى الموقع: تأثير إيجابي على إجمالي الجلسات في LinkedIn

حالات نموذجية

يمكن لمحرك البحث الآن التعامل بفعالية مع الاستعلامات المعقدة باللغة الطبيعية، مثل:

  • "كيفية طلب زيادة راتب؟" (how to ask for a raise?)
  • "الانقطاع عن الدراسة في الذكاء الاصطناعي" (dropout in AI)

غالباً ما يكون من الصعب الحصول على نتائج مرضية لهذه الاستعلامات في الأنظمة التقليدية القائمة على الكلمات الرئيسية.

الأعمال ذات الصلة

تركز الورقة بشكل أساسي على التطبيقات العملية لأنظمة البحث على مستوى الصناعة، وتشمل التقنيات ذات الصلة:

  • تقنيات تضمين النصوص (multilingual-e5)
  • معمارية نموذج البرج المزدوج
  • أنظمة الترتيب متعددة المراحل
  • تحسين أنظمة الاسترجاع واسعة النطاق

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. القدرة على الفهم الدلالي ضرورية لمحركات البحث الحديثة
  2. استراتيجية الاسترجاع الهجينة يمكنها تلبية احتياجات المطابقة الدقيقة والمطابقة الدلالية
  3. إطار عمل التحسين متعدد الأهداف يحسن بفعالية تجربة المستخدم

القيود

  1. تعريف مؤشر الملاءمة الموضوعية الحالي نسبياً بسيط، ولا يمكنه التقاط توقعات الجودة المختلفة لأنواع الاستعلامات المختلفة
  2. الاعتماد على GPT لتقييم الجودة قد يحتوي على بعض القيود

الاتجاهات المستقبلية

يخطط الفريق لـ:

  1. تحسين مؤشر تقييم الملاءمة الموضوعية
  2. إدخال نماذج اللغة الكبيرة (LLM) في طبقة الترتيب، لتحقيق آلية الانتباه المشترك لنص الاستعلام والمنشور
  3. تحسين القدرة على الفهم العميق للغة

التقييم المتعمق

المزايا

  1. قيمة عملية عالية: حل مشكلة مهمة في الأعمال الفعلية
  2. تصميم معمارية معقول: تحقق الهندسة ثنائية الطبقات توازناً فعالاً بين الفعالية والكفاءة
  3. حل تقني ناضج: يأخذ في الاعتبار بشكل كامل التحديات الهندسية للنشر واسع النطاق
  4. نظام تقييم شامل: إنشاء إطار عمل تقييم مزدوج للجودة والمشاركة
  5. تأثير ملحوظ: تحقيق تحسن يزيد عن 10% في المؤشرات

أوجه القصور

  1. الابتكار التقني محدود: في الأساس تطبيق هندسي للتقنيات الموجودة
  2. قيود طريقة التقييم: قد يؤدي الاعتماد على GPT للتقييم إلى إدخال انحيازات
  3. نقص التجارب المقارنة: نقص المقارنات التفصيلية مع طرق البحث الدلالي الأخرى
  4. غياب التحليل النظري: لا يوجد تحليل نظري عميق وتجارب استئصالية

التأثير

  1. القيمة الصناعية: توفير مرجع عملي لأنظمة البحث الدلالي واسعة النطاق
  2. نشر التكنولوجيا: إظهار التطبيق العملي الفعلي للفهم الدلالي في محركات البحث
  3. مشاركة الخبرة: توفير خبرة هندسية عملية قيمة

السيناريوهات المناسبة

هذه الطريقة مناسبة لـ:

  • منصات البحث عن المحتوى واسعة النطاق
  • أنظمة البحث التي تحتاج إلى التعامل مع استعلامات معقدة باللغة الطبيعية
  • تطبيقات البحث التي لها متطلبات عالية للتخصيص
  • سيناريوهات البحث التي تحتاج إلى موازنة أهداف تحسين متعددة

المراجع

تستشهد الورقة بالتقنيات والأدوات الرئيسية التالية:

  1. Apache Samza - إطار معالجة البيانات المتدفقة
  2. MTEB Leaderboard - معيار تقييم تضمين النصوص
  3. Venice - منصة تخزين البيانات في LinkedIn
  4. Multilingual E5 - نموذج تضمين النصوص متعدد اللغات

الملخص: هذه ورقة تقرير تقني نموذجي من الصناعة، تركز على مشاركة خبرة LinkedIn الهندسية في البحث الدلالي. على الرغم من أن الابتكار التقني نسبياً محدود، فإن تصميمها الشامل للنظام وتحسينات الأداء الملحوظة والنظر العميق في التحديات الهندسية تجعلها ذات قيمة مرجعية مهمة للصناعة.