2025-11-10T03:00:12.487488

Introducing Semantic Capability in LinkedIn's Content Search Engine

Yang, Zheng, Mohan et al.
In the past, most search queries issued to a search engine were short and simple. A keyword based search engine was able to answer such queries quite well. However, members are now developing the habit of issuing long and complex natural language queries. Answering such queries requires evolution of a search engine to have semantic capability. In this paper we present the design of LinkedIn's new content search engine with semantic capability, and its impact on metrics.
academic

Einführung semantischer Fähigkeiten in LinkedIns Content-Suchmaschine

Grundinformationen

  • Paper-ID: 2412.20366
  • Titel: Introducing Semantic Capability in LinkedIn's Content Search Engine
  • Autoren: Xin Yang, Chujie Zheng, Madhumitha Mohan, Sonali Bhadra, Pansul Bhatt, Lingyu (Claire) Zhang, Rupesh Gupta
  • Institution: LinkedIn Corporation, Mountain View, CA, USA
  • Klassifizierung: cs.IR (Information Retrieval)
  • Veröffentlichungsdatum: Dezember 2024
  • Paper-Link: https://arxiv.org/abs/2412.20366

Zusammenfassung

Mit der Entwicklung des Nutzersuchverhaltens können traditionelle schlüsselwortbasierte Suchmaschinen die zunehmend komplexen Anforderungen natürlichsprachlicher Anfragen nicht mehr erfüllen. Dieser Artikel stellt LinkedIns neu gestaltete Content-Suchmaschine mit semantischen Verständnisfähigkeiten vor und demonstriert ihre signifikanten Verbesserungen bei Kernmetriken.

Forschungshintergrund und Motivation

Problemdefinition

  1. Trend zur Komplexität von Suchanfragen: Nutzer sind von kurzen Schlüsselwortabfragen zu komplexen natürlichsprachlichen Anfragen übergegangen, wie „how to ask for a raise?" oder „dropout in AI"
  2. Einschränkungen traditioneller Suche: Schlüsselwortabgleich-basierte Suchmaschinen weisen bei der Verarbeitung komplexer Anfragen zwei Hauptprobleme auf:
    • Rückgabe leerer Ergebnisse, wenn nicht alle Schlüsselwörter der Anfrage in irgendeinem Beitrag vorhanden sind
    • Selbst wenn Beiträge mit allen Schlüsselwörtern existieren, können sie aufgrund mangelnden konzeptionellen Verständnisses die Frage möglicherweise nicht korrekt beantworten

Forschungsmotivation

LinkedIn entdeckte durch Analysen, dass im Suchindex tatsächlich Beiträge existieren, die Anfragen korrekt beantworten können, aber möglicherweise nicht alle Schlüsselwörter der Anfrage enthalten. Dies veranlasste das Team, eine Content-Suchmaschine mit semantischen Abgleichfähigkeiten zu entwickeln, um Abfrageabsichten besser zu verstehen und relevante Inhalte zurückzugeben.

Kernbeiträge

  1. Gestaltung einer zweischichtigen Architektur für semantische Suche: Umfasst Abruf- und mehrstufige Ranking-Schichten, die Schlüsselwortabgleich und semantisches Verständnis effektiv kombinieren
  2. Implementierung einer hybriden Abrufstrategie: Verwendung sowohl eines termbasierten Abrufers (TBR) als auch eines einbettungsbasierten Abrufers (EBR)
  3. Etablierung eines Multi-Objective-Optimierungsrahmens: Gleichzeitige Optimierung der Themenrelevanzrate (On-topic rate) und Nutzerengagement (Long-dwells)
  4. Erreichung signifikanter Leistungsverbesserungen: Verbesserungen bei Themenrelevanz und Long-dwell-Metriken um über 10%

Methodische Details

Aufgabendefinition

Rückgabe hochwertiger, ansprechender Beitragsinhalte für jede Suchanfrage, bewertet durch zwei quantifizierbare Metriken:

  • Themenrelevanzrate (On-topic rate): Verwendung von GPT zur Bewertung der Qualität und Relevanz zurückgegebener Beiträge
  • Lange Verweilzeiten (Long-dwells): Messung der Verweilzeit des Nutzers auf einem Beitrag

Modellarchitektur

1. Abrufschicht (Retrieval Layer)

Die Abrufschicht enthält zwei parallele Abrufer:

Termbasierter Abrufer (TBR):

  • Verwaltet invertierte Indizes, die Schlüsselwörter auf Beiträge abbilden, die diese Wörter enthalten
  • Findet Beiträge mit allen Schlüsselwörtern der Anfrage durch Schnittmengenoperationen
  • Geeignet für Navigationsabfragen, wie das Auffinden spezifischer Beiträge

Einbettungsbasierter Abrufer (EBR):

  • Verwendet Two-Tower-Modellarchitektur
  • Abfrage-Einbettungsturm: Verarbeitet Abfragetexte und Nutzermerkmale, generiert Abfrage-Einbettungen
  • Beitrags-Einbettungsturm: Verarbeitet Beitragstexte und Autorenmerkmale, generiert Beitrags-Einbettungen
  • Verwendet multilingual-e5-Modell für Text-Einbettungen
  • Berechnet Abgleichscores durch Kosinus-Ähnlichkeit zwischen Abfrage und Beitrag

Schlüsselvorteile von EBR:

  • Semantischer Abgleich: Basiert auf Konzepten statt exaktem Schlüsselwortabgleich
  • Personalisierung: Kann personalisierte Ergebnisse basierend auf Suchereigenschaften zurückgeben
  • Zieloptimierung: Unterstützt Optimierung beliebiger Zielfunktionen

2. Mehrstufige Ranking-Schicht (Multi-stage Ranking Layer)

Die Ranking-Schicht verwendet ein zweistufiges Design zur Ausgewogenheit zwischen Effektivität und Effizienz:

L1-Ranking-Stufe:

  • Verwendet einfache Modelle zur vorläufigen Rangfolge tausender Kandidatenbeiträge
  • Wählt die besten hundert Kandidatenbeiträge für die nächste Stufe aus

L2-Ranking-Stufe:

  • Verwendet komplexe Modelle zur feinen Rangfolge von Kandidatenbeiträgen
  • Generiert endgültige Suchergebnisse

Die Ranking-Modellarchitektur enthält zwei Vorhersagemodelle:

  • Themenrelevanz-Vorhersagemodell: Eingabe von Abfrage- und Beitragstexten, Ausgabe von Relevanzscores
  • Long-dwell-Vorhersagemodell: Eingabe eines reichhaltigeren Merkmalssatzes, einschließlich:
    • Abfrage- und Beitragstexte
    • Paarweise Merkmale wie BM25-Abgleichscores
    • Abfrageeigenschaften (z.B. ob sie einen Jobtitel enthalten)
    • Beitragseigenschaften (z.B. Beitragspopularität)
    • Nutzereigenschaften (z.B. ob Jobsuchintention vorhanden ist)
    • Autorenmerkmale (z.B. Autoreneinfluss)
    • Nutzer-Autoren-Beziehungsmerkmale (z.B. ob Freunde)

Endgültige Score-Berechnungsformel:

score = α × on-topicness_score + (1-α) × long-dwell_score

wobei α als Regulierungsparameter durch Online-Experimente optimiert wird.

Technische Innovationspunkte

  1. Hybride Abrufstrategie: Kombiniert Vorteile exakten Abgleichs und semantischen Abgleichs
  2. Two-Tower-Modelldesign: Unterstützt Vorberechnung von Beitrags-Einbettungen, verbessert Abrufeffizienz erheblich
  3. Multi-Objective-Optimierung: Berücksichtigt gleichzeitig Inhaltsqualität und Nutzerengagement
  4. Geschichtete Architektur: Erreicht gutes Gleichgewicht zwischen Effizienz und Effektivität

Experimentelle Einrichtung

Datensatz

  • Verwendet historische Daten der LinkedIn Content-Suchmaschine
  • Trainingsdatenformat: (query, post, label) Tripel
  • Labels kombinieren Themenrelevanz- und Long-dwell-Metriken

Bewertungsmetriken

  1. Themenrelevanzrate (On-topic rate):
    • Verwendet GPT zur Bewertung der Top-10 zurückgegebenen Beiträge (1 = relevant und hochwertig, 0 = nicht relevant)
    • Berechnet den Anteil von Beiträgen mit Label 1
  2. Lange Verweilzeiten (Long-dwells):
    • Binäre Klassifizierung basierend auf Nutzer-Verweilzeit auf Beiträgen
    • Zählt Beiträge mit Label 1

Implementierungsdetails

  • Text-Einbettungsmodell: multilingual-e5
  • Einbettungsspeicher: Venice Key-Value-Speichersystem
  • Approximate Nearest Neighbor Search: Begrenzte Anzahl gescannter Beiträge zur Latenzsteuerung
  • Vorberechnungsoptimierung: Offline- und Near-line-Berechnung von Beitrags-Einbettungen

Experimentelle Ergebnisse

Hauptergebnisse

Die neue semantische Suchmaschine erzielte signifikante Leistungsverbesserungen:

  • Themenrelevanzrate: Verbesserung über 10%
  • Lange Verweilzeiten: Verbesserung über 10%
  • Website-Level-Auswirkung: Positive Auswirkung auf die Gesamtanzahl der LinkedIn-Sitzungen

Typische Anwendungsfälle

Die Suchmaschine kann nun komplexe natürlichsprachliche Anfragen effektiv verarbeiten, wie:

  • „how to ask for a raise?" (Wie fordert man eine Gehaltserhöhung an?)
  • „dropout in AI" (Abbruchquoten in der KI)

Diese Anfragen waren in traditionellen schlüsselwortbasierten Systemen oft schwierig zu befriedigen.

Verwandte Arbeiten

Das Paper konzentriert sich auf praktische Anwendungen von Suchsystemen auf Industrieebene, relevante Technologien umfassen:

  • Text-Einbettungstechnologie (multilingual-e5)
  • Two-Tower-Modellarchitektur
  • Mehrstufige Ranking-Systeme
  • Optimierung großflächiger Abrufsysteme

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Semantische Verständnisfähigkeiten sind für moderne Suchmaschinen entscheidend
  2. Hybride Abrufstrategien können sowohl exakte als auch semantische Abgleichsanforderungen erfüllen
  3. Multi-Objective-Optimierungsrahmen verbessern effektiv die Nutzererfahrung

Einschränkungen

  1. Die aktuelle Definition der Themenrelevanzmetrik ist relativ einfach und kann Qualitätserwartungen verschiedener Abfragetypen nicht vollständig erfassen
  2. Die Abhängigkeit von GPT für Qualitätsbewertung kann gewisse Einschränkungen aufweisen

Zukünftige Richtungen

Das Team plant:

  1. Verbesserung der Themenrelevanz-Bewertungsmetriken
  2. Einführung großer Sprachmodelle (LLM) in der Ranking-Schicht zur Realisierung gemeinsamer Aufmerksamkeitsmechanismen für Abfrage- und Beitragstexte
  3. Weitere Verbesserung der Tiefenverständnisfähigkeiten für Sprache

Tiefgehende Bewertung

Stärken

  1. Hoher praktischer Wert: Löst wichtige Probleme in realen Geschäftsfällen
  2. Vernünftige Architekturgestaltung: Zweischichtige Architektur balanciert Effektivität und Effizienz effektiv
  3. Ausgereifte technische Lösung: Berücksichtigt umfassend technische Herausforderungen großflächiger Bereitstellung
  4. Vollständiges Bewertungssystem: Etabliert duales Bewertungsrahmen für Qualität und Engagement
  5. Signifikante Effekte: Erreicht Metrik-Verbesserungen über 10%

Mängel

  1. Begrenzte technische Innovation: Hauptsächlich Ingenieuranwendung bestehender Technologien
  2. Einschränkungen der Bewertungsmethode: GPT-basierte Bewertung kann Verzerrungen einführen
  3. Unzureichende Vergleichsexperimente: Mangel an detaillierten Vergleichen mit anderen semantischen Suchmethoden
  4. Fehlende theoretische Analyse: Keine tiefgehende theoretische Analyse und Ablationsstudien

Auswirkungen

  1. Industrieller Wert: Bietet praktische Referenzen für großflächige semantische Suchsysteme
  2. Technologieverbreitung: Demonstriert praktische Anwendungseffekte semantischen Verständnisses in Suchmaschinen
  3. Erfahrungsaustausch: Bietet wertvolle Ingenieurpraxis-Erfahrungen

Anwendungsszenarien

Diese Methode eignet sich für:

  • Großflächige Content-Suchplattformen
  • Suchsysteme, die komplexe natürlichsprachliche Anfragen verarbeiten müssen
  • Suchanwendungen mit hohen Personalisierungsanforderungen
  • Suchszenarien, die mehrere Optimierungsziele ausgleichen müssen

Referenzen

Das Paper zitiert die folgenden Schlüsseltechnologien und Werkzeuge:

  1. Apache Samza - Stream-Processing-Framework
  2. MTEB Leaderboard - Text-Einbettungs-Benchmark
  3. Venice - LinkedIns Datenspeicherplattform
  4. Multilingual E5 - Mehrsprachiges Text-Einbettungsmodell

Zusammenfassung: Dies ist ein typischer Industrietechnologie-Bericht, der sich auf die Weitergabe von LinkedIns Ingenieurpraxis-Erfahrungen im Bereich semantische Suche konzentriert. Obwohl die technische Innovation relativ begrenzt ist, machen sein vollständiges Systemdesign, signifikante Effektverbesserungen und tiefgehende Berücksichtigung technischer Herausforderungen ihn für die Industrie von großem Referenzwert.