2025-11-12T22:49:10.680556

Query Brand Entity Linking in E-Commerce Search

Liu, Nag
In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
academic

Abfrage-Markenentitätsverknüpfung in der E-Commerce-Suche

Grundinformationen

  • Papier-ID: 2502.01555
  • Titel: Query Brand Entity Linking in E-Commerce Search
  • Autoren: Dong Liu, Sreyashi Nag (Amazon)
  • Klassifizierung: cs.IR cs.AI cs.LG
  • Veröffentlichungszeitpunkt/Konferenz: 2025 (arXiv-Preprint)
  • Papierlink: https://arxiv.org/abs/2502.01555

Zusammenfassung

Dieses Papier befasst sich mit dem Problem der Markenentitätsverknüpfung in E-Commerce-Suchanfragen. Die Entitätsverknüpfungsaufgabe wird auf zwei Wegen durchgeführt: 1) ein zweistufiger Prozess, der Entitätserwähnungserkennung und Entitätsdisambiguierung umfasst; 2) eine End-to-End-Verknüpfungsmethode, die direkt Zielentitäten aus dem Eingabetext extrahiert. Die Aufgabe stellt einzigartige Herausforderungen dar: Anfragen sind extrem kurz (durchschnittlich 2,4 Wörter), weisen keine natürliche Sprachstruktur auf und erfordern die Verarbeitung eines großen Markenraums. Der Artikel schlägt eine zweistufige Methode vor, die benannte Entitätserkennung mit Matching kombiniert, sowie eine neuartige End-to-End-Lösung mit extremer Mehrklassen-Klassifizierung. Die Wirksamkeit der Lösung wird durch Offline-Benchmarks und Online-A/B-Tests validiert.

Forschungshintergrund und Motivation

Problemdefinition

In der E-Commerce-Suche ist die Markenerkennung das zweiwichtigste Attribut nach dem Produkttyp. Die korrekte Identifizierung von Markennamen – ob direkt oder indirekt erwähnt – ist ein wesentlicher Bestandteil des Verständnisses von Suchanfragen und entscheidend für ein gutes Einkaufserlebnis.

Herausforderungsanalyse

  1. Abfrageeigenschaften-Einschränkungen: E-Commerce-Anfragen sind extrem kurz (durchschnittlich 2,4 Wörter), weisen keine natürliche Sprachstruktur auf und Open-Source-NLP-Modelle können solche Abfrageverteilungen schwer verarbeiten
  2. Großer Markenraum: Erfordert die Verarbeitung von Zehntausenden eindeutiger Marken mit ständig neuen Hinzufügungen
  3. Vielfaltsprobleme:
    • Vereinheitlichung von Markennamen-Varianten in verschiedenen Sprachen und Regionen
    • Verschiedene Oberflächenformen derselben Marke (Abkürzung vs. vollständiger Name)
    • Erkennung von Mutter- und Tochtermarkenbeziehungen

Forschungsmotivation

Bestehende zeichenfolgenbasierte Markenerkennung hat Grenzen. Es ist notwendig, Markenkonzepte in einem einzigen Namensraum zu globalen Markenentitäten zu vereinheitlichen, um eine einheitliche Erkennung über Sprachen, Geschäfte und Oberflächenformen hinweg zu erreichen.

Kernbeiträge

  1. Konstruktion eines zweistufigen Entitätsverknüpfungsmodells: Ein Markenentitäts-Vorhersage-Framework, das vortrainierte NER-Modelle und Oberflächenform-Matching kombiniert
  2. Erkundung von Matching-Techniken: Entwicklung von lexikalischen und semantischen Matching-Techniken sowie Vorschlag eines produkttyp-basierten Filterschritts zur Optimierung der Entitätsvorhersage für großflächige Markenausgaberäume
  3. Vorschlag eines End-to-End-Extremklassifizierungsmodells: Direkte Vorhersage relevanter Markenentitäten aus Suchanfragen mit Fusion mit dem zweistufigen Modell
  4. Umfassende Validierung: Validierung der Lösung durch großflächige Offline-Experiment-Benchmarks und Online-A/B-Tests

Methodische Details

Aufgabendefinition

Gegeben eine Markensuche-Abfrage (z.B. „ running shoes"), werden Markenentitäten identifiziert und mit eindeutigen Markenentitäten in der Markendatenbank verknüpft. Die Eingabe ist der ursprüngliche Abfragetext, die Ausgabe ist die entsprechende Markenentitäts-ID.

Modellarchitektur

1. Zweistufiges Framework

Grundlegende zweistufige Methode (NER + exaktes lexikalisches Matching):

  • Erste Stufe: Verwendung des MetaTS-NER-Modells zur Extraktion von Markenerwähnungen
    m = f_NER(q)
    
  • Zweite Stufe: Exaktes String-Matching über ein statisches Wörterbuch
    E_ID = g(m)
    
  • Filterschritt: Disambiguierung basierend auf Produkttyp
    e = h(E_ID, q, PT_q)
    

Verbesserte zweistufige Methode (NER + PECOS semantisches Matching):

  • Modellierung des Matching-Schritts als extremes Mehrklassen-Problem
  • Verwendung des PECOS-Frameworks zur Verarbeitung großflächiger Markenentitätsräume (ca. 60.000 Entitäten)
  • Ausgabe von Markenentitäten und deren Relevanzscores: (E_ID, S) = g_M2E(m)

2. End-to-End-Framework (Q2E-PECOS)

Direkte Vorhersage von Markenentitäten aus Abfragen, um Fehlerfortpflanzung in der NER-Phase zu vermeiden:

(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)

Schlüsselmerkmale:

  • Hinzufügen einer NIL-Klasse zur Verarbeitung von Nicht-Marken-Abfragen
  • Zeitkomplexität: O(b × log L), wobei b die Beam-Größe und L die Anzahl der Markenentitäten ist
  • Raumkomplexität: von O(d × L) auf O(d × log L) reduziert

3. Fusionsframework

Kombination der Vorteile der zweistufigen exakten Matching- und End-to-End-Methoden:

  • Parallele Ausführung beider Methoden
  • Priorisierung von exakten Matching-Ergebnissen zur Gewährleistung hoher Präzision
  • Rückgriff auf Q2E-PECOS-Ergebnisse zur Verbesserung der Abdeckung

Technische Innovationen

  1. PECOS-Anwendung beim Brand Linking: Erste Anwendung des extremen Mehrklassen-Klassifizierungs-Frameworks auf E-Commerce-Markenentitätsverknüpfung
  2. Produkttyp-gestützte Disambiguierung: Nutzung von Produkttyp-Informationen aus Abfragen zur Markenentitäts-Disambiguierung
  3. Mehrsprachige Unterstützung: Unterstützung der Markenerkennung in 13 Sprachen
  4. Fusionsstrategie: Geschickte Kombination von Hochpräzisions- und Hochrückruf-Methoden

Experimentelle Einrichtung

Datensätze

DatensatzGröße
Anzahl der Markenentitäten61.697
Brand2entity616.974
Stark annotierte Daten (SL)806.972
Schwach annotierte Daten (WL)1.308.816
Testdaten28.439

Datenzusammensetzung:

  1. Brand2entity (B2E): Internes Wörterbuch von Markennamen-Entitäts-Paaren
  2. Stark annotierte Daten (SL): Manuell annotierte Suchabfrage-Daten in 13 Sprachen
  3. Schwach annotierte Daten (WL): Schwach überwachte Daten aus historischen Abfrage-Produkt-Interaktionen

Bewertungsmetriken

  • Recall: Recall = |C| / |L_single|
  • Präzision: Precision = |C| / |P_single|
  • Abdeckung: Coverage = |P_single| / |T|
  • F1-Score: Harmonisches Mittel

Wobei C die Menge korrekter Vorhersagen ist, L_single die Abfragen mit einzelnen Markenentitäts-Labels und P_single die Modellvorhersagen für Abfragen mit einzelnen Markenentitäten sind.

Vergleichsmethoden

  1. NER + exaktes lexikalisches Matching: Baseline-Zweistufenmethode
  2. NER + M2E-PECOS: Zweistufenmethode mit semantischem Matching
  3. Bi-encoder: Dual-Encoder-Baseline mit Qwen3 Embedding 0.6B
  4. Q2E-PECOS: End-to-End-PECOS-Methode
  5. Fusionsmodell: Verschiedene Kombinationen der Hybridmethode

Experimentelle Ergebnisse

Hauptergebnisse

MethodeTrainingsdatenFusionGruppe-1Gruppe-2
Abdeckung/Recall/Präzision/F1Abdeckung/Recall/Präzision/F1
NER + exaktes Matching✓ ✓58,28/64,66/97,22/77,6770,16/86,21/99,15/92,23
Q2E-PECOS✓ ✓ ✓70,98/75,26/96,13/84,4280,77/94,71/98,92/96,77
Q2E-PECOS✓ ✓ ✓75,31/77,35/94,93/85,2485,09/94,64/98,55/96,56

Schlüsselergebnisse:

  • End-to-End Q2E-PECOS verbessert Abdeckung und Recall erheblich
  • Fusionsstrategie erhöht Recall bei Beibehaltung hoher Präzision
  • Schwach annotierte Daten zeigen deutliche Leistungsverbesserungen für End-to-End-Modelle

Mehrsprachige Leistungsanalyse

Signifikante Leistungsunterschiede zwischen Sprachen:

  • Hochressourcen-Sprachen (Englisch, Spanisch): Alle Methoden zeigen gute Leistung
  • Niedrigressourcen-Sprachen (Japanisch): NER + exaktes Matching hat nur 19,03% Abdeckung
  • Fusionsmethode: Balanciert Präzision und Recall in allen Sprachen

Falsch-Positiv-Analyse

Falsch-Positiv-Rate auf 85K Nicht-Marken-Abfragen:

  • NER + exaktes Matching: 1,177%
  • Q2E-PECOS (mit schwacher Annotation): 6,550%

Obwohl die End-to-End-Methode eine höhere Falsch-Positiv-Rate aufweist, ist sie angesichts der Gesamtleistungsverbesserung noch akzeptabel.

Online-A/B-Testergebnisse

MetrikGruppe-1-ShopGruppe-2-Shop
Markenentitäts-Recall+11,00%+5,44%
Kundenengagement+0,02%-
Unmittelbarer Gewinnbeitrag+0,03%-

Online-Tests bestätigen den praktischen Geschäftswert der Fusionslösung.

Verwandte Arbeiten

Traditionelle Entitätsverknüpfungsmethoden

  • Zweistufiges Design: Entitätserkennung + Entitätsdisambiguierung
  • Kandidatengenerierung: Oberflächenform-Matching, Alias-Erweiterung, Prior-Wahrscheinlichkeits-Matching
  • Kandidaten-Ranking: Bearbeitungsdistanz, semantische Vektor-Ähnlichkeit

End-to-End-Methoden

  • Gemeinsames Lernen: Gleichzeitige Erkennung und Disambiguierung
  • Sequenz-Tagging: BERT-basierte Token-Klassifizierung
  • Autoregressives Generieren: Token-für-Token-Generierung von Entitätsnamen

Besonderheiten des E-Commerce-Bereichs

  • Abfrageeigenschaften: Kurz, verrauscht, mehrdeutig
  • Anwendungsszenarien: Produktabruf, Abfrage-Umschreiben, Verbesserung der Suchergebnisqualität
  • Technische Herausforderungen: Mangel an lexikalischem Kontext, großflächige Wissensdatenbank

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

  1. Vorteile der End-to-End-Methode: Q2E-PECOS übertrifft traditionelle zweistufige Methoden deutlich bei Abdeckung und Recall
  2. Effektivität der Fusionsstrategie: Die Fusionsmethode, die hochpräzises lexikalisches Matching mit hochrückruf-semantischem Matching kombiniert, zeigt die beste Leistung
  3. Datenwichtigkeit: Schwach annotierte Daten sind entscheidend für die Leistungsverbesserung von End-to-End-Modellen
  4. Praktischer Wert: Online-A/B-Tests bestätigen den kommerziellen Wert der Methode

Einschränkungen

  1. Falsch-Positiv-Rate: End-to-End-Methode hat höhere Falsch-Positiv-Rate bei Nicht-Marken-Abfragen
  2. Sprachunterschiede: Leistung bei Niedrigressourcen-Sprachen hat noch Verbesserungspotenzial
  3. Rechenkomplexität: Fusionsmethode erfordert parallele Ausführung mehrerer Modelle
  4. Datenabhängigkeit: Erfordert große Mengen schwach annotierter Daten für End-to-End-Training

Zukünftige Richtungen

  1. Modelloptimierung: Weitere Reduzierung der Falsch-Positiv-Rate und Verbesserung der Leistung bei Niedrigressourcen-Sprachen
  2. Effizienzverbesserung: Optimierung der Rechenkomplexität und Reduzierung der Inferenzlatenz
  3. Cross-Domain-Transfer: Erweiterung der Methode auf andere E-Commerce-Attributextraktionsaufgaben
  4. Dynamische Aktualisierung: Verarbeitung von Echtzeit-Hinzufügungen und Aktualisierungen neuer Marken

Tiefgreifende Bewertung

Stärken

  1. Problemwichtigkeit: Löst ein Kernproblem in der E-Commerce-Suche mit wichtigem praktischem Wert
  2. Methodische Innovation: Erste Anwendung des PECOS-Extremklassifizierungs-Frameworks auf Markenentitätsverknüpfung
  3. Umfassende Experimente: Abdeckung mehrsprachiger Methoden, Vergleiche und Online-A/B-Test-Validierung
  4. Ingenieur-Praktikabilität: Berücksichtigung des Effizienz- und Präzisions-Gleichgewichts bei der praktischen Bereitstellung
  5. Reichhaltige Daten: Verwendung großflächiger echter E-Commerce-Daten

Mängel

  1. Unzureichende theoretische Analyse: Mangel an theoretischer Erklärung, warum End-to-End-Methoden effektiver sind
  2. Begrenzte Ablationsstudien: Unzureichende Analyse der Beiträge einzelner Komponenten
  3. Falsch-Positiv-Problem: Höhere Falsch-Positiv-Rate der End-to-End-Methode erfordert weitere Optimierung
  4. Unzureichende Komplexitätsanalyse: Rechenkomplexität der Fusionsmethode nicht ausreichend detailliert analysiert

Auswirkungen

  1. Akademischer Beitrag: Bietet neue technische Lösungen für das E-Commerce-NLP-Feld
  2. Praktischer Wert: Bereits bei Amazon bereitgestellt, Geschäftswert nachgewiesen
  3. Reproduzierbarkeit: Detaillierte experimentelle Einrichtung und Datenbeschreibung bereitgestellt
  4. Inspirationswert: Bietet Referenzen für andere E-Commerce-Attributextraktionsaufgaben

Anwendungsszenarien

  1. E-Commerce-Plattformen: Markenerkennung in verschiedenen E-Commerce-Suchmaschinen
  2. Mehrsprachige Umgebungen: Globalisierte E-Commerce-Plattformen mit mehrsprachiger Unterstützung
  3. Großflächige Anwendungen: Echtzeitsysteme, die massive Abfragen verarbeiten müssen
  4. Attributextraktion: Erweiterbar auf Entitätsverknüpfungsaufgaben für andere Produktattribute

Referenzen

Das Papier zitiert mehrere wichtige verwandte Arbeiten, einschließlich:

  • Originalarbeiten zum PECOS-Framework Yu et al., 2022
  • MetaTS-NER-Mehrsprachiges Sequenz-Tagging-Modell Li et al., 2021
  • Traditionelle Entitätsverknüpfungsmethoden Cao et al., 2017; Le & Titov, 2019
  • E-Commerce-Abfrage-Verständnis verwandte Arbeiten Kozareva et al., 2016; Manchanda et al., 2020

Gesamtbewertung: Dies ist ein hochqualitatives Anwendungsforschungspapier, das ein wichtiges praktisches Problem in der E-Commerce-Suche löst. Die Methode zeigt starke Innovation, umfassende experimentelle Validierung, insbesondere mit Online-A/B-Tests, die praktischen Wert nachweisen. Obwohl es Raum für Verbesserungen in der theoretischen Analyse und einigen technischen Details gibt, ist es insgesamt ein wichtiger Beitrag zum E-Commerce-NLP-Feld.