2025-11-12T22:49:10.680556

Query Brand Entity Linking in E-Commerce Search

Liu, Nag

In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.

academic

Abfrage-Markenentitätsverknüpfung in der E-Commerce-Suche

Grundinformationen

Papier-ID: 2502.01555
Titel: Query Brand Entity Linking in E-Commerce Search
Autoren: Dong Liu, Sreyashi Nag (Amazon)
Klassifizierung: cs.IR cs.AI cs.LG
Veröffentlichungszeitpunkt/Konferenz: 2025 (arXiv-Preprint)
Papierlink: https://arxiv.org/abs/2502.01555

Zusammenfassung

Dieses Papier befasst sich mit dem Problem der Markenentitätsverknüpfung in E-Commerce-Suchanfragen. Die Entitätsverknüpfungsaufgabe wird auf zwei Wegen durchgeführt: 1) ein zweistufiger Prozess, der Entitätserwähnungserkennung und Entitätsdisambiguierung umfasst; 2) eine End-to-End-Verknüpfungsmethode, die direkt Zielentitäten aus dem Eingabetext extrahiert. Die Aufgabe stellt einzigartige Herausforderungen dar: Anfragen sind extrem kurz (durchschnittlich 2,4 Wörter), weisen keine natürliche Sprachstruktur auf und erfordern die Verarbeitung eines großen Markenraums. Der Artikel schlägt eine zweistufige Methode vor, die benannte Entitätserkennung mit Matching kombiniert, sowie eine neuartige End-to-End-Lösung mit extremer Mehrklassen-Klassifizierung. Die Wirksamkeit der Lösung wird durch Offline-Benchmarks und Online-A/B-Tests validiert.

Forschungshintergrund und Motivation

Problemdefinition

In der E-Commerce-Suche ist die Markenerkennung das zweiwichtigste Attribut nach dem Produkttyp. Die korrekte Identifizierung von Markennamen – ob direkt oder indirekt erwähnt – ist ein wesentlicher Bestandteil des Verständnisses von Suchanfragen und entscheidend für ein gutes Einkaufserlebnis.

Herausforderungsanalyse

Abfrageeigenschaften-Einschränkungen: E-Commerce-Anfragen sind extrem kurz (durchschnittlich 2,4 Wörter), weisen keine natürliche Sprachstruktur auf und Open-Source-NLP-Modelle können solche Abfrageverteilungen schwer verarbeiten
Großer Markenraum: Erfordert die Verarbeitung von Zehntausenden eindeutiger Marken mit ständig neuen Hinzufügungen
Vielfaltsprobleme:
- Vereinheitlichung von Markennamen-Varianten in verschiedenen Sprachen und Regionen
- Verschiedene Oberflächenformen derselben Marke (Abkürzung vs. vollständiger Name)
- Erkennung von Mutter- und Tochtermarkenbeziehungen

Forschungsmotivation

Bestehende zeichenfolgenbasierte Markenerkennung hat Grenzen. Es ist notwendig, Markenkonzepte in einem einzigen Namensraum zu globalen Markenentitäten zu vereinheitlichen, um eine einheitliche Erkennung über Sprachen, Geschäfte und Oberflächenformen hinweg zu erreichen.

Kernbeiträge

Konstruktion eines zweistufigen Entitätsverknüpfungsmodells: Ein Markenentitäts-Vorhersage-Framework, das vortrainierte NER-Modelle und Oberflächenform-Matching kombiniert
Erkundung von Matching-Techniken: Entwicklung von lexikalischen und semantischen Matching-Techniken sowie Vorschlag eines produkttyp-basierten Filterschritts zur Optimierung der Entitätsvorhersage für großflächige Markenausgaberäume
Vorschlag eines End-to-End-Extremklassifizierungsmodells: Direkte Vorhersage relevanter Markenentitäten aus Suchanfragen mit Fusion mit dem zweistufigen Modell
Umfassende Validierung: Validierung der Lösung durch großflächige Offline-Experiment-Benchmarks und Online-A/B-Tests

Methodische Details

Aufgabendefinition

Gegeben eine Markensuche-Abfrage (z.B. „ running shoes"), werden Markenentitäten identifiziert und mit eindeutigen Markenentitäten in der Markendatenbank verknüpft. Die Eingabe ist der ursprüngliche Abfragetext, die Ausgabe ist die entsprechende Markenentitäts-ID.

Modellarchitektur

1. Zweistufiges Framework

Grundlegende zweistufige Methode (NER + exaktes lexikalisches Matching):

Erste Stufe: Verwendung des MetaTS-NER-Modells zur Extraktion von Markenerwähnungen
```
m = f_NER(q)
```
Zweite Stufe: Exaktes String-Matching über ein statisches Wörterbuch
```
E_ID = g(m)
```
Filterschritt: Disambiguierung basierend auf Produkttyp
```
e = h(E_ID, q, PT_q)
```

Verbesserte zweistufige Methode (NER + PECOS semantisches Matching):

Modellierung des Matching-Schritts als extremes Mehrklassen-Problem
Verwendung des PECOS-Frameworks zur Verarbeitung großflächiger Markenentitätsräume (ca. 60.000 Entitäten)
Ausgabe von Markenentitäten und deren Relevanzscores: (E_ID, S) = g_M2E(m)

2. End-to-End-Framework (Q2E-PECOS)

Direkte Vorhersage von Markenentitäten aus Abfragen, um Fehlerfortpflanzung in der NER-Phase zu vermeiden:

(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)

Schlüsselmerkmale:

Hinzufügen einer NIL-Klasse zur Verarbeitung von Nicht-Marken-Abfragen
Zeitkomplexität: O(b × log L), wobei b die Beam-Größe und L die Anzahl der Markenentitäten ist
Raumkomplexität: von O(d × L) auf O(d × log L) reduziert

3. Fusionsframework

Kombination der Vorteile der zweistufigen exakten Matching- und End-to-End-Methoden:

Parallele Ausführung beider Methoden
Priorisierung von exakten Matching-Ergebnissen zur Gewährleistung hoher Präzision
Rückgriff auf Q2E-PECOS-Ergebnisse zur Verbesserung der Abdeckung

Technische Innovationen

PECOS-Anwendung beim Brand Linking: Erste Anwendung des extremen Mehrklassen-Klassifizierungs-Frameworks auf E-Commerce-Markenentitätsverknüpfung
Produkttyp-gestützte Disambiguierung: Nutzung von Produkttyp-Informationen aus Abfragen zur Markenentitäts-Disambiguierung
Mehrsprachige Unterstützung: Unterstützung der Markenerkennung in 13 Sprachen
Fusionsstrategie: Geschickte Kombination von Hochpräzisions- und Hochrückruf-Methoden

Experimentelle Einrichtung

Datensätze

Datensatz	Größe
Anzahl der Markenentitäten	61.697
Brand2entity	616.974
Stark annotierte Daten (SL)	806.972
Schwach annotierte Daten (WL)	1.308.816
Testdaten	28.439

Datenzusammensetzung:

Brand2entity (B2E): Internes Wörterbuch von Markennamen-Entitäts-Paaren
Stark annotierte Daten (SL): Manuell annotierte Suchabfrage-Daten in 13 Sprachen
Schwach annotierte Daten (WL): Schwach überwachte Daten aus historischen Abfrage-Produkt-Interaktionen

Bewertungsmetriken

Recall: Recall = |C| / |L_single|
Präzision: Precision = |C| / |P_single|
Abdeckung: Coverage = |P_single| / |T|
F1-Score: Harmonisches Mittel

Wobei C die Menge korrekter Vorhersagen ist, L_single die Abfragen mit einzelnen Markenentitäts-Labels und P_single die Modellvorhersagen für Abfragen mit einzelnen Markenentitäten sind.

Vergleichsmethoden

NER + exaktes lexikalisches Matching: Baseline-Zweistufenmethode
NER + M2E-PECOS: Zweistufenmethode mit semantischem Matching
Bi-encoder: Dual-Encoder-Baseline mit Qwen3 Embedding 0.6B
Q2E-PECOS: End-to-End-PECOS-Methode
Fusionsmodell: Verschiedene Kombinationen der Hybridmethode

Experimentelle Ergebnisse

Hauptergebnisse

Methode	Trainingsdaten	Fusion	Gruppe-1	Gruppe-2
			Abdeckung/Recall/Präzision/F1	Abdeckung/Recall/Präzision/F1
NER + exaktes Matching	✓ ✓		58,28/64,66/97,22/77,67	70,16/86,21/99,15/92,23
Q2E-PECOS	✓ ✓ ✓		70,98/75,26/96,13/84,42	80,77/94,71/98,92/96,77
Q2E-PECOS	✓ ✓ ✓	✓	75,31/77,35/94,93/85,24	85,09/94,64/98,55/96,56

Schlüsselergebnisse:

End-to-End Q2E-PECOS verbessert Abdeckung und Recall erheblich
Fusionsstrategie erhöht Recall bei Beibehaltung hoher Präzision
Schwach annotierte Daten zeigen deutliche Leistungsverbesserungen für End-to-End-Modelle

Mehrsprachige Leistungsanalyse

Signifikante Leistungsunterschiede zwischen Sprachen:

Hochressourcen-Sprachen (Englisch, Spanisch): Alle Methoden zeigen gute Leistung
Niedrigressourcen-Sprachen (Japanisch): NER + exaktes Matching hat nur 19,03% Abdeckung
Fusionsmethode: Balanciert Präzision und Recall in allen Sprachen

Falsch-Positiv-Analyse

Falsch-Positiv-Rate auf 85K Nicht-Marken-Abfragen:

NER + exaktes Matching: 1,177%
Q2E-PECOS (mit schwacher Annotation): 6,550%

Obwohl die End-to-End-Methode eine höhere Falsch-Positiv-Rate aufweist, ist sie angesichts der Gesamtleistungsverbesserung noch akzeptabel.

Online-A/B-Testergebnisse

Metrik	Gruppe-1-Shop	Gruppe-2-Shop
Markenentitäts-Recall	+11,00%	+5,44%
Kundenengagement	+0,02%	-
Unmittelbarer Gewinnbeitrag	+0,03%	-

Online-Tests bestätigen den praktischen Geschäftswert der Fusionslösung.

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

Vorteile der End-to-End-Methode: Q2E-PECOS übertrifft traditionelle zweistufige Methoden deutlich bei Abdeckung und Recall
Effektivität der Fusionsstrategie: Die Fusionsmethode, die hochpräzises lexikalisches Matching mit hochrückruf-semantischem Matching kombiniert, zeigt die beste Leistung
Datenwichtigkeit: Schwach annotierte Daten sind entscheidend für die Leistungsverbesserung von End-to-End-Modellen
Praktischer Wert: Online-A/B-Tests bestätigen den kommerziellen Wert der Methode

Einschränkungen

Falsch-Positiv-Rate: End-to-End-Methode hat höhere Falsch-Positiv-Rate bei Nicht-Marken-Abfragen
Sprachunterschiede: Leistung bei Niedrigressourcen-Sprachen hat noch Verbesserungspotenzial
Rechenkomplexität: Fusionsmethode erfordert parallele Ausführung mehrerer Modelle
Datenabhängigkeit: Erfordert große Mengen schwach annotierter Daten für End-to-End-Training

Zukünftige Richtungen

Modelloptimierung: Weitere Reduzierung der Falsch-Positiv-Rate und Verbesserung der Leistung bei Niedrigressourcen-Sprachen
Effizienzverbesserung: Optimierung der Rechenkomplexität und Reduzierung der Inferenzlatenz
Cross-Domain-Transfer: Erweiterung der Methode auf andere E-Commerce-Attributextraktionsaufgaben
Dynamische Aktualisierung: Verarbeitung von Echtzeit-Hinzufügungen und Aktualisierungen neuer Marken

Tiefgreifende Bewertung

Stärken

Problemwichtigkeit: Löst ein Kernproblem in der E-Commerce-Suche mit wichtigem praktischem Wert
Methodische Innovation: Erste Anwendung des PECOS-Extremklassifizierungs-Frameworks auf Markenentitätsverknüpfung
Umfassende Experimente: Abdeckung mehrsprachiger Methoden, Vergleiche und Online-A/B-Test-Validierung
Ingenieur-Praktikabilität: Berücksichtigung des Effizienz- und Präzisions-Gleichgewichts bei der praktischen Bereitstellung
Reichhaltige Daten: Verwendung großflächiger echter E-Commerce-Daten

Mängel

Unzureichende theoretische Analyse: Mangel an theoretischer Erklärung, warum End-to-End-Methoden effektiver sind
Begrenzte Ablationsstudien: Unzureichende Analyse der Beiträge einzelner Komponenten
Falsch-Positiv-Problem: Höhere Falsch-Positiv-Rate der End-to-End-Methode erfordert weitere Optimierung
Unzureichende Komplexitätsanalyse: Rechenkomplexität der Fusionsmethode nicht ausreichend detailliert analysiert

Auswirkungen

Akademischer Beitrag: Bietet neue technische Lösungen für das E-Commerce-NLP-Feld
Praktischer Wert: Bereits bei Amazon bereitgestellt, Geschäftswert nachgewiesen
Reproduzierbarkeit: Detaillierte experimentelle Einrichtung und Datenbeschreibung bereitgestellt
Inspirationswert: Bietet Referenzen für andere E-Commerce-Attributextraktionsaufgaben

Anwendungsszenarien

E-Commerce-Plattformen: Markenerkennung in verschiedenen E-Commerce-Suchmaschinen
Mehrsprachige Umgebungen: Globalisierte E-Commerce-Plattformen mit mehrsprachiger Unterstützung
Großflächige Anwendungen: Echtzeitsysteme, die massive Abfragen verarbeiten müssen
Attributextraktion: Erweiterbar auf Entitätsverknüpfungsaufgaben für andere Produktattribute

Referenzen

Das Papier zitiert mehrere wichtige verwandte Arbeiten, einschließlich:

Originalarbeiten zum PECOS-Framework Yu et al., 2022
MetaTS-NER-Mehrsprachiges Sequenz-Tagging-Modell Li et al., 2021
Traditionelle Entitätsverknüpfungsmethoden Cao et al., 2017; Le & Titov, 2019
E-Commerce-Abfrage-Verständnis verwandte Arbeiten Kozareva et al., 2016; Manchanda et al., 2020

Gesamtbewertung: Dies ist ein hochqualitatives Anwendungsforschungspapier, das ein wichtiges praktisches Problem in der E-Commerce-Suche löst. Die Methode zeigt starke Innovation, umfassende experimentelle Validierung, insbesondere mit Online-A/B-Tests, die praktischen Wert nachweisen. Obwohl es Raum für Verbesserungen in der theoretischen Analyse und einigen technischen Details gibt, ist es insgesamt ein wichtiger Beitrag zum E-Commerce-NLP-Feld.