In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
academic
Liaison d'Entités de Marque de Requête dans la Recherche E-Commerce
Cet article aborde le problème de la liaison d'entités de marque dans les requêtes de recherche e-commerce. La tâche de liaison d'entités est réalisée de deux manières : 1) un processus en deux étapes comprenant la détection de mentions d'entités et la désambiguïsation d'entités ; 2) une méthode de liaison de bout en bout qui extrait directement l'entité cible du texte d'entrée. Cette tâche présente des défis uniques : les requêtes sont extrêmement courtes (moyenne de 2,4 mots), manquent de structure de langage naturel, et nécessitent de traiter un espace de marques à grande échelle. L'article propose une méthode en deux étapes combinant la reconnaissance d'entités nommées avec l'appariement, ainsi qu'une solution novatrice de bout en bout utilisant la classification multi-classe extrême. L'efficacité de la solution est validée par des tests de référence hors ligne et des tests A/B en ligne.
Dans la recherche e-commerce, l'identification de la marque est le deuxième attribut le plus important après le type de produit. L'identification correcte des noms de marque (qu'ils soient mentionnés directement ou indirectement) est un élément crucial de la compréhension des requêtes de recherche et est essentielle pour offrir une bonne expérience d'achat.
Limitations des caractéristiques de requête : Les requêtes e-commerce sont extrêmement courtes (moyenne de 2,4 mots), manquent de structure de langage naturel, et les modèles NLP open-source ont du mal à traiter cette distribution de requêtes
Espace de marques massif : Nécessite de traiter des centaines de milliers de marques uniques, avec de nouvelles marques s'ajoutant continuellement
Problèmes de diversité :
Unification des variantes de noms de marque dans différentes langues et régions
Différentes formes de surface pour une même marque (abréviations vs noms complets)
Reconnaissance des relations entre marques mères et sous-marques
Les méthodes existantes de reconnaissance de marques basées sur les chaînes de caractères présentent des limitations. Il est nécessaire d'unifier les concepts de marque dans un espace de noms unique d'entités de marques globales, permettant une reconnaissance unifiée entre les langues, les magasins et les formes de surface.
Construction d'un modèle de liaison d'entités en deux étapes : Cadre de prédiction d'entités de marque combinant un modèle NER pré-entraîné et l'appariement de formes de surface
Exploration de techniques d'appariement : Développement de techniques d'appariement lexical et sémantique, avec proposition d'une étape de filtrage basée sur le type de produit pour l'optimisation de la prédiction d'entités dans l'espace de sortie de marques à grande échelle
Proposition d'un modèle de classification multi-classe extrême de bout en bout : Prédiction directe d'entités de marque pertinentes à partir de requêtes de recherche, fusionnée avec le modèle en deux étapes
Validation complète : Vérification de l'efficacité de la solution par des tests de référence expérimentaux hors ligne à grande échelle et des tests A/B en ligne
Étant donné une requête de recherche de marque (par exemple, « running shoes »), identifier et lier l'entité de marque unique correspondante dans la base de données de marques. L'entrée est le texte de requête brut, la sortie est l'ID d'entité de marque correspondant.
Application de PECOS à la liaison de marques : Première application du cadre de classification multi-classe extrême à la liaison d'entités de marques e-commerce
Désambiguïsation assistée par type de produit : Utilisation des informations de type de produit de la requête pour la désambiguïsation d'entités de marques
Support multilingue : Reconnaissance de marques dans 13 langues
Stratégie de fusion : Combinaison astucieuse de méthodes à haute précision et à haut rappel
Où C est l'ensemble des prédictions correctes, L_single est l'ensemble des requêtes avec étiquette d'entité de marque unique, et P_single est l'ensemble des requêtes prédites avec entité de marque unique par le modèle.
Bien que le taux de faux positifs de la méthode de bout en bout soit plus élevé, il reste acceptable compte tenu de l'amélioration globale des performances.
Avantages de la méthode de bout en bout : Q2E-PECOS surpasse significativement la méthode traditionnelle en deux étapes en termes de couverture et de rappel
Efficacité de la stratégie de fusion : La méthode de fusion combinant l'appariement lexical à haute précision et l'appariement sémantique à haut rappel offre les meilleures performances
Importance des données : Les données faiblement annotées sont essentielles pour améliorer les performances du modèle de bout en bout
Valeur pratique : Les tests A/B en ligne confirment la valeur commerciale de la méthode
L'article cite plusieurs travaux connexes importants, notamment :
L'article original du cadre PECOS Yu et al., 2022
Le modèle d'étiquetage de séquence multilingue MetaTS-NER Li et al., 2021
Les méthodes traditionnelles de liaison d'entités Cao et al., 2017 ; Le & Titov, 2019
Les travaux connexes sur la compréhension des requêtes e-commerce Kozareva et al., 2016 ; Manchanda et al., 2020
Évaluation Globale : Cet article est un travail de recherche appliquée de haute qualité qui résout un problème pratique important dans la recherche e-commerce. La méthode présente une forte innovativité, la validation expérimentale est complète, et les tests A/B en ligne prouvent sa valeur pratique. Bien qu'il y ait encore de la place pour l'amélioration dans l'analyse théorique et certains détails techniques, il s'agit globalement d'une contribution importante au domaine du NLP e-commerce.