In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
Query Brand Entity Linking in E-Commerce Search 论文ID : 2502.01555标题 : Query Brand Entity Linking in E-Commerce Search作者 : Dong Liu, Sreyashi Nag (Amazon)分类 : cs.IR cs.AI cs.LG发表时间/会议 : 2025年(arXiv预印本)论文链接 : https://arxiv.org/abs/2502.01555 本文解决电商搜索查询中的品牌实体链接问题。实体链接任务通过两种方式完成:1)包含实体提及检测和实体消歧的两阶段过程;2)直接从输入文本获取目标实体的端到端链接方法。该任务面临独特挑战:查询极短(平均2.4个单词)、缺乏自然语言结构、需要处理大规模品牌空间。文章提出了结合命名实体识别与匹配的两阶段方法,以及使用极端多分类的新颖端到端解决方案。通过离线基准测试和在线A/B测试验证了解决方案的有效性。
在电商搜索中,品牌识别是仅次于产品类型的第二重要属性。正确识别品牌名称(无论是直接提及还是间接提及)是搜索查询理解的重要组成部分,对提供良好购物体验至关重要。
查询特征限制 :电商查询极短(平均2.4词),缺乏自然语言结构,开源NLP模型难以处理此类查询分布品牌空间巨大 :需要处理数十万个独特品牌,且不断有新品牌加入多样性问题 :
品牌名称在不同语言和地区的变体统一 同一品牌的不同表面形式(缩写vs全名) 母品牌与子品牌关系识别 现有基于字符串的品牌识别方法存在局限性,需要将品牌概念统一到单一命名空间中的全局品牌实体,实现跨语言、跨商店、跨表面形式的统一识别。
构建两阶段实体链接模型 :结合预训练NER模型和表面形式匹配的品牌实体预测框架探索匹配技术 :开发词汇和语义匹配技术,并提出基于产品类型的过滤步骤用于大规模品牌输出空间的实体预测优化提出端到端极端多分类模型 :直接以搜索查询为输入预测相关品牌实体,并与两阶段模型融合全面验证 :通过大规模离线实验基准测试和在线A/B测试验证解决方案有效性给定品牌搜索查询(如" running shoes"),识别并链接到品牌数据库中的唯一品牌实体。输入为原始查询文本,输出为对应的品牌实体ID。
基础两阶段方法(NER + 精确词汇匹配) :
第一阶段 :使用MetaTS-NER模型提取品牌提及
第二阶段 :通过静态字典进行精确字符串匹配
过滤步骤 :基于产品类型进行消歧
改进两阶段方法(NER + PECOS语义匹配) :
将匹配步骤建模为极端多分类问题 使用PECOS框架处理大规模品牌实体空间(约6万个实体) 输出品牌实体及其相关性分数:(E_ID, S) = g_M2E(m) 直接从查询预测品牌实体,避免NER阶段的错误传播:
(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)
关键特性:
添加NIL类处理非品牌查询 时间复杂度:O(b × log L),其中b为beam size,L为品牌实体数量 空间复杂度:从O(d × L)降至O(d × log L) 结合两阶段精确匹配和端到端方法的优势:
并行执行两种方法 优先选择精确匹配结果以保证高精度 回退到Q2E-PECOS结果以提高覆盖率 PECOS在品牌链接中的应用 :首次将极端多分类框架应用于电商品牌实体链接产品类型辅助消歧 :利用查询产品类型信息进行品牌实体消歧多语言支持 :支持13种语言的品牌识别融合策略 :巧妙结合高精度和高召回率方法数据集 规模 品牌实体数量 61,697 Brand2entity 616,974 强标注数据(SL) 806,972 弱标注数据(WL) 1,308,816 测试数据 28,439
数据构成 :
Brand2entity (B2E) :品牌名称-实体对的内部字典强标注数据(SL) :人工标注的13种语言搜索查询数据弱标注数据(WL) :从历史查询-产品交互中派生的弱监督数据召回率 :Recall = |C| / |L_single|精确率 :Precision = |C| / |P_single|覆盖率 :Coverage = |P_single| / |T|F1分数 :调和平均数其中C为正确预测集合,L_single为单品牌实体标签查询集合,P_single为模型预测单品牌实体查询集合。
NER + 精确词汇匹配 :基线两阶段方法NER + M2E-PECOS :语义匹配的两阶段方法Bi-encoder :使用Qwen3 Embedding 0.6B的双编码器基线Q2E-PECOS :端到端PECOS方法融合模型 :混合方法的各种组合方法 训练数据 融合 Group-1 Group-2 Coverage/Recall/Precision/F1 Coverage/Recall/Precision/F1 NER + 精确匹配 ✓ ✓ 58.28/64.66/97.22/77.67 70.16/86.21/99.15/92.23 Q2E-PECOS ✓ ✓ ✓ 70.98/75.26/96.13/84.42 80.77/94.71/98.92/96.77 Q2E-PECOS ✓ ✓ ✓ ✓ 75.31/77.35/94.93/85.24 85.09/94.64/98.55/96.56
关键发现 :
端到端Q2E-PECOS显著提高覆盖率和召回率 融合策略在保持高精度的同时提升召回率 弱标注数据对端到端模型性能提升明显 不同语言的性能差异显著:
高资源语言 (英语、西班牙语):各方法表现均较好低资源语言 (日语):NER+精确匹配覆盖率仅19.03%融合方法 :在所有语言中都能平衡精度和召回率在85K非品牌查询上的误报率:
NER + 精确匹配:1.177% Q2E-PECOS(含弱标注):6.550% 虽然端到端方法误报率较高,但考虑到整体性能提升,仍在可接受范围内。
指标 Group-1商店 Group-2商店 品牌实体召回率 +11.00% +5.44% 客户参与度 +0.02% - 即时贡献利润 +0.03% -
在线测试证实了融合解决方案的实际业务价值。
两阶段设计 :实体识别 + 实体消歧候选生成 :表面形式匹配、别名扩展、先验概率匹配候选排序 :编辑距离、语义向量相似度联合学习 :同时进行识别和消歧序列标注 :BERT-based token分类自回归生成 :逐token生成实体名称查询特征 :短、噪声、歧义应用场景 :产品检索、查询重写、搜索结果质量提升技术挑战 :缺乏词汇上下文、大规模知识库端到端方法优势 :Q2E-PECOS在覆盖率和召回率上显著优于传统两阶段方法融合策略有效 :结合高精度词汇匹配和高召回率语义匹配的融合方法表现最佳数据重要性 :弱标注数据对端到端模型性能提升关键实际价值 :在线A/B测试证实了方法的商业价值误报率 :端到端方法在非品牌查询上误报率较高语言差异 :低资源语言性能仍有提升空间计算复杂度 :融合方法需要并行运行多个模型数据依赖 :需要大量弱标注数据支持端到端训练模型优化 :进一步降低误报率,提升低资源语言性能效率提升 :优化计算复杂度,减少推理延迟跨域迁移 :将方法扩展到其他电商属性提取任务动态更新 :处理新品牌的实时添加和更新问题重要性 :解决了电商搜索中的核心问题,具有重要实用价值方法创新 :首次将PECOS极端多分类框架应用于品牌实体链接实验全面 :涵盖多语言、多方法对比、在线A/B测试验证工程实用 :考虑了实际部署中的效率和精度平衡数据丰富 :使用了大规模真实电商数据理论分析不足 :缺乏对为什么端到端方法更有效的理论解释消融实验有限 :对各个组件贡献的分析不够深入误报问题 :端到端方法误报率偏高,需要进一步优化计算开销 :融合方法的计算复杂度分析不够详细学术贡献 :为电商NLP领域提供了新的技术方案实用价值 :已在Amazon实际部署,证明了商业价值可复现性 :提供了详细的实验设置和数据描述启发意义 :为其他电商属性提取任务提供了参考电商平台 :各类电商搜索引擎的品牌识别多语言环境 :支持多语言的全球化电商平台大规模应用 :需要处理海量查询的实时系统属性提取 :可扩展到其他产品属性的实体链接任务论文引用了多个重要相关工作,包括:
PECOS框架的原始论文 Yu et al., 2022 MetaTS-NER多语言序列标注模型 Li et al., 2021 传统实体链接方法 Cao et al., 2017; Le & Titov, 2019 电商查询理解相关工作 Kozareva et al., 2016; Manchanda et al., 2020 总体评价 :这是一篇高质量的应用研究论文,解决了电商搜索中的重要实际问题。方法创新性较强,实验验证充分,特别是在线A/B测试证明了实际价值。虽然在理论分析和某些技术细节上还有改进空间,但整体上是电商NLP领域的一个重要贡献。