2025-11-12T22:49:10.680556

Query Brand Entity Linking in E-Commerce Search

Liu, Nag
In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
academic

Query Brand Entity Linking in E-Commerce Search

基本信息

  • 论文ID: 2502.01555
  • 标题: Query Brand Entity Linking in E-Commerce Search
  • 作者: Dong Liu, Sreyashi Nag (Amazon)
  • 分类: cs.IR cs.AI cs.LG
  • 发表时间/会议: 2025年(arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2502.01555

摘要

本文解决电商搜索查询中的品牌实体链接问题。实体链接任务通过两种方式完成:1)包含实体提及检测和实体消歧的两阶段过程;2)直接从输入文本获取目标实体的端到端链接方法。该任务面临独特挑战:查询极短(平均2.4个单词)、缺乏自然语言结构、需要处理大规模品牌空间。文章提出了结合命名实体识别与匹配的两阶段方法,以及使用极端多分类的新颖端到端解决方案。通过离线基准测试和在线A/B测试验证了解决方案的有效性。

研究背景与动机

问题定义

在电商搜索中,品牌识别是仅次于产品类型的第二重要属性。正确识别品牌名称(无论是直接提及还是间接提及)是搜索查询理解的重要组成部分,对提供良好购物体验至关重要。

挑战分析

  1. 查询特征限制:电商查询极短(平均2.4词),缺乏自然语言结构,开源NLP模型难以处理此类查询分布
  2. 品牌空间巨大:需要处理数十万个独特品牌,且不断有新品牌加入
  3. 多样性问题
    • 品牌名称在不同语言和地区的变体统一
    • 同一品牌的不同表面形式(缩写vs全名)
    • 母品牌与子品牌关系识别

研究动机

现有基于字符串的品牌识别方法存在局限性,需要将品牌概念统一到单一命名空间中的全局品牌实体,实现跨语言、跨商店、跨表面形式的统一识别。

核心贡献

  1. 构建两阶段实体链接模型:结合预训练NER模型和表面形式匹配的品牌实体预测框架
  2. 探索匹配技术:开发词汇和语义匹配技术,并提出基于产品类型的过滤步骤用于大规模品牌输出空间的实体预测优化
  3. 提出端到端极端多分类模型:直接以搜索查询为输入预测相关品牌实体,并与两阶段模型融合
  4. 全面验证:通过大规模离线实验基准测试和在线A/B测试验证解决方案有效性

方法详解

任务定义

给定品牌搜索查询(如" running shoes"),识别并链接到品牌数据库中的唯一品牌实体。输入为原始查询文本,输出为对应的品牌实体ID。

模型架构

1. 两阶段框架

基础两阶段方法(NER + 精确词汇匹配)

  • 第一阶段:使用MetaTS-NER模型提取品牌提及
    m = f_NER(q)
    
  • 第二阶段:通过静态字典进行精确字符串匹配
    E_ID = g(m)
    
  • 过滤步骤:基于产品类型进行消歧
    e = h(E_ID, q, PT_q)
    

改进两阶段方法(NER + PECOS语义匹配)

  • 将匹配步骤建模为极端多分类问题
  • 使用PECOS框架处理大规模品牌实体空间(约6万个实体)
  • 输出品牌实体及其相关性分数:(E_ID, S) = g_M2E(m)

2. 端到端框架(Q2E-PECOS)

直接从查询预测品牌实体,避免NER阶段的错误传播:

(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)

关键特性:

  • 添加NIL类处理非品牌查询
  • 时间复杂度:O(b × log L),其中b为beam size,L为品牌实体数量
  • 空间复杂度:从O(d × L)降至O(d × log L)

3. 融合框架

结合两阶段精确匹配和端到端方法的优势:

  • 并行执行两种方法
  • 优先选择精确匹配结果以保证高精度
  • 回退到Q2E-PECOS结果以提高覆盖率

技术创新点

  1. PECOS在品牌链接中的应用:首次将极端多分类框架应用于电商品牌实体链接
  2. 产品类型辅助消歧:利用查询产品类型信息进行品牌实体消歧
  3. 多语言支持:支持13种语言的品牌识别
  4. 融合策略:巧妙结合高精度和高召回率方法

实验设置

数据集

数据集规模
品牌实体数量61,697
Brand2entity616,974
强标注数据(SL)806,972
弱标注数据(WL)1,308,816
测试数据28,439

数据构成

  1. Brand2entity (B2E):品牌名称-实体对的内部字典
  2. 强标注数据(SL):人工标注的13种语言搜索查询数据
  3. 弱标注数据(WL):从历史查询-产品交互中派生的弱监督数据

评价指标

  • 召回率Recall = |C| / |L_single|
  • 精确率Precision = |C| / |P_single|
  • 覆盖率Coverage = |P_single| / |T|
  • F1分数:调和平均数

其中C为正确预测集合,L_single为单品牌实体标签查询集合,P_single为模型预测单品牌实体查询集合。

对比方法

  1. NER + 精确词汇匹配:基线两阶段方法
  2. NER + M2E-PECOS:语义匹配的两阶段方法
  3. Bi-encoder:使用Qwen3 Embedding 0.6B的双编码器基线
  4. Q2E-PECOS:端到端PECOS方法
  5. 融合模型:混合方法的各种组合

实验结果

主要结果

方法训练数据融合Group-1Group-2
Coverage/Recall/Precision/F1Coverage/Recall/Precision/F1
NER + 精确匹配✓ ✓58.28/64.66/97.22/77.6770.16/86.21/99.15/92.23
Q2E-PECOS✓ ✓ ✓70.98/75.26/96.13/84.4280.77/94.71/98.92/96.77
Q2E-PECOS✓ ✓ ✓75.31/77.35/94.93/85.2485.09/94.64/98.55/96.56

关键发现

  • 端到端Q2E-PECOS显著提高覆盖率和召回率
  • 融合策略在保持高精度的同时提升召回率
  • 弱标注数据对端到端模型性能提升明显

多语言性能分析

不同语言的性能差异显著:

  • 高资源语言(英语、西班牙语):各方法表现均较好
  • 低资源语言(日语):NER+精确匹配覆盖率仅19.03%
  • 融合方法:在所有语言中都能平衡精度和召回率

误报率分析

在85K非品牌查询上的误报率:

  • NER + 精确匹配:1.177%
  • Q2E-PECOS(含弱标注):6.550%

虽然端到端方法误报率较高,但考虑到整体性能提升,仍在可接受范围内。

在线A/B测试结果

指标Group-1商店Group-2商店
品牌实体召回率+11.00%+5.44%
客户参与度+0.02%-
即时贡献利润+0.03%-

在线测试证实了融合解决方案的实际业务价值。

相关工作

传统实体链接方法

  • 两阶段设计:实体识别 + 实体消歧
  • 候选生成:表面形式匹配、别名扩展、先验概率匹配
  • 候选排序:编辑距离、语义向量相似度

端到端方法

  • 联合学习:同时进行识别和消歧
  • 序列标注:BERT-based token分类
  • 自回归生成:逐token生成实体名称

电商领域特殊性

  • 查询特征:短、噪声、歧义
  • 应用场景:产品检索、查询重写、搜索结果质量提升
  • 技术挑战:缺乏词汇上下文、大规模知识库

结论与讨论

主要结论

  1. 端到端方法优势:Q2E-PECOS在覆盖率和召回率上显著优于传统两阶段方法
  2. 融合策略有效:结合高精度词汇匹配和高召回率语义匹配的融合方法表现最佳
  3. 数据重要性:弱标注数据对端到端模型性能提升关键
  4. 实际价值:在线A/B测试证实了方法的商业价值

局限性

  1. 误报率:端到端方法在非品牌查询上误报率较高
  2. 语言差异:低资源语言性能仍有提升空间
  3. 计算复杂度:融合方法需要并行运行多个模型
  4. 数据依赖:需要大量弱标注数据支持端到端训练

未来方向

  1. 模型优化:进一步降低误报率,提升低资源语言性能
  2. 效率提升:优化计算复杂度,减少推理延迟
  3. 跨域迁移:将方法扩展到其他电商属性提取任务
  4. 动态更新:处理新品牌的实时添加和更新

深度评价

优点

  1. 问题重要性:解决了电商搜索中的核心问题,具有重要实用价值
  2. 方法创新:首次将PECOS极端多分类框架应用于品牌实体链接
  3. 实验全面:涵盖多语言、多方法对比、在线A/B测试验证
  4. 工程实用:考虑了实际部署中的效率和精度平衡
  5. 数据丰富:使用了大规模真实电商数据

不足

  1. 理论分析不足:缺乏对为什么端到端方法更有效的理论解释
  2. 消融实验有限:对各个组件贡献的分析不够深入
  3. 误报问题:端到端方法误报率偏高,需要进一步优化
  4. 计算开销:融合方法的计算复杂度分析不够详细

影响力

  1. 学术贡献:为电商NLP领域提供了新的技术方案
  2. 实用价值:已在Amazon实际部署,证明了商业价值
  3. 可复现性:提供了详细的实验设置和数据描述
  4. 启发意义:为其他电商属性提取任务提供了参考

适用场景

  1. 电商平台:各类电商搜索引擎的品牌识别
  2. 多语言环境:支持多语言的全球化电商平台
  3. 大规模应用:需要处理海量查询的实时系统
  4. 属性提取:可扩展到其他产品属性的实体链接任务

参考文献

论文引用了多个重要相关工作,包括:

  • PECOS框架的原始论文 Yu et al., 2022
  • MetaTS-NER多语言序列标注模型 Li et al., 2021
  • 传统实体链接方法 Cao et al., 2017; Le & Titov, 2019
  • 电商查询理解相关工作 Kozareva et al., 2016; Manchanda et al., 2020

总体评价:这是一篇高质量的应用研究论文,解决了电商搜索中的重要实际问题。方法创新性较强,实验验证充分,特别是在线A/B测试证明了实际价值。虽然在理论分析和某些技术细节上还有改进空间,但整体上是电商NLP领域的一个重要贡献。