In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
論文ID : 2502.01555タイトル : Query Brand Entity Linking in E-Commerce Search著者 : Dong Liu, Sreyashi Nag (Amazon)分類 : cs.IR cs.AI cs.LG発表時期/会議 : 2025年(arXiv プレプリント)論文リンク : https://arxiv.org/abs/2502.01555 本論文は、電子商取引検索クエリにおけるブランドエンティティリンキング問題に対処しています。エンティティリンキングタスクは2つの方法で実行されます:1)エンティティ提及検出とエンティティ曖昧性解消を含む2段階プロセス、2)入力テキストから目標エンティティを直接取得するエンドツーエンドリンキング方法。このタスクは独特な課題に直面しています:クエリが極めて短い(平均2.4単語)、自然言語構造の欠如、大規模なブランド空間の処理が必要です。本論文は、固有表現認識とマッチングを組み合わせた2段階方法、および極端多クラス分類を使用した新規なエンドツーエンドソリューションを提案しています。オフラインベンチマークテストとオンラインA/Bテストを通じてソリューションの有効性を検証しました。
電子商取引検索において、ブランド識別は製品タイプに次ぐ2番目に重要な属性です。ブランド名の正確な識別(直接提及であれ間接提及であれ)は、検索クエリ理解の重要な構成要素であり、良好なショッピング体験の提供に不可欠です。
クエリ特性の制限 :電子商取引クエリは極めて短い(平均2.4語)、自然言語構造に欠け、オープンソースNLPモデルはこのようなクエリ分布の処理が困難ですブランド空間の巨大さ :数十万の独特なブランドを処理する必要があり、常に新しいブランドが追加されます多様性の問題 :
異なる言語と地域におけるブランド名の変種の統一 同一ブランドの異なる表面形式(略語対フルネーム) 親ブランドと子ブランドの関係認識 既存の文字列ベースのブランド認識方法には制限があり、ブランド概念を単一の命名空間内のグローバルブランドエンティティに統一し、言語、店舗、表面形式を超えた統一的な認識を実現する必要があります。
2段階エンティティリンキングモデルの構築 :事前学習済みNERモデルと表面形式マッチングを組み合わせたブランドエンティティ予測フレームワークマッチング技術の探索 :語彙的および意味的マッチング技術を開発し、大規模ブランド出力空間のエンティティ予測最適化のための製品タイプベースのフィルタリングステップを提案エンドツーエンド極端多クラス分類モデルの提案 :検索クエリを入力として関連ブランドエンティティを直接予測し、2段階モデルとの融合包括的な検証 :大規模なオフライン実験ベンチマークテストとオンラインA/Bテストを通じてソリューションの有効性を検証ブランド検索クエリ(例:" running shoes")が与えられた場合、ブランドデータベース内の一意のブランドエンティティを識別してリンクします。入力は生のクエリテキスト、出力は対応するブランドエンティティIDです。
基本的な2段階方法(NER + 完全語彙マッチング) :
第1段階 :MetaTS-NERモデルを使用してブランド提及を抽出
第2段階 :静的辞書を通じた完全文字列マッチング
フィルタリングステップ :製品タイプに基づく曖昧性解消
改善された2段階方法(NER + PECOS意味マッチング) :
マッチングステップを極端多クラス分類問題としてモデル化 PECOSフレームワークを使用して大規模ブランドエンティティ空間(約6万エンティティ)を処理 ブランドエンティティと関連性スコアを出力:(E_ID, S) = g_M2E(m) クエリからブランドエンティティを直接予測し、NER段階のエラー伝播を回避:
(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)
主要な特性:
NILクラスを追加してブランド以外のクエリを処理 時間計算量:O(b × log L)、ここでbはビームサイズ、Lはブランドエンティティ数 空間計算量:O(d × L)からO(d × log L)に削減 2段階の完全マッチングとエンドツーエンド方法の利点を組み合わせ:
2つの方法を並列実行 高精度を保証するため完全マッチング結果を優先 カバレッジを向上させるためQ2E-PECOSの結果にフォールバック ブランドリンキングにおけるPECOSの応用 :電子商取引ブランドエンティティリンキングに極端多クラス分類フレームワークを初めて適用製品タイプ補助曖昧性解消 :クエリ製品タイプ情報を利用したブランドエンティティ曖昧性解消多言語対応 :13言語のブランド認識をサポート融合戦略 :高精度と高再現率方法の巧妙な組み合わせデータセット 規模 ブランドエンティティ数 61,697 Brand2entity 616,974 強ラベル付きデータ(SL) 806,972 弱ラベル付きデータ(WL) 1,308,816 テストデータ 28,439
データ構成 :
Brand2entity (B2E) :ブランド名-エンティティペアの内部辞書強ラベル付きデータ(SL) :人間が注釈を付けた13言語の検索クエリデータ弱ラベル付きデータ(WL) :履歴クエリ-製品インタラクションから導出された弱教師あり学習データ再現率 :Recall = |C| / |L_single|精度 :Precision = |C| / |P_single|カバレッジ :Coverage = |P_single| / |T|F1スコア :調和平均ここでCは正しく予測されたセット、L_singleは単一ブランドエンティティラベルクエリセット、P_singleはモデルが単一ブランドエンティティを予測したクエリセットです。
NER + 完全語彙マッチング :ベースライン2段階方法NER + M2E-PECOS :意味マッチングの2段階方法Bi-encoder :Qwen3 Embedding 0.6Bを使用した双エンコーダベースラインQ2E-PECOS :エンドツーエンドPECOS方法融合モデル :ハイブリッド方法の各種組み合わせ方法 訓練データ 融合 グループ1 グループ2 カバレッジ/再現率/精度/F1 カバレッジ/再現率/精度/F1 NER + 完全マッチング ✓ ✓ 58.28/64.66/97.22/77.67 70.16/86.21/99.15/92.23 Q2E-PECOS ✓ ✓ ✓ 70.98/75.26/96.13/84.42 80.77/94.71/98.92/96.77 Q2E-PECOS ✓ ✓ ✓ ✓ 75.31/77.35/94.93/85.24 85.09/94.64/98.55/96.56
主要な発見 :
エンドツーエンドQ2E-PECOSはカバレッジと再現率を大幅に向上 融合戦略は高精度を維持しながら再現率を向上 弱ラベル付きデータはエンドツーエンドモデルのパフォーマンス向上に重要 異なる言語のパフォーマンスは大きく異なります:
高リソース言語 (英語、スペイン語):すべての方法で良好なパフォーマンス低リソース言語 (日本語):NER+完全マッチングのカバレッジはわずか19.03%融合方法 :すべての言語で精度と再現率のバランスを取ることができます85Kの非ブランドクエリでの誤検知率:
NER + 完全マッチング:1.177% Q2E-PECOS(弱ラベル付き含む):6.550% エンドツーエンド方法の誤検知率は高いですが、全体的なパフォーマンス向上を考慮すると、許容範囲内です。
指標 グループ1ストア グループ2ストア ブランドエンティティ再現率 +11.00% +5.44% 顧客エンゲージメント +0.02% - 即座の利益貢献 +0.03% -
オンラインテストは融合ソリューションの実際のビジネス価値を確認しました。
2段階設計 :エンティティ認識 + エンティティ曖昧性解消候補生成 :表面形式マッチング、別名拡張、事前確率マッチング候補ランキング :編集距離、意味ベクトル類似度結合学習 :認識と曖昧性解消を同時に実行系列ラベリング :BERTベースのトークン分類自己回帰生成 :トークンごとのエンティティ名生成クエリ特性 :短い、ノイズが多い、曖昧応用シーン :製品検索、クエリ書き換え、検索結果品質向上技術課題 :語彙コンテキストの欠如、大規模知識ベースエンドツーエンド方法の利点 :Q2E-PECOSはカバレッジと再現率において従来の2段階方法を大幅に上回ります融合戦略の有効性 :高精度の語彙マッチングと高再現率の意味マッチングを組み合わせた融合方法が最良のパフォーマンスを示しますデータの重要性 :弱ラベル付きデータはエンドツーエンドモデルのパフォーマンス向上に重要です実用的価値 :オンラインA/Bテストは方法の商業的価値を確認しました誤検知率 :エンドツーエンド方法は非ブランドクエリで誤検知率が高い言語差異 :低リソース言語のパフォーマンスはまだ改善の余地があります計算複雑性 :融合方法は複数のモデルを並列実行する必要がありますデータ依存性 :エンドツーエンド訓練には大量の弱ラベル付きデータが必要ですモデル最適化 :誤検知率をさらに低減し、低リソース言語のパフォーマンスを向上効率向上 :計算複雑性を最適化し、推論遅延を削減クロスドメイン転移 :他の電子商取引属性抽出タスクへの方法の拡張動的更新 :新しいブランドのリアルタイム追加と更新の処理問題の重要性 :電子商取引検索の中核的な問題を解決し、重要な実用的価値を持ちます方法の革新性 :PECOS極端多クラス分類フレームワークをブランドエンティティリンキングに初めて適用実験の包括性 :多言語、複数方法の比較、オンラインA/Bテスト検証を含みます工学的実用性 :実際の展開における効率と精度のバランスを考慮データの豊富さ :大規模な実際の電子商取引データを使用理論分析の不足 :エンドツーエンド方法がより有効である理由の理論的説明が不足アブレーション実験の限定 :各コンポーネントの貢献分析が十分ではありません誤検知問題 :エンドツーエンド方法の誤検知率が高く、さらなる最適化が必要計算オーバーヘッド :融合方法の計算複雑性分析が不十分学術的貢献 :電子商取引NLP分野に新しい技術ソリューションを提供実用的価値 :Amazonで実際に展開され、商業的価値が証明されています再現性 :詳細な実験設定とデータ説明を提供啓発的意義 :他の電子商取引属性抽出タスクの参考となります電子商取引プラットフォーム :各種電子商取引検索エンジンのブランド認識多言語環境 :多言語対応のグローバル電子商取引プラットフォーム大規模応用 :膨大なクエリを処理する必要があるリアルタイムシステム属性抽出 :他の製品属性のエンティティリンキングタスクへの拡張論文は複数の重要な関連研究を引用しており、以下を含みます:
PECOSフレームワークの原論文 Yu et al., 2022 MetaTS-NER多言語系列ラベリングモデル Li et al., 2021 従来のエンティティリンキング方法 Cao et al., 2017; Le & Titov, 2019 電子商取引クエリ理解関連研究 Kozareva et al., 2016; Manchanda et al., 2020 総合評価 :これは電子商取引検索における重要な実際の問題を解決した高品質の応用研究論文です。方法の革新性が強く、実験検証が充分であり、特にオンラインA/Bテストが実際の価値を証明しています。理論分析と技術細部にはまだ改善の余地がありますが、全体的には電子商取引NLP分野における重要な貢献です。