In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
논문 ID : 2502.01555제목 : Query Brand Entity Linking in E-Commerce Search저자 : Dong Liu, Sreyashi Nag (Amazon)분류 : cs.IR cs.AI cs.LG발표 시간/학회 : 2025년 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2502.01555 본 논문은 전자상거래 검색 쿼리에서의 브랜드 엔티티 링킹 문제를 해결한다. 엔티티 링킹 작업은 두 가지 방식으로 수행된다: 1) 엔티티 언급 탐지와 엔티티 소거곡(disambiguation)을 포함하는 2단계 프로세스; 2) 입력 텍스트에서 목표 엔티티를 직접 획득하는 종단간(end-to-end) 링킹 방법. 본 작업은 고유한 과제들에 직면한다: 극도로 짧은 쿼리(평균 2.4개 단어), 자연언어 구조 부재, 대규모 브랜드 공간 처리 필요성. 본 논문은 명명된 엔티티 인식(Named Entity Recognition)과 매칭을 결합한 2단계 방법과 극단적 다중분류(extreme multi-classification)를 사용하는 새로운 종단간 솔루션을 제안한다. 오프라인 벤치마크 테스트와 온라인 A/B 테스트를 통해 솔루션의 유효성을 검증했다.
전자상거래 검색에서 브랜드 인식은 제품 유형 다음으로 두 번째로 중요한 속성이다. 브랜드명(직접 언급이든 간접 언급이든)을 올바르게 인식하는 것은 검색 쿼리 이해의 중요한 구성 요소이며, 양질의 쇼핑 경험 제공에 필수적이다.
쿼리 특성 제약 : 전자상거래 쿼리는 극도로 짧으며(평균 2.4개 단어), 자연언어 구조가 부족하여 오픈소스 NLP 모델이 이러한 쿼리 분포를 처리하기 어렵다거대한 브랜드 공간 : 수십만 개의 고유 브랜드를 처리해야 하며, 지속적으로 새로운 브랜드가 추가된다다양성 문제 :
서로 다른 언어 및 지역에서의 브랜드명 변형 통일 동일 브랜드의 다양한 표면 형태(약자 vs 전체명) 모브랜드와 서브브랜드 관계 인식 기존의 문자열 기반 브랜드 인식 방법에는 한계가 있으며, 브랜드 개념을 단일 명명 공간의 전역 브랜드 엔티티로 통일하여 언어, 상점, 표면 형태 전반에 걸친 통일된 인식을 구현할 필요가 있다.
2단계 엔티티 링킹 모델 구축 : 사전학습된 NER 모델과 표면 형태 매칭을 결합한 브랜드 엔티티 예측 프레임워크매칭 기술 탐색 : 어휘 및 의미론적 매칭 기술 개발, 대규모 브랜드 출력 공간의 엔티티 예측 최적화를 위한 제품 유형 기반 필터링 단계 제안종단간 극단적 다중분류 모델 제안 : 검색 쿼리를 입력으로 하여 관련 브랜드 엔티티를 직접 예측하고 2단계 모델과 융합포괄적 검증 : 대규모 오프라인 실험 벤치마크 테스트 및 온라인 A/B 테스트를 통한 솔루션 유효성 검증주어진 브랜드 검색 쿼리(예: " running shoes")에서 브랜드 데이터베이스의 고유 브랜드 엔티티를 인식하고 링킹한다. 입력은 원본 쿼리 텍스트이고, 출력은 해당하는 브랜드 엔티티 ID이다.
기본 2단계 방법 (NER + 정확 어휘 매칭) :
1단계 : MetaTS-NER 모델을 사용하여 브랜드 언급 추출
2단계 : 정적 사전을 통한 정확 문자열 매칭
필터링 단계 : 제품 유형 기반 소거곡
개선된 2단계 방법 (NER + PECOS 의미론적 매칭) :
매칭 단계를 극단적 다중분류 문제로 모델링 PECOS 프레임워크를 사용하여 대규모 브랜드 엔티티 공간 처리(약 6만 개 엔티티) 브랜드 엔티티 및 관련성 점수 출력: (E_ID, S) = g_M2E(m) 쿼리에서 브랜드 엔티티를 직접 예측하여 NER 단계의 오류 전파 방지:
(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)
주요 특성:
비브랜드 쿼리 처리를 위한 NIL 클래스 추가 시간 복잡도: O(b × log L), 여기서 b는 빔 크기, L은 브랜드 엔티티 수 공간 복잡도: O(d × L)에서 O(d × log L)로 감소 2단계 정확 매칭과 종단간 방법의 장점을 결합:
두 방법을 병렬로 실행 높은 정확도를 보장하기 위해 정확 매칭 결과 우선 선택 커버리지 향상을 위해 Q2E-PECOS 결과로 폴백 브랜드 링킹에서의 PECOS 적용 : 극단적 다중분류 프레임워크를 전자상거래 브랜드 엔티티 링킹에 처음 적용제품 유형 보조 소거곡 : 쿼리 제품 유형 정보를 활용한 브랜드 엔티티 소거곡다중언어 지원 : 13개 언어의 브랜드 인식 지원융합 전략 : 높은 정확도와 높은 재현율 방법의 교묘한 결합데이터셋 규모 브랜드 엔티티 수 61,697 Brand2entity 616,974 강한 주석 데이터(SL) 806,972 약한 주석 데이터(WL) 1,308,816 테스트 데이터 28,439
데이터 구성 :
Brand2entity (B2E) : 브랜드명-엔티티 쌍의 내부 사전강한 주석 데이터(SL) : 인간이 주석한 13개 언어 검색 쿼리 데이터약한 주석 데이터(WL) : 역사적 쿼리-제품 상호작용에서 파생된 약한 감독 데이터재현율 : Recall = |C| / |L_single|정확도 : Precision = |C| / |P_single|커버리지 : Coverage = |P_single| / |T|F1 점수 : 조화 평균여기서 C는 정확한 예측 집합, L_single은 단일 브랜드 엔티티 레이블 쿼리 집합, P_single은 모델이 예측한 단일 브랜드 엔티티 쿼리 집합이다.
NER + 정확 어휘 매칭 : 기본 2단계 방법NER + M2E-PECOS : 의미론적 매칭의 2단계 방법Bi-encoder : Qwen3 Embedding 0.6B를 사용한 이중 인코더 기본선Q2E-PECOS : 종단간 PECOS 방법융합 모델 : 혼합 방법의 다양한 조합방법 훈련 데이터 융합 Group-1 Group-2 커버리지/재현율/정확도/F1 커버리지/재현율/정확도/F1 NER + 정확 매칭 ✓ ✓ 58.28/64.66/97.22/77.67 70.16/86.21/99.15/92.23 Q2E-PECOS ✓ ✓ ✓ 70.98/75.26/96.13/84.42 80.77/94.71/98.92/96.77 Q2E-PECOS ✓ ✓ ✓ ✓ 75.31/77.35/94.93/85.24 85.09/94.64/98.55/96.56
주요 발견 :
종단간 Q2E-PECOS는 커버리지와 재현율을 크게 향상 융합 전략은 높은 정확도를 유지하면서 재현율 향상 약한 주석 데이터는 종단간 모델 성능 향상에 명백한 영향 다양한 언어의 성능 차이는 상당하다:
고자원 언어 (영어, 스페인어): 모든 방법이 양호한 성능 발휘저자원 언어 (일본어): NER+정확 매칭 커버리지는 19.03%에 불과융합 방법 : 모든 언어에서 정확도와 재현율의 균형 유지85K개의 비브랜드 쿼리에서의 거짓 양성율:
NER + 정확 매칭: 1.177% Q2E-PECOS(약한 주석 포함): 6.550% 종단간 방법의 거짓 양성율이 더 높지만, 전체 성능 향상을 고려하면 여전히 허용 범위 내이다.
지표 Group-1 상점 Group-2 상점 브랜드 엔티티 재현율 +11.00% +5.44% 고객 참여도 +0.02% - 즉시 기여 이익 +0.03% -
온라인 테스트는 융합 솔루션의 실제 비즈니스 가치를 확인했다.
2단계 설계 : 엔티티 인식 + 엔티티 소거곡후보 생성 : 표면 형태 매칭, 별칭 확장, 사전 확률 매칭후보 순위 지정 : 편집 거리, 의미론적 벡터 유사도결합 학습 : 인식과 소거곡을 동시에 수행수열 표지 : BERT 기반 토큰 분류자동회귀 생성 : 토큰별 엔티티명 생성쿼리 특성 : 짧음, 노이즈, 모호성응용 시나리오 : 제품 검색, 쿼리 재작성, 검색 결과 품질 향상기술적 과제 : 어휘 문맥 부재, 대규모 지식 기반종단간 방법의 장점 : Q2E-PECOS는 커버리지와 재현율에서 전통적 2단계 방법을 크게 능가융합 전략의 효과성 : 높은 정확도의 어휘 매칭과 높은 재현율의 의미론적 매칭을 결합한 융합 방법이 최고 성능 발휘데이터의 중요성 : 약한 주석 데이터는 종단간 모델 성능 향상에 핵심적실제 가치 : 온라인 A/B 테스트는 방법의 상업적 가치 입증거짓 양성율 : 종단간 방법의 비브랜드 쿼리에서의 거짓 양성율이 높음언어 차이 : 저자원 언어 성능 개선 여지 있음계산 복잡도 : 융합 방법은 여러 모델을 병렬 실행 필요데이터 의존성 : 종단간 훈련을 위해 대량의 약한 주석 데이터 필요모델 최적화 : 거짓 양성율 추가 감소, 저자원 언어 성능 향상효율성 향상 : 계산 복잡도 최적화, 추론 지연 감소교차 영역 이전 : 방법을 다른 전자상거래 속성 추출 작업으로 확대동적 업데이트 : 새로운 브랜드의 실시간 추가 및 업데이트 처리문제의 중요성 : 전자상거래 검색의 핵심 문제 해결, 높은 실용적 가치방법의 혁신성 : PECOS 극단적 다중분류 프레임워크를 브랜드 엔티티 링킹에 처음 적용포괄적 실험 : 다중언어, 다중 방법 비교, 온라인 A/B 테스트 검증 포함공학적 실용성 : 실제 배포의 효율성과 정확도 균형 고려풍부한 데이터 : 대규모 실제 전자상거래 데이터 사용이론적 분석 부족 : 종단간 방법이 더 효과적인 이유에 대한 이론적 설명 부족제한된 소거 실험 : 각 구성 요소 기여도 분석 부족거짓 양성 문제 : 종단간 방법의 거짓 양성율이 높으며 추가 최적화 필요계산 오버헤드 : 융합 방법의 계산 복잡도 분석 부족학술 기여 : 전자상거래 NLP 영역에 새로운 기술 솔루션 제공실용적 가치 : Amazon에 실제 배포되어 상업적 가치 입증재현성 : 상세한 실험 설정 및 데이터 설명 제공영감 : 다른 전자상거래 속성 추출 작업에 참고 자료 제공전자상거래 플랫폼 : 다양한 전자상거래 검색 엔진의 브랜드 인식다중언어 환경 : 다중언어를 지원하는 글로벌 전자상거래 플랫폼대규모 응용 : 대량 쿼리를 처리하는 실시간 시스템속성 추출 : 다른 제품 속성의 엔티티 링킹 작업으로 확대 가능논문은 다음을 포함한 여러 중요한 관련 연구를 인용했다:
PECOS 프레임워크의 원본 논문 Yu et al., 2022 MetaTS-NER 다중언어 수열 표지 모델 Li et al., 2021 전통적 엔티티 링킹 방법 Cao et al., 2017; Le & Titov, 2019 전자상거래 쿼리 이해 관련 연구 Kozareva et al., 2016; Manchanda et al., 2020 종합 평가 : 이는 전자상거래 검색의 중요한 실제 문제를 해결하는 고품질의 응용 연구 논문이다. 방법의 혁신성이 강하고, 실험 검증이 충분하며, 특히 온라인 A/B 테스트가 실제 가치를 입증했다. 이론적 분석과 일부 기술 세부 사항에서 개선 여지가 있지만, 전반적으로 전자상거래 NLP 영역의 중요한 기여이다.