In this work, we address the brand entity linking problem for e-commerce search queries. The entity linking task is done by either i)a two-stage process consisting of entity mention detection followed by entity disambiguation or ii) an end-to-end linking approaches that directly fetch the target entity given the input text. The task presents unique challenges: queries are extremely short (averaging 2.4 words), lack natural language structure, and must handle a massive space of unique brands. We present a two-stage approach combining named-entity recognition with matching, and a novel end-to-end solution using extreme multi-class classification. We validate our solutions by both offline benchmarks and the impact of online A/B test.
๋
ผ๋ฌธ ID : 2502.01555์ ๋ชฉ : Query Brand Entity Linking in E-Commerce Search์ ์ : Dong Liu, Sreyashi Nag (Amazon)๋ถ๋ฅ : cs.IR cs.AI cs.LG๋ฐํ ์๊ฐ/ํํ : 2025๋
(arXiv ์ฌ์ ์ธ์๋ณธ)๋
ผ๋ฌธ ๋งํฌ : https://arxiv.org/abs/2502.01555 ๋ณธ ๋
ผ๋ฌธ์ ์ ์์๊ฑฐ๋ ๊ฒ์ ์ฟผ๋ฆฌ์์์ ๋ธ๋๋ ์ํฐํฐ ๋งํน ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ค. ์ํฐํฐ ๋งํน ์์
์ ๋ ๊ฐ์ง ๋ฐฉ์์ผ๋ก ์ํ๋๋ค: 1) ์ํฐํฐ ์ธ๊ธ ํ์ง์ ์ํฐํฐ ์๊ฑฐ๊ณก(disambiguation)์ ํฌํจํ๋ 2๋จ๊ณ ํ๋ก์ธ์ค; 2) ์
๋ ฅ ํ
์คํธ์์ ๋ชฉํ ์ํฐํฐ๋ฅผ ์ง์ ํ๋ํ๋ ์ข
๋จ๊ฐ(end-to-end) ๋งํน ๋ฐฉ๋ฒ. ๋ณธ ์์
์ ๊ณ ์ ํ ๊ณผ์ ๋ค์ ์ง๋ฉดํ๋ค: ๊ทน๋๋ก ์งง์ ์ฟผ๋ฆฌ(ํ๊ท 2.4๊ฐ ๋จ์ด), ์์ฐ์ธ์ด ๊ตฌ์กฐ ๋ถ์ฌ, ๋๊ท๋ชจ ๋ธ๋๋ ๊ณต๊ฐ ์ฒ๋ฆฌ ํ์์ฑ. ๋ณธ ๋
ผ๋ฌธ์ ๋ช
๋ช
๋ ์ํฐํฐ ์ธ์(Named Entity Recognition)๊ณผ ๋งค์นญ์ ๊ฒฐํฉํ 2๋จ๊ณ ๋ฐฉ๋ฒ๊ณผ ๊ทน๋จ์ ๋ค์ค๋ถ๋ฅ(extreme multi-classification)๋ฅผ ์ฌ์ฉํ๋ ์๋ก์ด ์ข
๋จ๊ฐ ์๋ฃจ์
์ ์ ์ํ๋ค. ์คํ๋ผ์ธ ๋ฒค์น๋งํฌ ํ
์คํธ์ ์จ๋ผ์ธ A/B ํ
์คํธ๋ฅผ ํตํด ์๋ฃจ์
์ ์ ํจ์ฑ์ ๊ฒ์ฆํ๋ค.
์ ์์๊ฑฐ๋ ๊ฒ์์์ ๋ธ๋๋ ์ธ์์ ์ ํ ์ ํ ๋ค์์ผ๋ก ๋ ๋ฒ์งธ๋ก ์ค์ํ ์์ฑ์ด๋ค. ๋ธ๋๋๋ช
(์ง์ ์ธ๊ธ์ด๋ ๊ฐ์ ์ธ๊ธ์ด๋ )์ ์ฌ๋ฐ๋ฅด๊ฒ ์ธ์ํ๋ ๊ฒ์ ๊ฒ์ ์ฟผ๋ฆฌ ์ดํด์ ์ค์ํ ๊ตฌ์ฑ ์์์ด๋ฉฐ, ์์ง์ ์ผํ ๊ฒฝํ ์ ๊ณต์ ํ์์ ์ด๋ค.
์ฟผ๋ฆฌ ํน์ฑ ์ ์ฝ : ์ ์์๊ฑฐ๋ ์ฟผ๋ฆฌ๋ ๊ทน๋๋ก ์งง์ผ๋ฉฐ(ํ๊ท 2.4๊ฐ ๋จ์ด), ์์ฐ์ธ์ด ๊ตฌ์กฐ๊ฐ ๋ถ์กฑํ์ฌ ์คํ์์ค NLP ๋ชจ๋ธ์ด ์ด๋ฌํ ์ฟผ๋ฆฌ ๋ถํฌ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ด๋ ต๋ค๊ฑฐ๋ํ ๋ธ๋๋ ๊ณต๊ฐ : ์์ญ๋ง ๊ฐ์ ๊ณ ์ ๋ธ๋๋๋ฅผ ์ฒ๋ฆฌํด์ผ ํ๋ฉฐ, ์ง์์ ์ผ๋ก ์๋ก์ด ๋ธ๋๋๊ฐ ์ถ๊ฐ๋๋ค๋ค์์ฑ ๋ฌธ์ :
์๋ก ๋ค๋ฅธ ์ธ์ด ๋ฐ ์ง์ญ์์์ ๋ธ๋๋๋ช
๋ณํ ํต์ผ ๋์ผ ๋ธ๋๋์ ๋ค์ํ ํ๋ฉด ํํ(์ฝ์ vs ์ ์ฒด๋ช
) ๋ชจ๋ธ๋๋์ ์๋ธ๋ธ๋๋ ๊ด๊ณ ์ธ์ ๊ธฐ์กด์ ๋ฌธ์์ด ๊ธฐ๋ฐ ๋ธ๋๋ ์ธ์ ๋ฐฉ๋ฒ์๋ ํ๊ณ๊ฐ ์์ผ๋ฉฐ, ๋ธ๋๋ ๊ฐ๋
์ ๋จ์ผ ๋ช
๋ช
๊ณต๊ฐ์ ์ ์ญ ๋ธ๋๋ ์ํฐํฐ๋ก ํต์ผํ์ฌ ์ธ์ด, ์์ , ํ๋ฉด ํํ ์ ๋ฐ์ ๊ฑธ์น ํต์ผ๋ ์ธ์์ ๊ตฌํํ ํ์๊ฐ ์๋ค.
2๋จ๊ณ ์ํฐํฐ ๋งํน ๋ชจ๋ธ ๊ตฌ์ถ : ์ฌ์ ํ์ต๋ NER ๋ชจ๋ธ๊ณผ ํ๋ฉด ํํ ๋งค์นญ์ ๊ฒฐํฉํ ๋ธ๋๋ ์ํฐํฐ ์์ธก ํ๋ ์์ํฌ๋งค์นญ ๊ธฐ์ ํ์ : ์ดํ ๋ฐ ์๋ฏธ๋ก ์ ๋งค์นญ ๊ธฐ์ ๊ฐ๋ฐ, ๋๊ท๋ชจ ๋ธ๋๋ ์ถ๋ ฅ ๊ณต๊ฐ์ ์ํฐํฐ ์์ธก ์ต์ ํ๋ฅผ ์ํ ์ ํ ์ ํ ๊ธฐ๋ฐ ํํฐ๋ง ๋จ๊ณ ์ ์์ข
๋จ๊ฐ ๊ทน๋จ์ ๋ค์ค๋ถ๋ฅ ๋ชจ๋ธ ์ ์ : ๊ฒ์ ์ฟผ๋ฆฌ๋ฅผ ์
๋ ฅ์ผ๋ก ํ์ฌ ๊ด๋ จ ๋ธ๋๋ ์ํฐํฐ๋ฅผ ์ง์ ์์ธกํ๊ณ 2๋จ๊ณ ๋ชจ๋ธ๊ณผ ์ตํฉํฌ๊ด์ ๊ฒ์ฆ : ๋๊ท๋ชจ ์คํ๋ผ์ธ ์คํ ๋ฒค์น๋งํฌ ํ
์คํธ ๋ฐ ์จ๋ผ์ธ A/B ํ
์คํธ๋ฅผ ํตํ ์๋ฃจ์
์ ํจ์ฑ ๊ฒ์ฆ์ฃผ์ด์ง ๋ธ๋๋ ๊ฒ์ ์ฟผ๋ฆฌ(์: " running shoes")์์ ๋ธ๋๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๊ณ ์ ๋ธ๋๋ ์ํฐํฐ๋ฅผ ์ธ์ํ๊ณ ๋งํนํ๋ค. ์
๋ ฅ์ ์๋ณธ ์ฟผ๋ฆฌ ํ
์คํธ์ด๊ณ , ์ถ๋ ฅ์ ํด๋นํ๋ ๋ธ๋๋ ์ํฐํฐ ID์ด๋ค.
๊ธฐ๋ณธ 2๋จ๊ณ ๋ฐฉ๋ฒ (NER + ์ ํ ์ดํ ๋งค์นญ) :
1๋จ๊ณ : MetaTS-NER ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋ธ๋๋ ์ธ๊ธ ์ถ์ถ
2๋จ๊ณ : ์ ์ ์ฌ์ ์ ํตํ ์ ํ ๋ฌธ์์ด ๋งค์นญ
ํํฐ๋ง ๋จ๊ณ : ์ ํ ์ ํ ๊ธฐ๋ฐ ์๊ฑฐ๊ณก
๊ฐ์ ๋ 2๋จ๊ณ ๋ฐฉ๋ฒ (NER + PECOS ์๋ฏธ๋ก ์ ๋งค์นญ) :
๋งค์นญ ๋จ๊ณ๋ฅผ ๊ทน๋จ์ ๋ค์ค๋ถ๋ฅ ๋ฌธ์ ๋ก ๋ชจ๋ธ๋ง PECOS ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋๊ท๋ชจ ๋ธ๋๋ ์ํฐํฐ ๊ณต๊ฐ ์ฒ๋ฆฌ(์ฝ 6๋ง ๊ฐ ์ํฐํฐ) ๋ธ๋๋ ์ํฐํฐ ๋ฐ ๊ด๋ จ์ฑ ์ ์ ์ถ๋ ฅ: (E_ID, S) = g_M2E(m) ์ฟผ๋ฆฌ์์ ๋ธ๋๋ ์ํฐํฐ๋ฅผ ์ง์ ์์ธกํ์ฌ NER ๋จ๊ณ์ ์ค๋ฅ ์ ํ ๋ฐฉ์ง:
(E_ID, S) = g_Q2E(q)
e = h(E_ID, PT_q, S, q)
์ฃผ์ ํน์ฑ:
๋น๋ธ๋๋ ์ฟผ๋ฆฌ ์ฒ๋ฆฌ๋ฅผ ์ํ NIL ํด๋์ค ์ถ๊ฐ ์๊ฐ ๋ณต์ก๋: O(b ร log L), ์ฌ๊ธฐ์ b๋ ๋น ํฌ๊ธฐ, L์ ๋ธ๋๋ ์ํฐํฐ ์ ๊ณต๊ฐ ๋ณต์ก๋: O(d ร L)์์ O(d ร log L)๋ก ๊ฐ์ 2๋จ๊ณ ์ ํ ๋งค์นญ๊ณผ ์ข
๋จ๊ฐ ๋ฐฉ๋ฒ์ ์ฅ์ ์ ๊ฒฐํฉ:
๋ ๋ฐฉ๋ฒ์ ๋ณ๋ ฌ๋ก ์คํ ๋์ ์ ํ๋๋ฅผ ๋ณด์ฅํ๊ธฐ ์ํด ์ ํ ๋งค์นญ ๊ฒฐ๊ณผ ์ฐ์ ์ ํ ์ปค๋ฒ๋ฆฌ์ง ํฅ์์ ์ํด Q2E-PECOS ๊ฒฐ๊ณผ๋ก ํด๋ฐฑ ๋ธ๋๋ ๋งํน์์์ PECOS ์ ์ฉ : ๊ทน๋จ์ ๋ค์ค๋ถ๋ฅ ํ๋ ์์ํฌ๋ฅผ ์ ์์๊ฑฐ๋ ๋ธ๋๋ ์ํฐํฐ ๋งํน์ ์ฒ์ ์ ์ฉ์ ํ ์ ํ ๋ณด์กฐ ์๊ฑฐ๊ณก : ์ฟผ๋ฆฌ ์ ํ ์ ํ ์ ๋ณด๋ฅผ ํ์ฉํ ๋ธ๋๋ ์ํฐํฐ ์๊ฑฐ๊ณก๋ค์ค์ธ์ด ์ง์ : 13๊ฐ ์ธ์ด์ ๋ธ๋๋ ์ธ์ ์ง์์ตํฉ ์ ๋ต : ๋์ ์ ํ๋์ ๋์ ์ฌํ์จ ๋ฐฉ๋ฒ์ ๊ต๋ฌํ ๊ฒฐํฉ๋ฐ์ดํฐ์
๊ท๋ชจ ๋ธ๋๋ ์ํฐํฐ ์ 61,697 Brand2entity 616,974 ๊ฐํ ์ฃผ์ ๋ฐ์ดํฐ(SL) 806,972 ์ฝํ ์ฃผ์ ๋ฐ์ดํฐ(WL) 1,308,816 ํ
์คํธ ๋ฐ์ดํฐ 28,439
๋ฐ์ดํฐ ๊ตฌ์ฑ :
Brand2entity (B2E) : ๋ธ๋๋๋ช
-์ํฐํฐ ์์ ๋ด๋ถ ์ฌ์ ๊ฐํ ์ฃผ์ ๋ฐ์ดํฐ(SL) : ์ธ๊ฐ์ด ์ฃผ์ํ 13๊ฐ ์ธ์ด ๊ฒ์ ์ฟผ๋ฆฌ ๋ฐ์ดํฐ์ฝํ ์ฃผ์ ๋ฐ์ดํฐ(WL) : ์ญ์ฌ์ ์ฟผ๋ฆฌ-์ ํ ์ํธ์์ฉ์์ ํ์๋ ์ฝํ ๊ฐ๋
๋ฐ์ดํฐ์ฌํ์จ : Recall = |C| / |L_single|์ ํ๋ : Precision = |C| / |P_single|์ปค๋ฒ๋ฆฌ์ง : Coverage = |P_single| / |T|F1 ์ ์ : ์กฐํ ํ๊ท ์ฌ๊ธฐ์ C๋ ์ ํํ ์์ธก ์งํฉ, L_single์ ๋จ์ผ ๋ธ๋๋ ์ํฐํฐ ๋ ์ด๋ธ ์ฟผ๋ฆฌ ์งํฉ, P_single์ ๋ชจ๋ธ์ด ์์ธกํ ๋จ์ผ ๋ธ๋๋ ์ํฐํฐ ์ฟผ๋ฆฌ ์งํฉ์ด๋ค.
NER + ์ ํ ์ดํ ๋งค์นญ : ๊ธฐ๋ณธ 2๋จ๊ณ ๋ฐฉ๋ฒNER + M2E-PECOS : ์๋ฏธ๋ก ์ ๋งค์นญ์ 2๋จ๊ณ ๋ฐฉ๋ฒBi-encoder : Qwen3 Embedding 0.6B๋ฅผ ์ฌ์ฉํ ์ด์ค ์ธ์ฝ๋ ๊ธฐ๋ณธ์ Q2E-PECOS : ์ข
๋จ๊ฐ PECOS ๋ฐฉ๋ฒ์ตํฉ ๋ชจ๋ธ : ํผํฉ ๋ฐฉ๋ฒ์ ๋ค์ํ ์กฐํฉ๋ฐฉ๋ฒ ํ๋ จ ๋ฐ์ดํฐ ์ตํฉ Group-1 Group-2 ์ปค๋ฒ๋ฆฌ์ง/์ฌํ์จ/์ ํ๋/F1 ์ปค๋ฒ๋ฆฌ์ง/์ฌํ์จ/์ ํ๋/F1 NER + ์ ํ ๋งค์นญ โ โ 58.28/64.66/97.22/77.67 70.16/86.21/99.15/92.23 Q2E-PECOS โ โ โ 70.98/75.26/96.13/84.42 80.77/94.71/98.92/96.77 Q2E-PECOS โ โ โ โ 75.31/77.35/94.93/85.24 85.09/94.64/98.55/96.56
์ฃผ์ ๋ฐ๊ฒฌ :
์ข
๋จ๊ฐ Q2E-PECOS๋ ์ปค๋ฒ๋ฆฌ์ง์ ์ฌํ์จ์ ํฌ๊ฒ ํฅ์ ์ตํฉ ์ ๋ต์ ๋์ ์ ํ๋๋ฅผ ์ ์งํ๋ฉด์ ์ฌํ์จ ํฅ์ ์ฝํ ์ฃผ์ ๋ฐ์ดํฐ๋ ์ข
๋จ๊ฐ ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์์ ๋ช
๋ฐฑํ ์ํฅ ๋ค์ํ ์ธ์ด์ ์ฑ๋ฅ ์ฐจ์ด๋ ์๋นํ๋ค:
๊ณ ์์ ์ธ์ด (์์ด, ์คํ์ธ์ด): ๋ชจ๋ ๋ฐฉ๋ฒ์ด ์ํธํ ์ฑ๋ฅ ๋ฐํ์ ์์ ์ธ์ด (์ผ๋ณธ์ด): NER+์ ํ ๋งค์นญ ์ปค๋ฒ๋ฆฌ์ง๋ 19.03%์ ๋ถ๊ณผ์ตํฉ ๋ฐฉ๋ฒ : ๋ชจ๋ ์ธ์ด์์ ์ ํ๋์ ์ฌํ์จ์ ๊ท ํ ์ ์ง85K๊ฐ์ ๋น๋ธ๋๋ ์ฟผ๋ฆฌ์์์ ๊ฑฐ์ง ์์ฑ์จ:
NER + ์ ํ ๋งค์นญ: 1.177% Q2E-PECOS(์ฝํ ์ฃผ์ ํฌํจ): 6.550% ์ข
๋จ๊ฐ ๋ฐฉ๋ฒ์ ๊ฑฐ์ง ์์ฑ์จ์ด ๋ ๋์ง๋ง, ์ ์ฒด ์ฑ๋ฅ ํฅ์์ ๊ณ ๋ คํ๋ฉด ์ฌ์ ํ ํ์ฉ ๋ฒ์ ๋ด์ด๋ค.
์งํ Group-1 ์์ Group-2 ์์ ๋ธ๋๋ ์ํฐํฐ ์ฌํ์จ +11.00% +5.44% ๊ณ ๊ฐ ์ฐธ์ฌ๋ +0.02% - ์ฆ์ ๊ธฐ์ฌ ์ด์ต +0.03% -
์จ๋ผ์ธ ํ
์คํธ๋ ์ตํฉ ์๋ฃจ์
์ ์ค์ ๋น์ฆ๋์ค ๊ฐ์น๋ฅผ ํ์ธํ๋ค.
2๋จ๊ณ ์ค๊ณ : ์ํฐํฐ ์ธ์ + ์ํฐํฐ ์๊ฑฐ๊ณกํ๋ณด ์์ฑ : ํ๋ฉด ํํ ๋งค์นญ, ๋ณ์นญ ํ์ฅ, ์ฌ์ ํ๋ฅ ๋งค์นญํ๋ณด ์์ ์ง์ : ํธ์ง ๊ฑฐ๋ฆฌ, ์๋ฏธ๋ก ์ ๋ฒกํฐ ์ ์ฌ๋๊ฒฐํฉ ํ์ต : ์ธ์๊ณผ ์๊ฑฐ๊ณก์ ๋์์ ์ํ์์ด ํ์ง : BERT ๊ธฐ๋ฐ ํ ํฐ ๋ถ๋ฅ์๋ํ๊ท ์์ฑ : ํ ํฐ๋ณ ์ํฐํฐ๋ช
์์ฑ์ฟผ๋ฆฌ ํน์ฑ : ์งง์, ๋
ธ์ด์ฆ, ๋ชจํธ์ฑ์์ฉ ์๋๋ฆฌ์ค : ์ ํ ๊ฒ์, ์ฟผ๋ฆฌ ์ฌ์์ฑ, ๊ฒ์ ๊ฒฐ๊ณผ ํ์ง ํฅ์๊ธฐ์ ์ ๊ณผ์ : ์ดํ ๋ฌธ๋งฅ ๋ถ์ฌ, ๋๊ท๋ชจ ์ง์ ๊ธฐ๋ฐ์ข
๋จ๊ฐ ๋ฐฉ๋ฒ์ ์ฅ์ : Q2E-PECOS๋ ์ปค๋ฒ๋ฆฌ์ง์ ์ฌํ์จ์์ ์ ํต์ 2๋จ๊ณ ๋ฐฉ๋ฒ์ ํฌ๊ฒ ๋ฅ๊ฐ์ตํฉ ์ ๋ต์ ํจ๊ณผ์ฑ : ๋์ ์ ํ๋์ ์ดํ ๋งค์นญ๊ณผ ๋์ ์ฌํ์จ์ ์๋ฏธ๋ก ์ ๋งค์นญ์ ๊ฒฐํฉํ ์ตํฉ ๋ฐฉ๋ฒ์ด ์ต๊ณ ์ฑ๋ฅ ๋ฐํ๋ฐ์ดํฐ์ ์ค์์ฑ : ์ฝํ ์ฃผ์ ๋ฐ์ดํฐ๋ ์ข
๋จ๊ฐ ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์์ ํต์ฌ์ ์ค์ ๊ฐ์น : ์จ๋ผ์ธ A/B ํ
์คํธ๋ ๋ฐฉ๋ฒ์ ์์
์ ๊ฐ์น ์
์ฆ๊ฑฐ์ง ์์ฑ์จ : ์ข
๋จ๊ฐ ๋ฐฉ๋ฒ์ ๋น๋ธ๋๋ ์ฟผ๋ฆฌ์์์ ๊ฑฐ์ง ์์ฑ์จ์ด ๋์์ธ์ด ์ฐจ์ด : ์ ์์ ์ธ์ด ์ฑ๋ฅ ๊ฐ์ ์ฌ์ง ์์๊ณ์ฐ ๋ณต์ก๋ : ์ตํฉ ๋ฐฉ๋ฒ์ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋ณ๋ ฌ ์คํ ํ์๋ฐ์ดํฐ ์์กด์ฑ : ์ข
๋จ๊ฐ ํ๋ จ์ ์ํด ๋๋์ ์ฝํ ์ฃผ์ ๋ฐ์ดํฐ ํ์๋ชจ๋ธ ์ต์ ํ : ๊ฑฐ์ง ์์ฑ์จ ์ถ๊ฐ ๊ฐ์, ์ ์์ ์ธ์ด ์ฑ๋ฅ ํฅ์ํจ์จ์ฑ ํฅ์ : ๊ณ์ฐ ๋ณต์ก๋ ์ต์ ํ, ์ถ๋ก ์ง์ฐ ๊ฐ์๊ต์ฐจ ์์ญ ์ด์ : ๋ฐฉ๋ฒ์ ๋ค๋ฅธ ์ ์์๊ฑฐ๋ ์์ฑ ์ถ์ถ ์์
์ผ๋ก ํ๋๋์ ์
๋ฐ์ดํธ : ์๋ก์ด ๋ธ๋๋์ ์ค์๊ฐ ์ถ๊ฐ ๋ฐ ์
๋ฐ์ดํธ ์ฒ๋ฆฌ๋ฌธ์ ์ ์ค์์ฑ : ์ ์์๊ฑฐ๋ ๊ฒ์์ ํต์ฌ ๋ฌธ์ ํด๊ฒฐ, ๋์ ์ค์ฉ์ ๊ฐ์น๋ฐฉ๋ฒ์ ํ์ ์ฑ : PECOS ๊ทน๋จ์ ๋ค์ค๋ถ๋ฅ ํ๋ ์์ํฌ๋ฅผ ๋ธ๋๋ ์ํฐํฐ ๋งํน์ ์ฒ์ ์ ์ฉํฌ๊ด์ ์คํ : ๋ค์ค์ธ์ด, ๋ค์ค ๋ฐฉ๋ฒ ๋น๊ต, ์จ๋ผ์ธ A/B ํ
์คํธ ๊ฒ์ฆ ํฌํจ๊ณตํ์ ์ค์ฉ์ฑ : ์ค์ ๋ฐฐํฌ์ ํจ์จ์ฑ๊ณผ ์ ํ๋ ๊ท ํ ๊ณ ๋ คํ๋ถํ ๋ฐ์ดํฐ : ๋๊ท๋ชจ ์ค์ ์ ์์๊ฑฐ๋ ๋ฐ์ดํฐ ์ฌ์ฉ์ด๋ก ์ ๋ถ์ ๋ถ์กฑ : ์ข
๋จ๊ฐ ๋ฐฉ๋ฒ์ด ๋ ํจ๊ณผ์ ์ธ ์ด์ ์ ๋ํ ์ด๋ก ์ ์ค๋ช
๋ถ์กฑ์ ํ๋ ์๊ฑฐ ์คํ : ๊ฐ ๊ตฌ์ฑ ์์ ๊ธฐ์ฌ๋ ๋ถ์ ๋ถ์กฑ๊ฑฐ์ง ์์ฑ ๋ฌธ์ : ์ข
๋จ๊ฐ ๋ฐฉ๋ฒ์ ๊ฑฐ์ง ์์ฑ์จ์ด ๋์ผ๋ฉฐ ์ถ๊ฐ ์ต์ ํ ํ์๊ณ์ฐ ์ค๋ฒํค๋ : ์ตํฉ ๋ฐฉ๋ฒ์ ๊ณ์ฐ ๋ณต์ก๋ ๋ถ์ ๋ถ์กฑํ์ ๊ธฐ์ฌ : ์ ์์๊ฑฐ๋ NLP ์์ญ์ ์๋ก์ด ๊ธฐ์ ์๋ฃจ์
์ ๊ณต์ค์ฉ์ ๊ฐ์น : Amazon์ ์ค์ ๋ฐฐํฌ๋์ด ์์
์ ๊ฐ์น ์
์ฆ์ฌํ์ฑ : ์์ธํ ์คํ ์ค์ ๋ฐ ๋ฐ์ดํฐ ์ค๋ช
์ ๊ณต์๊ฐ : ๋ค๋ฅธ ์ ์์๊ฑฐ๋ ์์ฑ ์ถ์ถ ์์
์ ์ฐธ๊ณ ์๋ฃ ์ ๊ณต์ ์์๊ฑฐ๋ ํ๋ซํผ : ๋ค์ํ ์ ์์๊ฑฐ๋ ๊ฒ์ ์์ง์ ๋ธ๋๋ ์ธ์๋ค์ค์ธ์ด ํ๊ฒฝ : ๋ค์ค์ธ์ด๋ฅผ ์ง์ํ๋ ๊ธ๋ก๋ฒ ์ ์์๊ฑฐ๋ ํ๋ซํผ๋๊ท๋ชจ ์์ฉ : ๋๋ ์ฟผ๋ฆฌ๋ฅผ ์ฒ๋ฆฌํ๋ ์ค์๊ฐ ์์คํ
์์ฑ ์ถ์ถ : ๋ค๋ฅธ ์ ํ ์์ฑ์ ์ํฐํฐ ๋งํน ์์
์ผ๋ก ํ๋ ๊ฐ๋ฅ๋
ผ๋ฌธ์ ๋ค์์ ํฌํจํ ์ฌ๋ฌ ์ค์ํ ๊ด๋ จ ์ฐ๊ตฌ๋ฅผ ์ธ์ฉํ๋ค:
PECOS ํ๋ ์์ํฌ์ ์๋ณธ ๋
ผ๋ฌธ Yu et al., 2022 MetaTS-NER ๋ค์ค์ธ์ด ์์ด ํ์ง ๋ชจ๋ธ Li et al., 2021 ์ ํต์ ์ํฐํฐ ๋งํน ๋ฐฉ๋ฒ Cao et al., 2017; Le & Titov, 2019 ์ ์์๊ฑฐ๋ ์ฟผ๋ฆฌ ์ดํด ๊ด๋ จ ์ฐ๊ตฌ Kozareva et al., 2016; Manchanda et al., 2020 ์ข
ํฉ ํ๊ฐ : ์ด๋ ์ ์์๊ฑฐ๋ ๊ฒ์์ ์ค์ํ ์ค์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ณ ํ์ง์ ์์ฉ ์ฐ๊ตฌ ๋
ผ๋ฌธ์ด๋ค. ๋ฐฉ๋ฒ์ ํ์ ์ฑ์ด ๊ฐํ๊ณ , ์คํ ๊ฒ์ฆ์ด ์ถฉ๋ถํ๋ฉฐ, ํนํ ์จ๋ผ์ธ A/B ํ
์คํธ๊ฐ ์ค์ ๊ฐ์น๋ฅผ ์
์ฆํ๋ค. ์ด๋ก ์ ๋ถ์๊ณผ ์ผ๋ถ ๊ธฐ์ ์ธ๋ถ ์ฌํญ์์ ๊ฐ์ ์ฌ์ง๊ฐ ์์ง๋ง, ์ ๋ฐ์ ์ผ๋ก ์ ์์๊ฑฐ๋ NLP ์์ญ์ ์ค์ํ ๊ธฐ์ฌ์ด๋ค.