2025-11-20T07:34:14.820650

CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms

Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic

CardRewriter: लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए ज्ञान कार्ड का लाभ उठाना

बुनियादी जानकारी

  • पेपर ID: 2510.10095
  • शीर्षक: CardRewriter: लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए ज्ञान कार्ड का लाभ उठाना
  • लेखक: Peiyuan Gong, Feiran Zhu, Yaqi Yin, Chenglei Dai, Chao Zhang, Kai Zheng, Wentian Bao, Jiaxin Mao, Yi Zhang
  • वर्गीकरण: cs.IR (सूचना पुनः प्राप्ति), cs.CL (कम्प्यूटेशनल भाषाविज्ञान)
  • प्रकाशन तिथि: 11 अक्टूबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.10095

सारांश

लघु-वीडियो प्लेटफॉर्म तेजी से नई पीढ़ी की सूचना पुनः प्राप्ति प्रणाली बन गए हैं, जहां उपयोगकर्ता क्वेरी के माध्यम से वांछित वीडियो प्राप्त करते हैं। हालांकि, उपयोगकर्ता क्वेरी, विशेषकर दीर्घ-पूंछ क्वेरी, अक्सर वर्तनी त्रुटियों, अधूरे अभिव्यक्ति और अस्पष्ट इरादे से ग्रस्त होती हैं, जिससे उपयोगकर्ता की अपेक्षाएं और पुनः प्राप्ति परिणाम मेल नहीं खाते। हालांकि बड़े भाषा मॉडल (LLMs) ई-कॉमर्स क्षेत्र में दीर्घ-पूंछ क्वेरी पुनर्लेखन में उत्कृष्ट प्रदर्शन करते हैं, लेकिन लघु-वीडियो प्लेटफॉर्म पर चुनौतियों का सामना करते हैं, क्योंकि प्लेटफॉर्म-विशिष्ट सामग्री (जैसे लघु-वीडियो, लाइव स्ट्रीम, माइक्रो-ड्रामा और उपयोगकर्ता सामाजिक नेटवर्क) उनके प्रशिक्षण वितरण से परे है। इस चुनौती को हल करने के लिए, यह पेपर CardRewriter प्रस्तावित करता है, जो एक LLM-आधारित ढांचा है जो डोमेन-विशिष्ट ज्ञान को शामिल करके दीर्घ-पूंछ क्वेरी पुनर्लेखन को बढ़ाता है। यह विधि प्रत्येक क्वेरी के लिए बहु-स्रोत संबंधित ज्ञान को एकत्रित करती है और इसे सूचनात्मक और क्वेरी-प्रासंगिक ज्ञान कार्ड में संक्षेपित करती है, फिर LLM को उपयोगकर्ता के इरादे को बेहतर ढंग से समझने और अधिक प्रभावी क्वेरी पुनर्लेखन उत्पन्न करने के लिए निर्देशित करती है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

लघु-वीडियो प्लेटफॉर्म उपयोगकर्ता क्वेरी तीन प्रमुख चुनौतियों का सामना करती हैं:

  1. वर्तनी त्रुटियां: उपयोगकर्ता द्वारा इनपुट की गई क्वेरी शब्दों में वर्तनी त्रुटियां हो सकती हैं
  2. अधूरी अभिव्यक्ति: उपयोगकर्ता क्वेरी में महत्वपूर्ण जानकारी की कमी है, जिससे पुनः प्राप्ति परिणाम अनुपयुक्त हैं
  3. अस्पष्ट इरादा: विशेषकर प्लेटफॉर्म-विशिष्ट सामग्री से संबंधित होने पर, क्वेरी का इरादा स्पष्ट नहीं है

समस्या की महत्ता

  • लघु-वीडियो प्लेटफॉर्म एक महत्वपूर्ण सूचना पुनः प्राप्ति प्रणाली बन गए हैं, जो अरबों उपयोगकर्ताओं को सेवा प्रदान करते हैं
  • क्वेरी गुणवत्ता सीधे उपयोगकर्ता अनुभव और प्लेटफॉर्म व्यावसायिक मूल्य को प्रभावित करती है
  • दीर्घ-पूंछ क्वेरी काफी अनुपात में होती हैं, लेकिन उन्हें संभालना कठिन है

मौजूदा विधियों की सीमाएं

  1. एम्बेडिंग-आधारित विधियां: शब्दार्थ समान क्वेरी पुनः प्राप्ति पर निर्भर, दीर्घ-पूंछ क्वेरी के लिए सीमित प्रभाव
  2. जनरेटिव विधियां: LLM ई-कॉमर्स क्षेत्र में अच्छा प्रदर्शन करते हैं, लेकिन लघु-वीडियो प्लेटफॉर्म-विशिष्ट सामग्री की समझ अपर्याप्त है
  3. डोमेन अनुकूलन समस्या: मौजूदा LLM को लघु-वीडियो, लाइव स्ट्रीम, माइक्रो-ड्रामा आदि पर प्रशिक्षित नहीं किया गया है

अनुसंधान प्रेरणा

प्लेटफॉर्म-विशिष्ट ज्ञान को शामिल करके, लघु-वीडियो प्लेटफॉर्म क्वेरी के प्रति LLM की समझ और पुनर्लेखन क्षमता को बढ़ाएं, विशेषकर प्लेटफॉर्म-विशिष्ट सामग्री से संबंधित दीर्घ-पूंछ क्वेरी के लिए।

मुख्य योगदान

  1. CardRewriter ढांचा प्रस्तावित करना: लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए पहला विशेष LLM ढांचा, ज्ञान कार्ड के माध्यम से प्लेटफॉर्म-विशिष्ट ज्ञान को प्रभावी ढंग से एकीकृत करता है
  2. दो-चरणीय प्रशिक्षण रणनीति डिजाइन करना: पर्यवेक्षित सूक्ष्म-ट्यूनिंग (SFT) और समूह सापेक्ष नीति अनुकूलन (GRPO) को जोड़ते हुए, प्रासंगिकता और प्रभावशीलता को संतुलित करने के लिए अनुकूलित पुरस्कार प्रणाली का उपयोग करता है
  3. व्यावहारिक प्रभाव सत्यापित करना: Kuaishou प्लेटफॉर्म पर तैनाती सत्यापन, ऑफलाइन और ऑनलाइन प्रयोग दोनों महत्वपूर्ण सुधार दिखाते हैं
  4. संपूर्ण समाधान प्रदान करना: ज्ञान संग्रह, कार्ड जनरेशन से क्वेरी पुनर्लेखन तक एंड-टू-एंड समाधान

विधि विवरण

कार्य परिभाषा

इनपुट क्वेरी x दिए जाने पर, CardRewriter का लक्ष्य पुनर्लेखित क्वेरी y उत्पन्न करना है, जो उपयोगकर्ता के इरादे के अनुरूप अधिक वीडियो सामग्री को पुनः प्राप्त कर सके। संपूर्ण प्रक्रिया को इस प्रकार व्यक्त किया जा सकता है:

y = G_θ(x, c), c = C_θ(x, M)

जहां c ज्ञान कार्ड है, M बहु-स्रोत ज्ञान है, C_θ कार्ड जनरेशन मॉडल है, G_θ क्वेरी पुनर्लेखन मॉडल है।

मॉडल आर्किटेक्चर

1. ज्ञान संग्रह चरण

बहु-मोडल वीडियो ज्ञान निष्कर्षण:

  • दृश्य सामग्री: वीडियो के तीन मुख्य फ्रेम निकालें
  • पाठ्य सामग्री: शीर्षक, उपशीर्षक, कवर OCR पाठ, लेखक नाम, पृष्ठभूमि संगीत

समान क्वेरी विस्तार:

  • नियम-आधारित मिलान (Q2Q): मूल क्वेरी के साथ शब्दावली ओवरलैप वाली और पुनः प्राप्त वीडियो सूची प्रतिच्छेदन वाली क्वेरी चुनें
  • एम्बेडिंग-आधारित मिलान (EMB): क्वेरी के बीच एम्बेडिंग समानता की गणना करें

खुली डोमेन दस्तावेज़ पूरक: API सेवा के माध्यम से संबंधित खुली डोमेन दस्तावेज़ प्राप्त करें जो पूरक ज्ञान स्रोत के रूप में कार्य करते हैं

2. कार्ड-आधारित पुनर्लेखन चरण

ज्ञान कार्ड जनरेशन:

  • इनपुट: मूल क्वेरी x और बहु-स्रोत ज्ञान M
  • आउटपुट: संक्षिप्त और प्रासंगिक ज्ञान कार्ड c
  • उद्देश्य: शोर को दूर करना, एकीकृत करना, क्वेरी से सीधे संबंधित सामग्री को उजागर करना

क्वेरी पुनर्लेखन:

  • इनपुट: मूल क्वेरी x और ज्ञान कार्ड c
  • आउटपुट: पुनर्लेखित क्वेरी y
  • उद्देश्य: कार्ड जानकारी का उपयोग करके खोज संदर्भ को बेहतर ढंग से समझना

तकनीकी नवाचार बिंदु

  1. ज्ञान कार्ड डिजाइन: बहु-स्रोत ज्ञान को सीधे इंजेक्ट करने की तुलना में, ज्ञान कार्ड संरचनात्मक असंगति, अत्यधिक शोर और सीमित प्रासंगिकता की समस्याओं को प्रभावी ढंग से हल करते हैं
  2. दो-चरणीय प्रशिक्षण रणनीति:
    • SFT चरण: उच्च-गुणवत्ता डेटा का उपयोग करके पर्यवेक्षित सूक्ष्म-ट्यूनिंग
    • GRPO चरण: सुदृढ़ीकरण सीखने के माध्यम से आगे अनुकूलन
  3. अनुकूलित पुरस्कार प्रणाली:
    R_Overall = {
        R_Sys, if R_Sys > 0
        0.1, if R_Sys = 0 and R_Rel > 0  
        0, if R_Sys = R_Rel = 0
    }
    

    शब्दार्थ प्रासंगिकता और सिस्टम वरीयता को संतुलित करता है

प्रयोगात्मक सेटअप

डेटासेट

प्रशिक्षण डेटासेट:

  • कार्ड जनरेशन: 20 लाख क्वेरी, 16 लाख चतुर्भुज उत्पन्न, फ़िल्टरिंग के बाद 30,000 उच्च-गुणवत्ता त्रिभुज संरक्षित
  • क्वेरी पुनर्लेखन: 40 लाख क्वेरी, 32 लाख त्रिभुज उत्पन्न, फ़िल्टरिंग के बाद SFT के लिए 50,000 जोड़े संरक्षित
  • पुरस्कार मॉडलिंग: 15 लाख क्वेरी, 24 लाख वरीयता जोड़े उत्पन्न

परीक्षण डेटासेट:

  • कार्ड जनरेशन: 10,000 क्वेरी
  • पुरस्कार मॉडलिंग: 10,000 क्वेरी
  • क्वेरी पुनर्लेखन: 15,000 क्वेरी

मूल्यांकन मेट्रिक्स

ऑफलाइन मेट्रिक्स:

  1. Rel (प्रासंगिकता): मॉडल आउटपुट की शब्दार्थ गुणवत्ता का मूल्यांकन करता है
  2. Increment (पुनः प्राप्ति विस्तार): पुनः प्राप्ति कवरेज रेंज में सापेक्ष सुधार को मापता है
  3. Hitrate@K (उपयोगकर्ता संतुष्टि): पुनर्लेखित क्वेरी शीर्ष K परिणामों में उपयोगकर्ता के इरादे के अनुरूप वीडियो पुनः प्राप्त करने का अनुपात

ऑनलाइन मेट्रिक्स:

  1. LVR (लंबी दृश्य दर): उपयोगकर्ताओं द्वारा लंबे समय तक वीडियो देखने का अनुपात
  2. IQRR (सक्रिय क्वेरी पुनर्निर्माण दर): उपयोगकर्ताओं द्वारा सक्रिय रूप से क्वेरी को फिर से तैयार करने का अनुपात
  3. CTR (क्लिक-थ्रू दर): उपयोगकर्ताओं द्वारा पुनः प्राप्ति परिणामों पर क्लिक करने का अनुपात

तुलनात्मक विधियां

  • प्रॉम्प्ट-आधारित पुनर्लेखन विधि
  • SFT और SFT+DPO आधारभूत
  • सीधी ज्ञान इंजेक्शन विधि (Naive RAG)
  • अनुकूलित CSA-QR विधि

कार्यान्वयन विवरण

  • कार्ड जनरेशन: Qwen2.5-VL-7B-Instruct पर आधारित सूक्ष्म-ट्यूनिंग
  • क्वेरी पुनर्लेखन: Qwen3-8B पर आधारित सूक्ष्म-ट्यूनिंग
  • प्रशिक्षण सेटिंग्स: सीखने की दर 1×10^-5, AdamW अनुकूलक, DeepSpeed ZeRO-3 वितरित प्रशिक्षण

प्रयोगात्मक परिणाम

मुख्य परिणाम

विधिज्ञान प्रकारQR-RelIncrementHitrate@50Hitrate@300
मूल क्वेरी---31.40%53.07%
SFT+GRPO-78.98%65.19%41.68%65.71%
SFT+GRPONaive RAG74.28%70.86%41.05%65.63%
CardRewriterCard RAG85.73%74.17%46.64%76.04%

मुख्य निष्कर्ष:

  1. CardRewriter अधिकांश मेट्रिक्स पर सर्वोत्तम प्रदर्शन प्राप्त करता है
  2. ज्ञान कार्ड सीधी ज्ञान इंजेक्शन की तुलना में पुनर्लेखन गुणवत्ता में महत्वपूर्ण सुधार करते हैं
  3. SFT+GRPO प्रशिक्षण रणनीति सर्वोत्तम परिणाम देती है

विलोपन प्रयोग

बहु-स्रोत ज्ञान योगदान विश्लेषण:

  • दृश्य सामग्री हटाएं: QC-Rel 91.16% से 89.37% तक गिरता है
  • पाठ्य सामग्री हटाएं: QC-Rel 86.18% तक गिरता है (अधिक प्रभाव)
  • संबंधित वीडियो हटाएं: QC-Rel 78.27% तक गिरता है (सबसे बड़ा प्रभाव)

पुरस्कार प्रणाली विश्लेषण:

  • केवल प्रासंगिकता पुरस्कार का उपयोग करें: क्वेरी प्रासंगिकता सर्वोच्च लेकिन पुनः प्राप्ति विस्तार सीमित
  • केवल सिस्टम पुरस्कार का उपयोग करें: अधिक नए वीडियो पुनः प्राप्त करता है लेकिन मूल इरादे से विचलित हो सकता है
  • संयुक्त पुरस्कार: प्रासंगिकता और प्रभावशीलता के बीच सर्वोत्तम संतुलन प्राप्त करता है

केस विश्लेषण

पेपर एक विशिष्ट केस प्रस्तुत करता है:

  • मूल क्वेरी: "可口可乐寄人篱下的痛" (उपयोगकर्ता ने निर्माता "可可可乐" को "可口可乐" में गलत लिखा)
  • LLM पुनर्लेखन: "可口可乐 寄人篱下 创意广告" (पेय ब्रांड के लिए गलत संघ)
  • CardRewriter: "可可可乐 被寄养的孩子系列" (उपयोगकर्ता के इरादे को सही ढंग से समझता है)

ऑनलाइन प्रयोग परिणाम

ट्रैफिक प्रकारLVR ↑IQRR ↓CTR ↑
कवरेज ट्रैफिक+1.853%-2.630%+3.729%
पूर्ण ट्रैफिक+0.235%-0.229%+0.342%

ऑनलाइन A/B परीक्षण महत्वपूर्ण सुधार की पुष्टि करता है, विशेषकर कवरेज ट्रैफिक पर प्रभाव स्पष्ट है।

संबंधित कार्य

क्वेरी पुनर्लेखन अनुसंधान

  1. एम्बेडिंग-आधारित विधियां: क्वेरी पुनर्लेखन को पुनः प्राप्ति कार्य के रूप में देखते हैं, समान क्वेरी के माध्यम से मूल क्वेरी को बढ़ाते हैं
  2. जनरेटिव विधियां: संशोधित क्वेरी को सीधे उत्पन्न करते हैं, हाल की LLM विधियां ई-कॉमर्स क्षेत्र में उत्कृष्ट प्रदर्शन करती हैं
  3. डोमेन अनुकूलन: मौजूदा विधियां मुख्य रूप से ई-कॉमर्स परिदृश्य को लक्षित करती हैं, लघु-वीडियो प्लेटफॉर्म अनुसंधान अपेक्षाकृत कम है

पुनः प्राप्ति-संवर्धित जनरेशन

RAG तकनीक पुनः प्राप्त संबंधित जानकारी के माध्यम से जनरेशन गुणवत्ता को बढ़ाती है, यह पेपर इसे क्वेरी पुनर्लेखन कार्य पर लागू करता है, ज्ञान कार्ड के माध्यम से बहु-स्रोत जानकारी को प्रभावी ढंग से एकीकृत करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. CardRewriter ज्ञान कार्ड के माध्यम से लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन समस्या को प्रभावी ढंग से हल करता है
  2. दो-चरणीय प्रशिक्षण रणनीति और अनुकूलित पुरस्कार प्रणाली पुनर्लेखन गुणवत्ता में महत्वपूर्ण सुधार करते हैं
  3. Kuaishou प्लेटफॉर्म पर तैनाती सत्यापन विधि का व्यावहारिक मूल्य साबित करता है

सीमाएं

  1. कम्प्यूटेशनल ओवरहेड: LLM अनुमान को काफी कम्प्यूटेशनल संसाधनों की आवश्यकता है, निकट-लाइन तैनाती रणनीति अपनाई गई है
  2. कवरेज रेंज: वर्तमान में केवल 15-20% दैनिक खोज ट्रैफिक को कवर करता है
  3. डोमेन निर्भरता: विधि लघु-वीडियो प्लेटफॉर्म के लिए डिजाइन की गई है, अन्य क्षेत्रों में प्रयोज्यता को आगे सत्यापन की आवश्यकता है

भविष्य की दिशाएं

  1. कवर की गई क्वेरी रेंज का विस्तार करना
  2. ऑनलाइन अनुमान दक्षता को अनुकूलित करना
  3. क्रॉस-प्लेटफॉर्म और क्रॉस-डोमेन प्रयोज्यता की खोज करना

गहन मूल्यांकन

शक्तियां

  1. समस्या-विशिष्ट दृष्टिकोण: लघु-वीडियो प्लेटफॉर्म क्वेरी पुनर्लेखन की अद्वितीय चुनौतियों की सटीक पहचान करता है
  2. संपूर्ण तकनीकी समाधान: ज्ञान संग्रह से मॉडल प्रशिक्षण तक एंड-टू-एंड समाधान
  3. व्यापक प्रयोगात्मक मूल्यांकन: व्यापक ऑफलाइन प्रयोग, ऑनलाइन तैनाती सत्यापन व्यावहारिक प्रभाव
  4. उच्च इंजीनियरिंग व्यावहारिक मूल्य: बड़े पैमाने पर प्लेटफॉर्म पर तैनात, अरबों उपयोगकर्ताओं को सेवा प्रदान करता है

कमियां

  1. कम्प्यूटेशनल दक्षता: LLM अनुमान विलंबता अधिक है, वास्तविक समय अनुप्रयोग को सीमित करता है
  2. डेटा निर्भरता: प्रशिक्षण सेट निर्माण के लिए बड़ी मात्रा में एनोटेटेड डेटा की आवश्यकता है
  3. व्याख्यात्मकता: ज्ञान कार्ड जनरेशन प्रक्रिया की व्याख्यात्मकता को मजबूत करने की आवश्यकता है
  4. सामान्यीकरण क्षमता: विधि विशिष्ट प्लेटफॉर्म के लिए डिजाइन की गई है, क्रॉस-डोमेन सामान्यीकरण क्षमता पूरी तरह सत्यापित नहीं है

प्रभाव

  1. शैक्षणिक योगदान: लघु-वीडियो प्लेटफॉर्म क्वेरी समझ के लिए नई सोच प्रदान करता है
  2. व्यावहारिक मूल्य: वास्तविक व्यावसायिक समस्याओं को हल करता है, सीधा व्यावसायिक मूल्य है
  3. तकनीकी प्रचार: ज्ञान कार्ड डिजाइन विचार अन्य RAG अनुप्रयोगों में प्रचारित किया जा सकता है

प्रयोज्य परिदृश्य

  1. लघु-वीडियो, लाइव स्ट्रीम आदि सामग्री प्लेटफॉर्म की खोज अनुकूलन
  2. बड़ी मात्रा में प्लेटफॉर्म-विशिष्ट सामग्री वाले ऊर्ध्वाधर डोमेन खोज
  3. बहु-मोडल जानकारी को एकीकृत करने की आवश्यकता वाले क्वेरी समझ कार्य

संदर्भ

पेपर 33 संबंधित संदर्भों को उद्धृत करता है, जो क्वेरी पुनर्लेखन, पुनः प्राप्ति-संवर्धित जनरेशन, बड़े भाषा मॉडल आदि कई अनुसंधान दिशाओं को कवर करते हैं, अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।


सारांश: CardRewriter लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए एक नवाचारी अनुसंधान है, जो ज्ञान कार्ड के माध्यम से प्लेटफॉर्म-विशिष्ट ज्ञान को प्रभावी ढंग से एकीकृत करता है, सैद्धांतिक विधि और इंजीनियरिंग अभ्यास दोनों में महत्वपूर्ण परिणाम प्राप्त करता है। यह कार्य प्लेटफॉर्म-विशिष्ट सामग्री वाले क्वेरी समझ कार्यों को संभालने के लिए एक मूल्यवान समाधान प्रदान करता है।