CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic
CardRewriter: लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए ज्ञान कार्ड का लाभ उठाना
लघु-वीडियो प्लेटफॉर्म तेजी से नई पीढ़ी की सूचना पुनः प्राप्ति प्रणाली बन गए हैं, जहां उपयोगकर्ता क्वेरी के माध्यम से वांछित वीडियो प्राप्त करते हैं। हालांकि, उपयोगकर्ता क्वेरी, विशेषकर दीर्घ-पूंछ क्वेरी, अक्सर वर्तनी त्रुटियों, अधूरे अभिव्यक्ति और अस्पष्ट इरादे से ग्रस्त होती हैं, जिससे उपयोगकर्ता की अपेक्षाएं और पुनः प्राप्ति परिणाम मेल नहीं खाते। हालांकि बड़े भाषा मॉडल (LLMs) ई-कॉमर्स क्षेत्र में दीर्घ-पूंछ क्वेरी पुनर्लेखन में उत्कृष्ट प्रदर्शन करते हैं, लेकिन लघु-वीडियो प्लेटफॉर्म पर चुनौतियों का सामना करते हैं, क्योंकि प्लेटफॉर्म-विशिष्ट सामग्री (जैसे लघु-वीडियो, लाइव स्ट्रीम, माइक्रो-ड्रामा और उपयोगकर्ता सामाजिक नेटवर्क) उनके प्रशिक्षण वितरण से परे है। इस चुनौती को हल करने के लिए, यह पेपर CardRewriter प्रस्तावित करता है, जो एक LLM-आधारित ढांचा है जो डोमेन-विशिष्ट ज्ञान को शामिल करके दीर्घ-पूंछ क्वेरी पुनर्लेखन को बढ़ाता है। यह विधि प्रत्येक क्वेरी के लिए बहु-स्रोत संबंधित ज्ञान को एकत्रित करती है और इसे सूचनात्मक और क्वेरी-प्रासंगिक ज्ञान कार्ड में संक्षेपित करती है, फिर LLM को उपयोगकर्ता के इरादे को बेहतर ढंग से समझने और अधिक प्रभावी क्वेरी पुनर्लेखन उत्पन्न करने के लिए निर्देशित करती है।
प्लेटफॉर्म-विशिष्ट ज्ञान को शामिल करके, लघु-वीडियो प्लेटफॉर्म क्वेरी के प्रति LLM की समझ और पुनर्लेखन क्षमता को बढ़ाएं, विशेषकर प्लेटफॉर्म-विशिष्ट सामग्री से संबंधित दीर्घ-पूंछ क्वेरी के लिए।
CardRewriter ढांचा प्रस्तावित करना: लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए पहला विशेष LLM ढांचा, ज्ञान कार्ड के माध्यम से प्लेटफॉर्म-विशिष्ट ज्ञान को प्रभावी ढंग से एकीकृत करता है
दो-चरणीय प्रशिक्षण रणनीति डिजाइन करना: पर्यवेक्षित सूक्ष्म-ट्यूनिंग (SFT) और समूह सापेक्ष नीति अनुकूलन (GRPO) को जोड़ते हुए, प्रासंगिकता और प्रभावशीलता को संतुलित करने के लिए अनुकूलित पुरस्कार प्रणाली का उपयोग करता है
व्यावहारिक प्रभाव सत्यापित करना: Kuaishou प्लेटफॉर्म पर तैनाती सत्यापन, ऑफलाइन और ऑनलाइन प्रयोग दोनों महत्वपूर्ण सुधार दिखाते हैं
संपूर्ण समाधान प्रदान करना: ज्ञान संग्रह, कार्ड जनरेशन से क्वेरी पुनर्लेखन तक एंड-टू-एंड समाधान
इनपुट क्वेरी x दिए जाने पर, CardRewriter का लक्ष्य पुनर्लेखित क्वेरी y उत्पन्न करना है, जो उपयोगकर्ता के इरादे के अनुरूप अधिक वीडियो सामग्री को पुनः प्राप्त कर सके। संपूर्ण प्रक्रिया को इस प्रकार व्यक्त किया जा सकता है:
y = G_θ(x, c), c = C_θ(x, M)
जहां c ज्ञान कार्ड है, M बहु-स्रोत ज्ञान है, C_θ कार्ड जनरेशन मॉडल है, G_θ क्वेरी पुनर्लेखन मॉडल है।
ज्ञान कार्ड डिजाइन: बहु-स्रोत ज्ञान को सीधे इंजेक्ट करने की तुलना में, ज्ञान कार्ड संरचनात्मक असंगति, अत्यधिक शोर और सीमित प्रासंगिकता की समस्याओं को प्रभावी ढंग से हल करते हैं
दो-चरणीय प्रशिक्षण रणनीति:
SFT चरण: उच्च-गुणवत्ता डेटा का उपयोग करके पर्यवेक्षित सूक्ष्म-ट्यूनिंग
GRPO चरण: सुदृढ़ीकरण सीखने के माध्यम से आगे अनुकूलन
अनुकूलित पुरस्कार प्रणाली:
R_Overall = {
R_Sys, if R_Sys > 0
0.1, if R_Sys = 0 and R_Rel > 0
0, if R_Sys = R_Rel = 0
}
शब्दार्थ प्रासंगिकता और सिस्टम वरीयता को संतुलित करता है
RAG तकनीक पुनः प्राप्त संबंधित जानकारी के माध्यम से जनरेशन गुणवत्ता को बढ़ाती है, यह पेपर इसे क्वेरी पुनर्लेखन कार्य पर लागू करता है, ज्ञान कार्ड के माध्यम से बहु-स्रोत जानकारी को प्रभावी ढंग से एकीकृत करता है।
पेपर 33 संबंधित संदर्भों को उद्धृत करता है, जो क्वेरी पुनर्लेखन, पुनः प्राप्ति-संवर्धित जनरेशन, बड़े भाषा मॉडल आदि कई अनुसंधान दिशाओं को कवर करते हैं, अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।
सारांश: CardRewriter लघु-वीडियो प्लेटफॉर्म पर दीर्घ-पूंछ क्वेरी पुनर्लेखन के लिए एक नवाचारी अनुसंधान है, जो ज्ञान कार्ड के माध्यम से प्लेटफॉर्म-विशिष्ट ज्ञान को प्रभावी ढंग से एकीकृत करता है, सैद्धांतिक विधि और इंजीनियरिंग अभ्यास दोनों में महत्वपूर्ण परिणाम प्राप्त करता है। यह कार्य प्लेटफॉर्म-विशिष्ट सामग्री वाले क्वेरी समझ कार्यों को संभालने के लिए एक मूल्यवान समाधान प्रदान करता है।