CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic
CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
Kurzvideoplatformen sind schnell zu einer neuen Generation von Informationssystemen geworden, über die Benutzer durch Abfragen die gewünschten Videos abrufen. Benutzerabfragen, insbesondere Long-Tail-Abfragen, weisen jedoch häufig Rechtschreibfehler, unvollständige Formulierungen und mehrdeutige Absichten auf, was zu Unstimmigkeiten zwischen Benutzererwartungen und Suchergebnissen führt. Obwohl große Sprachmodelle (LLMs) bei der Umformulierung von Long-Tail-Abfragen im E-Commerce-Bereich hervorragende Leistungen zeigen, stoßen sie auf Kurzvideoplatformen auf Herausforderungen, da plattformspezifische Inhalte (wie Kurzvideos, Live-Streaming, Mikro-Dramen und soziale Netzwerke von Benutzern) außerhalb ihrer Trainingsverteilung liegen. Um diese Herausforderung zu bewältigen, wird CardRewriter vorgestellt – ein LLM-basiertes Framework, das die Umformulierung von Long-Tail-Abfragen durch die Integration domänenspezifischen Wissens verbessert. Die Methode aggregiert für jede Abfrage Wissen aus mehreren Quellen und fasst es in informative und abfragerelevante Wissenscards zusammen, die dann das LLM anleiten, Benutzerabsichten besser zu erfassen und effektivere Abfrageumformulierungen zu erzeugen.
Embedding-basierte Methoden: Basieren auf dem Abrufen semantisch ähnlicher Abfragen, mit begrenzter Wirksamkeit bei Long-Tail-Abfragen
Generative Methoden: LLMs zeigen gute Leistungen im E-Commerce-Bereich, verstehen aber plattformspezifische Inhalte von Kurzvideoplatformen nicht ausreichend
Domänenanpassungsproblem: Bestehende LLMs wurden nicht auf plattformspezifischen Inhalten wie Kurzvideos, Live-Streaming und Mikro-Dramen trainiert
Durch die Einführung plattformspezifischen Wissens die Fähigkeit von LLMs zur Verständigung und Umformulierung von Abfragen auf Kurzvideoplatformen verbessern, insbesondere für Long-Tail-Abfragen mit plattformspezifischen Inhalten.
CardRewriter-Framework vorgestellt: Das erste LLM-Framework speziell für die Umformulierung von Long-Tail-Abfragen auf Kurzvideoplatformen, das plattformspezifisches Wissen durch Wissenscards effektiv integriert
Zweistufige Trainingsstrategie entwickelt: Kombination von Supervised Fine-Tuning (SFT) und Group Relative Policy Optimization (GRPO) mit einem benutzerdefinierten Belohnungssystem, das Relevanz und Effektivität ausgleicht
Praktische Wirksamkeit validiert: Bereitstellung und Validierung auf der Kuaishou-Plattform mit signifikanten Verbesserungen in Offline- und Online-Experimenten
Vollständige Lösung bereitgestellt: End-to-End-Lösung von der Wissensbeschaffung über die Kartengenerierung bis zur Abfrageumformulierung
Gegeben eine Eingabeabfrage x besteht das Ziel von CardRewriter darin, eine umformulierte Abfrage y zu generieren, die es ermöglicht, Videoinhalte abzurufen, die der Benutzerabsicht besser entsprechen. Der gesamte Prozess kann wie folgt dargestellt werden:
y = G_θ(x, c), c = C_θ(x, M)
wobei c die Wissenskarte ist, M das Wissen aus mehreren Quellen, C_θ das Kartengenerierungsmodell und G_θ das Abfrageumformulierungsmodell ist.
Wissenscartenentwurf: Im Vergleich zur direkten Einspeisung von Wissen aus mehreren Quellen löst die Wissenskarte effektiv Probleme mit struktureller Inkonsistenz, übermäßigem Rauschen und begrenzter Relevanz
Zweistufige Trainingsstrategie:
SFT-Phase: Überwachtes Fine-Tuning mit hochqualitativen Daten
GRPO-Phase: Weitere Optimierung durch Reinforcement Learning
Benutzerdefiniertes Belohnungssystem:
R_Overall = {
R_Sys, wenn R_Sys > 0
0.1, wenn R_Sys = 0 und R_Rel > 0
0, wenn R_Sys = R_Rel = 0
}
Ausgleich zwischen semantischer Relevanz und Systempräferenz
RAG-Technologie verbessert die Generierungsqualität durch Abruf relevanter Informationen. Dieses Papier wendet sie auf Abfrageumformulierungsaufgaben an und integriert effektiv Wissen aus mehreren Quellen durch Wissenscarten.
Das Papier zitiert 33 verwandte Arbeiten, die Abfrageumformulierung, Retrieval-Augmented Generation, große Sprachmodelle und andere Forschungsrichtungen abdecken und eine solide theoretische Grundlage bieten.
Zusammenfassung: CardRewriter ist eine innovative Forschungsarbeit zur Umformulierung von Long-Tail-Abfragen auf Kurzvideoplatformen. Durch die effektive Integration plattformspezifischen Wissens mittels Wissenscarten wurden sowohl in theoretischen Methoden als auch in technischer Praxis erhebliche Ergebnisse erzielt. Diese Arbeit bietet eine wertvolle Lösung für Abfrageverständnisaufgaben mit plattformspezifischen Inhalten.