2025-11-20T07:34:14.820650

CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms

Gong, Zhu, Yin et al.

Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.

academic

CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms

基本信息

论文ID: 2510.10095
标题: CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
作者: Peiyuan Gong, Feiran Zhu, Yaqi Yin, Chenglei Dai, Chao Zhang, Kai Zheng, Wentian Bao, Jiaxin Mao, Yi Zhang
分类: cs.IR (Information Retrieval), cs.CL (Computational Linguistics)
发表时间: 2025年10月11日
论文链接: https://arxiv.org/abs/2510.10095

摘要

短视频平台已迅速成为新一代信息检索系统，用户通过查询来获取所需视频。然而，用户查询，特别是长尾查询，经常存在拼写错误、表述不完整和意图模糊等问题，导致用户期望与检索结果不匹配。虽然大语言模型(LLMs)在电商领域的长尾查询重写方面表现出色，但在短视频平台上却面临挑战，因为平台专有内容（如短视频、直播、微剧和用户社交网络）超出了其训练分布。为解决这一挑战，本文提出了CardRewriter，这是一个基于LLM的框架，通过融入领域特定知识来增强长尾查询重写。该方法为每个查询聚合多源相关知识，并将其总结为信息丰富且与查询相关的知识卡片，然后指导LLM更好地捕获用户意图并产生更有效的查询重写。

研究背景与动机

问题定义

短视频平台用户查询存在三大挑战：

拼写错误：用户输入的查询词汇可能存在拼写错误
表述不完整：用户查询缺少关键信息，导致检索结果不准确
意图模糊：特别是涉及平台专有内容时，查询意图不明确

问题重要性

短视频平台已成为重要的信息检索系统，服务数亿用户
查询质量直接影响用户体验和平台商业价值
长尾查询占据相当比例，但处理难度较大

现有方法局限性

嵌入式方法：依赖语义相似查询检索，对长尾查询效果有限
生成式方法：LLM在电商领域表现良好，但对短视频平台专有内容理解不足
领域适应问题：现有LLM未在短视频、直播、微剧等专有内容上训练

研究动机

通过引入平台特定知识，增强LLM对短视频平台查询的理解和重写能力，特别是针对涉及专有内容的长尾查询。

核心贡献

提出CardRewriter框架：首个专门针对短视频平台长尾查询重写的LLM框架，通过知识卡片有效整合平台专有知识
设计两阶段训练策略：结合监督微调(SFT)和群体相对策略优化(GRPO)，使用定制奖励系统平衡相关性和有效性
验证实际效果：在快手平台部署验证，离线和在线实验均显示显著改进
提供完整解决方案：从知识收集、卡片生成到查询重写的端到端解决方案

方法详解

任务定义

给定输入查询x，CardRewriter的目标是生成重写查询y，使其能够检索到更符合用户意图的视频内容。整个过程可表示为：

y = G_θ(x, c), c = C_θ(x, M)

其中c为知识卡片，M为多源知识，C_θ为卡片生成模型，G_θ为查询重写模型。

模型架构

1. 知识收集阶段

多模态视频知识提取：

视觉内容：提取视频的三个关键帧
文本内容：标题、字幕、封面OCR文字、作者名、背景音乐

相似查询扩展：

基于规则的匹配(Q2Q)：选择与原查询有词汇重叠且检索视频列表相交的查询
基于嵌入的匹配(EMB)：计算查询间的嵌入相似度

开放域文档补充：通过API服务获取相关的开放域文档作为补充知识源

2. 基于卡片的重写阶段

知识卡片生成：

输入：原查询x和多源知识M
输出：简洁且相关的知识卡片c
目标：去噪、整合、突出与查询直接相关的内容

查询重写：

输入：原查询x和知识卡片c
输出：重写查询y
目标：利用卡片信息更好理解搜索上下文

技术创新点

知识卡片设计：相比直接注入多源知识，知识卡片有效解决了结构不一致、噪声过多、相关性有限的问题
两阶段训练策略：
- SFT阶段：使用高质量数据进行监督微调
- GRPO阶段：通过强化学习进一步优化

定制奖励系统：

R_Overall = {
    R_Sys, if R_Sys > 0
    0.1, if R_Sys = 0 and R_Rel > 0  
    0, if R_Sys = R_Rel = 0
}

平衡语义相关性和系统偏好

实验设置

数据集

训练数据集：

卡片生成：20万查询，生成160万四元组，筛选后保留3万高质量三元组
查询重写：40万查询，生成320万三元组，筛选后保留5万对用于SFT
奖励建模：15万查询，生成24万偏好对

测试数据集：

卡片生成：1万查询
奖励建模：1万查询
查询重写：1.5万查询

评价指标

离线指标：

Rel (相关性)：评估模型输出的语义质量
Increment (检索扩展)：衡量检索覆盖范围的相对改进
Hitrate@K (用户满意度)：重写查询在前K个结果中检索到符合用户意图视频的比例

在线指标：

LVR (长观看率)：用户长时间观看视频的比率
IQRR (主动查询重构率)：用户主动重新表述查询的比率
CTR (点击率)：用户点击检索结果的比率

对比方法

基于提示的重写方法
SFT和SFT+DPO基线
直接知识注入方法(Naive RAG)
改编的CSA-QR方法

实现细节

卡片生成：基于Qwen2.5-VL-7B-Instruct微调
查询重写：基于Qwen3-8B微调
训练设置：学习率1×10^-5，AdamW优化器，DeepSpeed ZeRO-3分布式训练

实验结果

主要结果

方法	知识类型	QR-Rel	Increment	Hitrate@50	Hitrate@300
原查询	-	-	-	31.40%	53.07%
SFT+GRPO	-	78.98%	65.19%	41.68%	65.71%
SFT+GRPO	Naive RAG	74.28%	70.86%	41.05%	65.63%
CardRewriter	Card RAG	85.73%	74.17%	46.64%	76.04%