2025-11-20T07:34:14.820650

CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms

Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic

CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms

基本信息

  • 论文ID: 2510.10095
  • 标题: CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
  • 作者: Peiyuan Gong, Feiran Zhu, Yaqi Yin, Chenglei Dai, Chao Zhang, Kai Zheng, Wentian Bao, Jiaxin Mao, Yi Zhang
  • 分类: cs.IR (Information Retrieval), cs.CL (Computational Linguistics)
  • 发表时间: 2025年10月11日
  • 论文链接: https://arxiv.org/abs/2510.10095

摘要

短视频平台已迅速成为新一代信息检索系统,用户通过查询来获取所需视频。然而,用户查询,特别是长尾查询,经常存在拼写错误、表述不完整和意图模糊等问题,导致用户期望与检索结果不匹配。虽然大语言模型(LLMs)在电商领域的长尾查询重写方面表现出色,但在短视频平台上却面临挑战,因为平台专有内容(如短视频、直播、微剧和用户社交网络)超出了其训练分布。为解决这一挑战,本文提出了CardRewriter,这是一个基于LLM的框架,通过融入领域特定知识来增强长尾查询重写。该方法为每个查询聚合多源相关知识,并将其总结为信息丰富且与查询相关的知识卡片,然后指导LLM更好地捕获用户意图并产生更有效的查询重写。

研究背景与动机

问题定义

短视频平台用户查询存在三大挑战:

  1. 拼写错误:用户输入的查询词汇可能存在拼写错误
  2. 表述不完整:用户查询缺少关键信息,导致检索结果不准确
  3. 意图模糊:特别是涉及平台专有内容时,查询意图不明确

问题重要性

  • 短视频平台已成为重要的信息检索系统,服务数亿用户
  • 查询质量直接影响用户体验和平台商业价值
  • 长尾查询占据相当比例,但处理难度较大

现有方法局限性

  1. 嵌入式方法:依赖语义相似查询检索,对长尾查询效果有限
  2. 生成式方法:LLM在电商领域表现良好,但对短视频平台专有内容理解不足
  3. 领域适应问题:现有LLM未在短视频、直播、微剧等专有内容上训练

研究动机

通过引入平台特定知识,增强LLM对短视频平台查询的理解和重写能力,特别是针对涉及专有内容的长尾查询。

核心贡献

  1. 提出CardRewriter框架:首个专门针对短视频平台长尾查询重写的LLM框架,通过知识卡片有效整合平台专有知识
  2. 设计两阶段训练策略:结合监督微调(SFT)和群体相对策略优化(GRPO),使用定制奖励系统平衡相关性和有效性
  3. 验证实际效果:在快手平台部署验证,离线和在线实验均显示显著改进
  4. 提供完整解决方案:从知识收集、卡片生成到查询重写的端到端解决方案

方法详解

任务定义

给定输入查询x,CardRewriter的目标是生成重写查询y,使其能够检索到更符合用户意图的视频内容。整个过程可表示为:

y = G_θ(x, c), c = C_θ(x, M)

其中c为知识卡片,M为多源知识,C_θ为卡片生成模型,G_θ为查询重写模型。

模型架构

1. 知识收集阶段

多模态视频知识提取

  • 视觉内容:提取视频的三个关键帧
  • 文本内容:标题、字幕、封面OCR文字、作者名、背景音乐

相似查询扩展

  • 基于规则的匹配(Q2Q):选择与原查询有词汇重叠且检索视频列表相交的查询
  • 基于嵌入的匹配(EMB):计算查询间的嵌入相似度

开放域文档补充:通过API服务获取相关的开放域文档作为补充知识源

2. 基于卡片的重写阶段

知识卡片生成

  • 输入:原查询x和多源知识M
  • 输出:简洁且相关的知识卡片c
  • 目标:去噪、整合、突出与查询直接相关的内容

查询重写

  • 输入:原查询x和知识卡片c
  • 输出:重写查询y
  • 目标:利用卡片信息更好理解搜索上下文

技术创新点

  1. 知识卡片设计:相比直接注入多源知识,知识卡片有效解决了结构不一致、噪声过多、相关性有限的问题
  2. 两阶段训练策略
    • SFT阶段:使用高质量数据进行监督微调
    • GRPO阶段:通过强化学习进一步优化
  3. 定制奖励系统
    R_Overall = {
        R_Sys, if R_Sys > 0
        0.1, if R_Sys = 0 and R_Rel > 0  
        0, if R_Sys = R_Rel = 0
    }
    

    平衡语义相关性和系统偏好

实验设置

数据集

训练数据集

  • 卡片生成:20万查询,生成160万四元组,筛选后保留3万高质量三元组
  • 查询重写:40万查询,生成320万三元组,筛选后保留5万对用于SFT
  • 奖励建模:15万查询,生成24万偏好对

测试数据集

  • 卡片生成:1万查询
  • 奖励建模:1万查询
  • 查询重写:1.5万查询

评价指标

离线指标

  1. Rel (相关性):评估模型输出的语义质量
  2. Increment (检索扩展):衡量检索覆盖范围的相对改进
  3. Hitrate@K (用户满意度):重写查询在前K个结果中检索到符合用户意图视频的比例

在线指标

  1. LVR (长观看率):用户长时间观看视频的比率
  2. IQRR (主动查询重构率):用户主动重新表述查询的比率
  3. CTR (点击率):用户点击检索结果的比率

对比方法

  • 基于提示的重写方法
  • SFT和SFT+DPO基线
  • 直接知识注入方法(Naive RAG)
  • 改编的CSA-QR方法

实现细节

  • 卡片生成:基于Qwen2.5-VL-7B-Instruct微调
  • 查询重写:基于Qwen3-8B微调
  • 训练设置:学习率1×10^-5,AdamW优化器,DeepSpeed ZeRO-3分布式训练

实验结果

主要结果

方法知识类型QR-RelIncrementHitrate@50Hitrate@300
原查询---31.40%53.07%
SFT+GRPO-78.98%65.19%41.68%65.71%
SFT+GRPONaive RAG74.28%70.86%41.05%65.63%
CardRewriterCard RAG85.73%74.17%46.64%76.04%

关键发现

  1. CardRewriter在大多数指标上取得最佳性能
  2. 知识卡片相比直接知识注入显著提升重写质量
  3. SFT+GRPO训练策略效果最好

消融实验

多源知识贡献分析

  • 移除视觉内容:QC-Rel从91.16%降至89.37%
  • 移除文本内容:QC-Rel降至86.18%(影响更大)
  • 移除相关视频:QC-Rel降至78.27%(影响最大)

奖励系统分析

  • 仅使用相关性奖励:查询相关性最高但检索扩展有限
  • 仅使用系统奖励:检索到更多新视频但可能偏离原意图
  • 组合奖励:在相关性和有效性间取得最佳平衡

案例分析

论文展示了一个典型案例:

  • 原查询:"可口可乐寄人篱下的痛"(用户将创作者"可可可乐"误写为"可口可乐")
  • LLM重写:"可口可乐 寄人篱下 创意广告"(错误联想到饮料品牌)
  • CardRewriter:"可可可乐 被寄养的孩子系列"(正确理解用户意图)

在线实验结果

流量类型LVR ↑IQRR ↓CTR ↑
覆盖流量+1.853%-2.630%+3.729%
全量流量+0.235%-0.229%+0.342%

在线A/B测试证实了显著改进,特别是在覆盖流量上效果明显。

相关工作

查询重写研究

  1. 嵌入式方法:将查询重写视为检索任务,通过相似查询增强原查询
  2. 生成式方法:直接生成修订查询,近期LLM方法在电商领域表现优异
  3. 领域适应:现有方法主要针对电商场景,短视频平台研究相对较少

检索增强生成

RAG技术通过检索相关信息增强生成质量,本文将其应用于查询重写任务,通过知识卡片有效整合多源信息。

结论与讨论

主要结论

  1. CardRewriter通过知识卡片有效解决了短视频平台长尾查询重写问题
  2. 两阶段训练策略和定制奖励系统显著提升了重写质量
  3. 在快手平台的部署验证了方法的实用价值

局限性

  1. 计算开销:LLM推理需要较大计算资源,采用近线部署策略
  2. 覆盖范围:目前仅覆盖15-20%的日常搜索流量
  3. 领域依赖:方法针对短视频平台设计,其他领域适用性需进一步验证

未来方向

  1. 扩大覆盖的查询范围
  2. 优化在线推理效率
  3. 探索跨平台和跨领域的适用性

深度评价

优点

  1. 问题针对性强:准确识别短视频平台查询重写的独特挑战
  2. 技术方案完整:从知识收集到模型训练的端到端解决方案
  3. 实验评估充分:离线实验全面,在线部署验证实际效果
  4. 工程实践价值高:已在大规模平台部署,服务数亿用户

不足

  1. 计算效率:LLM推理延迟较高,限制了实时应用
  2. 数据依赖:需要大量标注数据构建训练集
  3. 可解释性:知识卡片生成过程的可解释性有待加强
  4. 泛化能力:方法针对特定平台设计,跨域泛化能力未充分验证

影响力

  1. 学术贡献:为短视频平台查询理解提供了新思路
  2. 实用价值:解决了实际业务问题,具有直接的商业价值
  3. 技术推广:知识卡片的设计思路可推广到其他RAG应用

适用场景

  1. 短视频、直播等内容平台的搜索优化
  2. 包含大量专有内容的垂直领域搜索
  3. 需要结合多模态信息的查询理解任务

参考文献

论文引用了33篇相关文献,涵盖查询重写、检索增强生成、大语言模型等多个研究方向,为研究提供了充实的理论基础。


总结:CardRewriter是一项针对短视频平台长尾查询重写的创新研究,通过知识卡片有效整合平台专有知识,在理论方法和工程实践上都取得了显著成果。该工作为处理包含专有内容的查询理解任务提供了有价值的解决方案。