CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic
CardRewriter: Использование карточек знаний для переписывания длинных запросов на платформах коротких видео
Платформы коротких видео быстро стали новым поколением систем информационного поиска, где пользователи получают нужные видео через поисковые запросы. Однако пользовательские запросы, особенно длинные запросы, часто содержат орфографические ошибки, неполные формулировки и неясные намерения, что приводит к несоответствию между ожиданиями пользователя и результатами поиска. Хотя большие языковые модели (LLM) показывают отличные результаты в переписывании длинных запросов в электронной коммерции, они сталкиваются с проблемами на платформах коротких видео, поскольку специфичный для платформы контент (такой как короткие видео, прямые трансляции, микросериалы и социальные сети пользователей) выходит за рамки их обучающего распределения. Для решения этой проблемы в статье предлагается CardRewriter — фреймворк на основе LLM, который улучшает переписывание длинных запросов путём интеграции знаний, специфичных для предметной области. Метод агрегирует многоисточниковые релевантные знания для каждого запроса и обобщает их в информативные и релевантные карточки знаний, которые затем направляют LLM на лучшее понимание намерения пользователя и создание более эффективного переписывания запроса.
Улучшить способность LLM понимать и переписывать запросы на платформах коротких видео путём введения знаний, специфичных для платформы, особенно для длинных запросов, связанных со специфичным контентом.
Предложение фреймворка CardRewriter: Первый специализированный фреймворк на основе LLM для переписывания длинных запросов на платформах коротких видео, эффективно интегрирующий знания, специфичные для платформы, через карточки знаний
Разработка двухэтапной стратегии обучения: Комбинирование контролируемой тонкой настройки (SFT) и оптимизации групповой относительной политики (GRPO) с использованием пользовательской системы вознаграждений для балансирования релевантности и эффективности
Проверка практической эффективности: Развёртывание и проверка на платформе Kuaishou показывают значительные улучшения как в автономных, так и в онлайн-экспериментах
Предоставление комплексного решения: Сквозное решение от сбора знаний, генерации карточек до переписывания запросов
Учитывая входной запрос x, цель CardRewriter — генерировать переписанный запрос y, который позволяет получить видеоконтент, более соответствующий намерению пользователя. Весь процесс можно представить как:
y = G_θ(x, c), c = C_θ(x, M)
где c — карточка знаний, M — многоисточниковые знания, C_θ — модель генерации карточек, G_θ — модель переписывания запросов.
Дизайн карточек знаний: По сравнению с прямым внедрением многоисточниковых знаний, карточки знаний эффективно решают проблемы структурной несогласованности, избыточного шума и ограниченной релевантности
Двухэтапная стратегия обучения:
Этап SFT: Контролируемая тонкая настройка на высококачественных данных
Этап GRPO: Дальнейшая оптимизация через обучение с подкреплением
Пользовательская система вознаграждений:
R_Overall = {
R_Sys, если R_Sys > 0
0.1, если R_Sys = 0 и R_Rel > 0
0, если R_Sys = R_Rel = 0
}
Балансирование семантической релевантности и системных предпочтений
Hitrate@K (Удовлетворённость пользователя): Доля переписанных запросов, которые извлекают видео, соответствующие намерению пользователя, в первых K результатах
Онлайн-метрики:
LVR (Коэффициент длительного просмотра): Доля пользователей, длительно просматривающих видео
IQRR (Коэффициент активного переформулирования запроса): Доля пользователей, активно переформулирующих запросы
CTR (Коэффициент кликов): Доля пользователей, нажимающих на результаты поиска
Методы на основе встраивания: Рассмотрение переписывания запросов как задачи поиска, улучшение исходного запроса через похожие запросы
Генеративные методы: Прямое создание пересмотренных запросов; недавние методы на основе LLM показывают отличные результаты в электронной коммерции
Адаптация к предметной области: Существующие методы в основном ориентированы на электронную коммерцию; исследования платформ коротких видео относительно редки
Технология RAG улучшает качество генерации путём поиска релевантной информации. В данной работе она применяется к задаче переписывания запросов путём эффективной интеграции многоисточниковой информации через карточки знаний.
В статье цитируется 33 связанные работы, охватывающие переписывание запросов, генерацию с увеличением поиска, большие языковые модели и другие направления исследований, обеспечивая прочную теоретическую базу.
Резюме: CardRewriter — это инновационное исследование переписывания длинных запросов на платформах коротких видео, которое эффективно интегрирует знания, специфичные для платформы, через карточки знаний и достигает значительных результатов как в теоретических методах, так и в инженерной практике. Данная работа предоставляет ценное решение для задач понимания запросов, содержащих специфичный контент.