CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms
Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic
CardRewriter: Sfruttamento di Schede di Conoscenza per la Riscrittura di Query Long-Tail su Piattaforme Video Brevi
Le piattaforme video brevi si sono rapidamente affermate come sistemi di recupero informazioni di nuova generazione, dove gli utenti acquisiscono video desiderati attraverso query. Tuttavia, le query degli utenti, in particolare quelle long-tail, presentano frequentemente errori di ortografia, formulazioni incomplete e intenzioni ambigue, causando disallineamenti tra le aspettative degli utenti e i risultati del recupero. Sebbene i modelli linguistici di grandi dimensioni (LLM) abbiano dimostrato eccellenti prestazioni nella riscrittura di query long-tail nel settore dell'e-commerce, affrontano sfide sulle piattaforme video brevi, poiché i contenuti proprietari della piattaforma (come video brevi, trasmissioni in diretta, micro-drammi e reti sociali degli utenti) esulano dalla loro distribuzione di addestramento. Per affrontare questa sfida, il presente articolo propone CardRewriter, un framework basato su LLM che migliora la riscrittura di query long-tail attraverso l'integrazione di conoscenze specifiche del dominio. Il metodo aggrega conoscenze correlate da molteplici fonti per ogni query e le sintetizza in schede di conoscenza informative e rilevanti alla query, guidando successivamente l'LLM a catturare meglio l'intenzione dell'utente e produrre riscritture di query più efficaci.
Metodi Basati su Embedding: Dipendono dal recupero di query semanticamente simili, con efficacia limitata per query long-tail
Metodi Generativi: Gli LLM mostrano buone prestazioni nel settore dell'e-commerce, ma presentano comprensione insufficiente dei contenuti proprietari delle piattaforme video brevi
Problema di Adattamento al Dominio: Gli LLM esistenti non sono stati addestrati su contenuti proprietari come video brevi, trasmissioni in diretta e micro-drammi
Migliorare la capacità dell'LLM di comprendere e riscrivere query sulle piattaforme video brevi introducendo conoscenze specifiche della piattaforma, in particolare per query long-tail che coinvolgono contenuti proprietari.
Proposta del Framework CardRewriter: Il primo framework basato su LLM specificamente progettato per la riscrittura di query long-tail su piattaforme video brevi, integrando efficacemente le conoscenze proprietarie della piattaforma attraverso schede di conoscenza
Progettazione di una Strategia di Addestramento a Due Fasi: Combinazione di fine-tuning supervisionato (SFT) e ottimizzazione della strategia relativa di gruppo (GRPO), utilizzando un sistema di ricompense personalizzato per bilanciare rilevanza ed efficacia
Verifica dell'Efficacia Pratica: Distribuzione e verifica sulla piattaforma Kuaishou, con esperimenti offline e online che mostrano miglioramenti significativi
Fornitura di una Soluzione Completa: Soluzione end-to-end dalla raccolta di conoscenze, generazione di schede alla riscrittura di query
Dato un query di input x, l'obiettivo di CardRewriter è generare una query riscritta y che consenta il recupero di contenuti video più allineati all'intenzione dell'utente. L'intero processo può essere rappresentato come:
y = G_θ(x, c), c = C_θ(x, M)
dove c è la scheda di conoscenza, M è la conoscenza da molteplici fonti, C_θ è il modello di generazione della scheda e G_θ è il modello di riscrittura della query.
Contenuto Visivo: Estrazione di tre fotogrammi chiave dal video
Contenuto Testuale: Titolo, sottotitoli, testo OCR della copertina, nome dell'autore, musica di sottofondo
Espansione di Query Simili:
Corrispondenza Basata su Regole (Q2Q): Selezione di query con sovrapposizione lessicale con la query originale e intersezione negli elenchi di video recuperati
Corrispondenza Basata su Embedding (EMB): Calcolo della similarità di embedding tra query
Integrazione di Documenti Open-Domain: Acquisizione di documenti open-domain correlati tramite servizi API come fonte di conoscenza supplementare
Progettazione della Scheda di Conoscenza: Rispetto all'iniezione diretta di conoscenze da molteplici fonti, la scheda di conoscenza risolve efficacemente i problemi di incoerenza strutturale, eccessivo rumore e rilevanza limitata
Strategia di Addestramento a Due Fasi:
Fase SFT: Fine-tuning supervisionato utilizzando dati di alta qualità
Fase GRPO: Ulteriore ottimizzazione attraverso apprendimento per rinforzo
Sistema di Ricompense Personalizzato:
R_Overall = {
R_Sys, if R_Sys > 0
0.1, if R_Sys = 0 and R_Rel > 0
0, if R_Sys = R_Rel = 0
}
Bilanciamento tra rilevanza semantica e preferenze del sistema
Metodi Basati su Embedding: Considerano la riscrittura di query come compito di recupero, migliorando la query originale attraverso query simili
Metodi Generativi: Generazione diretta di query riviste, con recenti metodi basati su LLM che mostrano eccellenti prestazioni nel settore dell'e-commerce
Adattamento al Dominio: I metodi esistenti si concentrano principalmente su scenari di e-commerce, con ricerca relativamente limitata su piattaforme video brevi
La tecnologia RAG migliora la qualità della generazione attraverso il recupero di informazioni rilevanti. Il presente articolo applica questo approccio al compito di riscrittura di query, integrando efficacemente informazioni da molteplici fonti attraverso schede di conoscenza.
Efficienza Computazionale: La latenza dell'inferenza LLM è relativamente elevata, limitando le applicazioni in tempo reale
Dipendenza dai Dati: Richiede grandi quantità di dati annotati per costruire insiemi di addestramento
Interpretabilità: L'interpretabilità del processo di generazione della scheda di conoscenza necessita di ulteriore miglioramento
Capacità di Generalizzazione: Il metodo è progettato per piattaforme specifiche, con capacità di generalizzazione cross-domain non completamente verificate
L'articolo cita 33 riferimenti correlati, coprendo molteplici direzioni di ricerca inclusa la riscrittura di query, la generazione aumentata da recupero e i modelli linguistici di grandi dimensioni, fornendo una base teorica sostanziale per la ricerca.
Sintesi: CardRewriter è una ricerca innovativa sulla riscrittura di query long-tail per piattaforme video brevi, che integra efficacemente le conoscenze proprietarie della piattaforma attraverso schede di conoscenza, raggiungendo risultati significativi sia nei metodi teorici che nella pratica ingegneristica. Questo lavoro fornisce una soluzione di valore per affrontare compiti di comprensione di query che coinvolgono contenuti proprietari.