Diffusion Generative Recommendation with Continuous Tokens
Qu, Lin, Ding et al.
Recent advances in generative artificial intelligence, particularly large language models (LLMs), have opened new opportunities for enhancing recommender systems (RecSys). Most existing LLM-based RecSys approaches operate in a discrete space, using vector-quantized tokenizers to align with the inherent discrete nature of language models. However, these quantization methods often result in lossy tokenization and suboptimal learning, primarily due to inaccurate gradient propagation caused by the non-differentiable argmin operation in standard vector quantization. Inspired by the emerging trend of embracing continuous tokens in language models, we propose ContRec, a novel framework that seamlessly integrates continuous tokens into LLM-based RecSys. Specifically, ContRec consists of two key modules: a sigma-VAE Tokenizer, which encodes users/items with continuous tokens; and a Dispersive Diffusion module, which captures implicit user preference. The tokenizer is trained with a continuous Variational Auto-Encoder (VAE) objective, where three effective techniques are adopted to avoid representation collapse. By conditioning on the previously generated tokens of the LLM backbone during user modeling, the Dispersive Diffusion module performs a conditional diffusion process with a novel Dispersive Loss, enabling high-quality user preference generation through next-token diffusion. Finally, ContRec leverages both the textual reasoning output from the LLM and the latent representations produced by the diffusion model for Top-K item retrieval, thereby delivering comprehensive recommendation results. Extensive experiments on four datasets demonstrate that \ourname{} consistently outperforms both traditional and SOTA LLM-based recommender systems. Our results highlight the potential of continuous tokenization and generative modeling for advancing the next generation of recommender systems.
academic
Raccomandazione Generativa con Diffusione e Token Continui
Questo articolo affronta le limitazioni dei metodi di tokenizzazione discreta nei sistemi di raccomandazione basati su modelli di linguaggio di grandi dimensioni (LLM), proponendo il framework ContRec, che integra perfettamente token continui nei sistemi di raccomandazione LLM. ContRec contiene due moduli principali: il tokenizzatore σ-VAE (per codificare utenti/elementi con token continui) e il modulo di diffusione dispersa (per catturare le preferenze implicite degli utenti). Combinando l'output di ragionamento testuale dell'LLM e le rappresentazioni latenti generate dal modello di diffusione per il recupero dei Top-K elementi, gli esperimenti su quattro dataset dimostrano che ContRec supera significativamente i sistemi di raccomandazione LLM tradizionali e all'avanguardia.
I sistemi di raccomandazione basati su LLM attuali affrontano principalmente due problemi critici:
Tokenizzazione con Perdita di Informazioni: I metodi di quantizzazione vettoriale inevitabilmente perdono informazioni durante la compressione
Propagazione Imprecisa dei Gradienti: L'operazione argmin non differenziabile nella quantizzazione vettoriale standard porta all'uso del trucco "straight-through", generando gradienti imprecisi
Metodi Discreti: Come TIGER e UTGRec utilizzano VQ-VAE per costruire vocabolari discreti, con perdita di informazioni nella compressione
Metodi di Proiezione Continua: Come CoLLM e LlaRA utilizzano token continui solo nella parte di input, mentre l'output dipende ancora da generatori discreti, creando una discrepanza discreto-continua
Ispirato dalla tendenza verso token continui nei modelli di linguaggio, questo lavoro esplora il potenziale dell'uso di token continui e modelli di diffusione negli scenari di raccomandazione, realizzando una modellazione di preferenze utente di qualità superiore.
Propone il Framework ContRec: Il primo framework che integra perfettamente token continui nei sistemi di raccomandazione LLM, superando i limiti della quantizzazione
Progetta Due Moduli Chiave:
Tokenizzatore σ-VAE: Un tokenizzatore continuo robusto che impiega tre tecniche per prevenire il collasso della rappresentazione
Modulo di Diffusione Dispersa: Genera rappresentazioni implicite delle preferenze utente attraverso l'apprendimento auto-supervisionato contrastivo
Introduce la Perdita Dispersa: Un meccanismo di apprendimento contrastivo che non richiede coppie esplicite di campioni positivi e negativi
Verifica Sperimentale: Miglioramenti medi del 11,76% in HR@10 e del 10,11% in NDCG@10 su quattro dataset
Dato un insieme di utenti U = {u₁, u₂, ..., uₙ} e un insieme di elementi V = {v₁, v₂, ..., vₘ}, l'obiettivo è prevedere le preferenze future degli utenti analizzando le interazioni storiche, riformulando la raccomandazione sequenziale come paradigma di modello di linguaggio:
Questo articolo cita lavori importanti nei campi dei sistemi di raccomandazione, modelli di linguaggio di grandi dimensioni, modelli di diffusione e altri, inclusi:
Algoritmi di Raccomandazione Classici: LightGCN, SASRec e altri
Sistemi di Raccomandazione LLM: P5, TIGER, TokenRec e altri
Modelli di Diffusione: DDPM, Classifier-free Guidance e altri
Tokenizzazione Continua: VAE-MAR, Next-Token Diffusion e altri
Valutazione Complessiva: Questo è un lavoro di importante significato innovativo nel campo dei sistemi di raccomandazione LLM. Introducendo tokenizzazione continua e modelli di diffusione, affronta efficacemente le limitazioni dei metodi esistenti. Sebbene ci sia ancora spazio per miglioramenti in termini di efficienza computazionale e applicabilità in determinati scenari, l'innovazione tecnica e la verifica sperimentale sono sufficientemente complete, fornendo contributi preziosi allo sviluppo del settore.