Diffusion Generative Recommendation with Continuous Tokens
Qu, Lin, Ding et al.
Recent advances in generative artificial intelligence, particularly large language models (LLMs), have opened new opportunities for enhancing recommender systems (RecSys). Most existing LLM-based RecSys approaches operate in a discrete space, using vector-quantized tokenizers to align with the inherent discrete nature of language models. However, these quantization methods often result in lossy tokenization and suboptimal learning, primarily due to inaccurate gradient propagation caused by the non-differentiable argmin operation in standard vector quantization. Inspired by the emerging trend of embracing continuous tokens in language models, we propose ContRec, a novel framework that seamlessly integrates continuous tokens into LLM-based RecSys. Specifically, ContRec consists of two key modules: a sigma-VAE Tokenizer, which encodes users/items with continuous tokens; and a Dispersive Diffusion module, which captures implicit user preference. The tokenizer is trained with a continuous Variational Auto-Encoder (VAE) objective, where three effective techniques are adopted to avoid representation collapse. By conditioning on the previously generated tokens of the LLM backbone during user modeling, the Dispersive Diffusion module performs a conditional diffusion process with a novel Dispersive Loss, enabling high-quality user preference generation through next-token diffusion. Finally, ContRec leverages both the textual reasoning output from the LLM and the latent representations produced by the diffusion model for Top-K item retrieval, thereby delivering comprehensive recommendation results. Extensive experiments on four datasets demonstrate that \ourname{} consistently outperforms both traditional and SOTA LLM-based recommender systems. Our results highlight the potential of continuous tokenization and generative modeling for advancing the next generation of recommender systems.
본 논문은 대규모 언어모델(LLM) 기반 추천 시스템에서 이산 토큰화 방법의 한계를 해결하기 위해 ContRec 프레임워크를 제안합니다. ContRec은 연속 토큰을 LLM 추천 시스템에 원활하게 통합합니다. ContRec은 두 가지 핵심 모듈을 포함합니다: σ-VAE 토크나이저(사용자/물품을 연속 토큰으로 인코딩)와 분산 확산 모듈(암묵적 사용자 선호도 포착). LLM의 텍스트 추론 출력과 확산 모델이 생성한 잠재 표현을 결합하여 상위-K 물품 검색을 수행하며, 4개 데이터셋에서의 실험은 ContRec이 기존 및 최첨단 LLM 추천 시스템을 크게 능가함을 보여줍니다.
본 논문은 추천 시스템, 대규모 언어모델, 확산 모델 등 분야의 중요한 연구를 인용하며, 다음을 포함합니다:
고전 추천 알고리즘: LightGCN, SASRec 등
LLM 추천 시스템: P5, TIGER, TokenRec 등
확산 모델: DDPM, Classifier-free Guidance 등
연속 토큰화: VAE-MAR, Next-Token Diffusion 등
종합 평가: 이는 LLM 추천 시스템 분야에서 중요한 혁신 의의를 가진 연구로, 연속 토큰화와 확산 모델을 도입하여 기존 방법의 한계를 효과적으로 해결합니다. 계산 효율성과 특정 시나리오의 적용성 측면에서 개선 여지가 있지만, 기술 혁신과 실험 검증이 충분하며 해당 분야의 발전에 가치 있는 기여를 제공합니다.