Diffusion Generative Recommendation with Continuous Tokens
Qu, Lin, Ding et al.
Recent advances in generative artificial intelligence, particularly large language models (LLMs), have opened new opportunities for enhancing recommender systems (RecSys). Most existing LLM-based RecSys approaches operate in a discrete space, using vector-quantized tokenizers to align with the inherent discrete nature of language models. However, these quantization methods often result in lossy tokenization and suboptimal learning, primarily due to inaccurate gradient propagation caused by the non-differentiable argmin operation in standard vector quantization. Inspired by the emerging trend of embracing continuous tokens in language models, we propose ContRec, a novel framework that seamlessly integrates continuous tokens into LLM-based RecSys. Specifically, ContRec consists of two key modules: a sigma-VAE Tokenizer, which encodes users/items with continuous tokens; and a Dispersive Diffusion module, which captures implicit user preference. The tokenizer is trained with a continuous Variational Auto-Encoder (VAE) objective, where three effective techniques are adopted to avoid representation collapse. By conditioning on the previously generated tokens of the LLM backbone during user modeling, the Dispersive Diffusion module performs a conditional diffusion process with a novel Dispersive Loss, enabling high-quality user preference generation through next-token diffusion. Finally, ContRec leverages both the textual reasoning output from the LLM and the latent representations produced by the diffusion model for Top-K item retrieval, thereby delivering comprehensive recommendation results. Extensive experiments on four datasets demonstrate that \ourname{} consistently outperforms both traditional and SOTA LLM-based recommender systems. Our results highlight the potential of continuous tokenization and generative modeling for advancing the next generation of recommender systems.
تقدم هذه الورقة إطار عمل ContRec لمعالجة قيود طرق الترميز المنفصل في أنظمة التوصية المستندة إلى نماذج اللغة الكبيرة (LLM). يدمج ContRec الرموز المستمرة بسلاسة في أنظمة التوصية القائمة على LLM ويتضمن وحدتين أساسيتين: مرمز σ-VAE (لترميز المستخدمين/العناصر بالرموز المستمرة) ووحدة الانتشار المشتتة (لالتقاط تفضيلات المستخدم الضمنية). من خلال الجمع بين مخرجات التفكير النصي من LLM والتمثيلات الكامنة التي ينتجها نموذج الانتشار لاسترجاع العناصر Top-K، تُظهر التجارب على أربع مجموعات بيانات أن ContRec يتفوق بشكل ملحوظ على أنظمة التوصية التقليدية والمتقدمة القائمة على LLM.
تواجه أنظمة التوصية الحالية المستندة إلى LLM مشكلتين رئيسيتين:
الترميز الفاقد للمعلومات: تفقد طرق التكميم المتجهي المعلومات بشكل حتمي أثناء عملية الضغط
انتشار التدرج غير الدقيق: تؤدي عملية argmin غير القابلة للاشتقاق في التكميم المتجهي القياسي إلى استخدام تقنية "المرور المباشر"، مما ينتج عنه تدرجات غير دقيقة
الطرق المنفصلة: مثل TIGER و UTGRec التي تستخدم VQ-VAE لبناء مفردات منفصلة، تعاني من فقدان ضغط المعلومات
طرق الإسقاط المستمر: مثل CoLLM و LlaRA التي تستخدم الرموز المستمرة فقط في جزء الإدخال، بينما يعتمد الإخراج على مولدات منفصلة، مما يخلق فجوة منفصلة-مستمرة
مستوحاة من الاتجاه نحو احتضان الرموز المستمرة في نماذج اللغة، استكشاف إمكانيات استخدام الرموز المستمرة ونماذج الانتشار في سيناريوهات التوصية، لتحقيق نمذجة تفضيلات المستخدم بجودة أعلى.
بالنظر إلى مجموعة المستخدمين U = {u₁, u₂, ..., uₙ} ومجموعة العناصر V = {v₁, v₂, ..., vₘ}، الهدف هو التنبؤ بتفضيلات المستخدم المستقبلية من خلال تحليل التفاعلات التاريخية، وإعادة صياغة التوصية التسلسلية كنموذج لغة:
تستشهد هذه الورقة بأعمال مهمة في مجالات أنظمة التوصية ونماذج اللغة الكبيرة ونماذج الانتشار، بما في ذلك:
الخوارزميات الكلاسيكية للتوصية: LightGCN, SASRec وغيرها
أنظمة التوصية القائمة على LLM: P5, TIGER, TokenRec وغيرها
نماذج الانتشار: DDPM, Classifier-free Guidance وغيرها
الترميز المستمر: VAE-MAR, Next-Token Diffusion وغيرها
التقييم الإجمالي: هذا عمل ذو أهمية ابتكارية مهمة في مجال أنظمة التوصية القائمة على LLM. من خلال إدخال الترميز المستمر ونماذج الانتشار، يحل بشكل فعال قيود الطرق الموجودة. على الرغم من وجود مجال للتحسين في كفاءة الحساب وقابلية التطبيق في بعض السيناريوهات، فإن الابتكار التقني والتحقق التجريبي شاملان نسبياً، مما يوفر مساهمة قيمة لتطور هذا المجال.