Asking Clarifying Questions for Preference Elicitation With Large Language Models
Montazeralghaem, Tennenholtz, Boutilier et al.
Large Language Models (LLMs) have made it possible for recommendation systems to interact with users in open-ended conversational interfaces. In order to personalize LLM responses, it is crucial to elicit user preferences, especially when there is limited user history. One way to get more information is to present clarifying questions to the user. However, generating effective sequential clarifying questions across various domains remains a challenge. To address this, we introduce a novel approach for training LLMs to ask sequential questions that reveal user preferences. Our method follows a two-stage process inspired by diffusion models. Starting from a user profile, the forward process generates clarifying questions to obtain answers and then removes those answers step by step, serving as a way to add ``noise'' to the user profile. The reverse process involves training a model to ``denoise'' the user profile by learning to ask effective clarifying questions. Our results show that our method significantly improves the LLM's proficiency in asking funnel questions and eliciting user preferences effectively.
academic
طرح أسئلة توضيحية لاستخراج التفضيلات مع نماذج اللغة الكبيرة
تمكّن نماذج اللغة الكبيرة (LLMs) أنظمة التوصيات من التفاعل مع المستخدمين من خلال واجهات حوار مفتوحة. لتخصيص استجابات نموذج اللغة الكبيرة، خاصة عندما يكون لدى المستخدم سجل محدود، من الضروري استخراج تفضيلات المستخدم بفعالية. تقترح هذه الورقة طريقة جديدة لتدريب نماذج اللغة الكبيرة على طرح أسئلة توضيحية متسلسلة قادرة على الكشف عن تفضيلات المستخدم. تعتمد الطريقة على عملية ثنائية المراحل مستوحاة من نماذج الانتشار: تبدأ العملية الأمامية من ملف تعريف المستخدم وتولد أسئلة توضيحية مع إزالة الإجابات تدريجياً كـ "ضوضاء"؛ تدرب العملية العكسية النموذج على "إزالة الضوضاء" من ملف تعريف المستخدم من خلال تعلم طرح أسئلة توضيحية فعالة. تُظهر النتائج التجريبية أن هذه الطريقة تحسّن بشكل كبير قدرة نموذج اللغة الكبيرة على طرح أسئلة قمعية وفعالة في استخراج تفضيلات المستخدم.
مع التطور السريع لنماذج اللغة الكبيرة، أصبحت أنظمة التوصيات الحوارية (CRS) ممكنة، حيث يمكن للنظام من خلال أسئلة استخراج التفضيلات المباشرة توضيح احتياجات المستخدم وتقديم توصيات شخصية عالية الجودة.
يمكن لتقنيات الإشراف البسيطة أن توجه نموذج اللغة الكبيرة لطرح أسئلة استخراج في الوقت المناسب، لكن توليد أسئلة توضيحية متسلسلة فعالة عبر المجالات المختلفة يظل تحدياً.
تهدف هذه الورقة إلى تحسين قدرة نماذج اللغة الكبيرة على طرح أسئلة استخراج عالية الجودة، خاصة تعلم طرح أسئلة "قمعية" - تبدأ من مفاهيم عامة وتصبح تدريجياً أكثر تحديداً مع تقدم الحوار.
بالنظر إلى ملف تعريف المستخدم P، الهدف هو إعادة بناء ملف التعريف الكامل للمستخدم Pₙ من ملف تعريف فارغ P₀ = ∅ من خلال أسئلة متسلسلة Q₀, Q₁, ..., Qₙ₋₁ وإجابات مقابلة A₀, A₁, ..., Aₙ₋₁.
مجموعة بيانات MovieLens: تُستخدم على نطاق واسع في أبحاث أنظمة التوصيات
ملفات تعريف المستخدمين: استخدام ملفات تعريف تم إنشاؤها بواسطة Jeong وآخرين و Tennenholtz وآخرين، والتي تم إنشاؤها بواسطة نموذج لغة كبير بناءً على سجل التقييمات الكامل، وتم التحقق من قدرتها على التنبؤ بتقييمات المستخدم
تستشهد الورقة بـ 31 مرجعاً ذا صلة، تغطي مجالات متعددة ذات صلة بما في ذلك أنظمة التوصيات الحوارية ونماذج اللغة الكبيرة ونماذج الانتشار واستخراج التفضيلات، مما يوفر أساساً نظرياً متيناً لهذا البحث.
التقييم الإجمالي: هذه ورقة بحثية عالية الجودة تطبق بشكل مبتكر أفكار نماذج الانتشار على مشكلة استخراج التفضيلات، وتقترح حلاً كاملاً وتتحقق من فعاليته من خلال التجارب. على الرغم من وجود بعض القيود، فإن مساهماتها التقنية وقيمتها العملية تجعلها تقدماً مهماً في مجال أنظمة التوصيات الحوارية.