Asking Clarifying Questions for Preference Elicitation With Large Language Models
Montazeralghaem, Tennenholtz, Boutilier et al.
Large Language Models (LLMs) have made it possible for recommendation systems to interact with users in open-ended conversational interfaces. In order to personalize LLM responses, it is crucial to elicit user preferences, especially when there is limited user history. One way to get more information is to present clarifying questions to the user. However, generating effective sequential clarifying questions across various domains remains a challenge. To address this, we introduce a novel approach for training LLMs to ask sequential questions that reveal user preferences. Our method follows a two-stage process inspired by diffusion models. Starting from a user profile, the forward process generates clarifying questions to obtain answers and then removes those answers step by step, serving as a way to add ``noise'' to the user profile. The reverse process involves training a model to ``denoise'' the user profile by learning to ask effective clarifying questions. Our results show that our method significantly improves the LLM's proficiency in asking funnel questions and eliciting user preferences effectively.
academic
बड़े भाषा मॉडल के साथप्राथमिकता निष्कर्षण के लिए स्पष्टीकरण प्रश्न पूछना
बड़े भाषा मॉडल (LLMs) सिफारिश प्रणालियों को खुली-अंत वाली संवाद इंटरफेस के माध्यम से उपयोगकर्ताओं के साथ बातचीत करने में सक्षम बनाते हैं। LLM प्रतिक्रियाओं को व्यक्तिगत बनाने के लिए, विशेष रूप से सीमित उपयोगकर्ता इतिहास के मामलों में, प्रभावी उपयोगकर्ता प्राथमिकता अधिग्रहण महत्वपूर्ण है। यह पेपर LLMs को अनुक्रमित स्पष्टीकरण प्रश्न पूछने के लिए प्रशिक्षित करने के लिए एक नवीन दृष्टिकोण प्रस्तावित करता है जो उपयोगकर्ता प्राथमिकताओं को प्रकट कर सकते हैं। यह विधि विसरण मॉडल से प्रेरित एक दो-चरणीय प्रक्रिया अपनाती है: अग्रगामी प्रक्रिया उपयोगकर्ता प्रोफ़ाइल से शुरू करके स्पष्टीकरण प्रश्न उत्पन्न करती है और उत्तरों को "शोर" के रूप में क्रमिक रूप से हटाती है; पश्चगामी प्रक्रिया प्रभावी स्पष्टीकरण प्रश्न पूछने के माध्यम से उपयोगकर्ता प्रोफ़ाइल को "डीनॉइज़" करने के लिए मॉडल को प्रशिक्षित करती है। प्रायोगिक परिणाम दर्शाते हैं कि यह विधि漏斗-शैली प्रश्न पूछने और प्रभावी उपयोगकर्ता प्राथमिकता अधिग्रहण में LLM की क्षमता में काफी सुधार करती है।
सिफारिश प्रणालियां आमतौर पर प्राथमिकताएं सीखने के लिए उपयोगकर्ता इतिहास इंटरैक्शन पर निर्भर करती हैं, लेकिन निम्नलिखित परिस्थितियों में चुनौतियों का सामना करती हैं:
नए उपयोगकर्ता समस्या: पर्याप्त इंटरैक्शन इतिहास की कमी
गोपनीयता बाधाएं: ऐतिहासिक इंटरैक्शन डेटा के उपयोग को सीमित करना
संदर्भ अनिश्चितता: वर्तमान प्राथमिकताएं मनोदशा, सामाजिक वातावरण आदि कारकों से प्रभावित होती हैं
LLMs के तीव्र विकास के साथ, संवादी सिफारिश प्रणालियां (CRS) संभव हो गई हैं, जहां सीधे प्राथमिकता अधिग्रहण प्रश्नों के माध्यम से, सिस्टम उपयोगकर्ता आवश्यकताओं को स्पष्ट कर सकता है और उच्च-गुणवत्ता वाली व्यक्तिगत सिफारिशें प्रदान कर सकता है।
सरल प्रॉम्पटिंग तकनीकें LLM को उपयुक्त समय पर अधिग्रहण प्रश्न पूछने के लिए निर्देशित कर सकती हैं, लेकिन डोमेन भर में प्रभावी अनुक्रमित स्पष्टीकरण प्रश्न उत्पन्न करना अभी भी एक चुनौती है।
यह पेपर उच्च-गुणवत्ता वाले अधिग्रहण प्रश्न पूछने में LLMs की क्षमता को अनुकूलित करने का लक्ष्य रखता है, विशेष रूप से "漏斗-शैली" प्रश्न पूछने के लिए—सामान्य अवधारणाओं से शुरू करके, संवाद के साथ क्रमिक रूप से अधिक विशिष्ट हो जाते हैं।
उपयोगकर्ता प्रोफ़ाइल P दिए गए, लक्ष्य अनुक्रमित प्रश्नों Q₀, Q₁, ..., Qₙ₋₁ और संबंधित उत्तरों A₀, A₁, ..., Aₙ₋₁ के माध्यम से खाली प्रोफ़ाइल P₀ = ∅ से पूर्ण उपयोगकर्ता प्रोफ़ाइल Pₙ का पुनर्निर्माण करना है।
MovieLens डेटासेट: सिफारिश प्रणाली अनुसंधान में व्यापक रूप से उपयोग किया जाता है
उपयोगकर्ता प्रोफ़ाइल: Jeong आदि और Tennenholtz आदि द्वारा उत्पन्न उपयोगकर्ता प्रोफ़ाइल का उपयोग, जो पूर्ण रेटिंग इतिहास के आधार पर LLM द्वारा उत्पन्न होते हैं, उपयोगकर्ता रेटिंग के लिए भविष्यसूचक सत्यापित हैं
पेपर संवादी सिफारिश प्रणालियों, बड़े भाषा मॉडल, विसरण मॉडल, प्राथमिकता अधिग्रहण और अन्य कई संबंधित क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हुए 31 संबंधित संदर्भों का हवाला देता है, जो इस अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला अनुसंधान पेपर है जो रचनात्मक रूप से विसरण मॉडल विचारों को प्राथमिकता अधिग्रहण समस्या में लागू करता है, एक पूर्ण समाधान प्रस्तावित करता है और प्रयोगों के माध्यम से प्रभावशीलता को सत्यापित करता है। कुछ सीमाओं के बावजूद, इसके तकनीकी योगदान और व्यावहारिक मूल्य इसे संवादी सिफारिश प्रणाली क्षेत्र में एक महत्वपूर्ण प्रगति बनाते हैं।