Asking Clarifying Questions for Preference Elicitation With Large Language Models
Montazeralghaem, Tennenholtz, Boutilier et al.
Large Language Models (LLMs) have made it possible for recommendation systems to interact with users in open-ended conversational interfaces. In order to personalize LLM responses, it is crucial to elicit user preferences, especially when there is limited user history. One way to get more information is to present clarifying questions to the user. However, generating effective sequential clarifying questions across various domains remains a challenge. To address this, we introduce a novel approach for training LLMs to ask sequential questions that reveal user preferences. Our method follows a two-stage process inspired by diffusion models. Starting from a user profile, the forward process generates clarifying questions to obtain answers and then removes those answers step by step, serving as a way to add ``noise'' to the user profile. The reverse process involves training a model to ``denoise'' the user profile by learning to ask effective clarifying questions. Our results show that our method significantly improves the LLM's proficiency in asking funnel questions and eliciting user preferences effectively.
academic
বড় ভাষা মডেলগুলির সাথে পছন্দ সংগ্রহের জন্য স্পষ্টীকরণ প্রশ্ন জিজ্ঞাসা করা
বড় ভাষা মডেলগুলি (এলএলএম) সুপারিশ ব্যবস্থাগুলিকে খোলা-সমাপ্ত কথোপকথন ইন্টারফেসের মাধ্যমে ব্যবহারকারীদের সাথে যোগাযোগ করতে সক্ষম করে। এলএলএম প্রতিক্রিয়াগুলি ব্যক্তিগতকৃত করার জন্য, বিশেষত সীমিত ব্যবহারকারী ইতিহাসের ক্ষেত্রে, কার্যকর ব্যবহারকারী পছন্দ সংগ্রহ অত্যন্ত গুরুত্বপূর্ণ। এই পেপারটি এমন একটি উপন্যাস পদ্ধতি প্রস্তাব করে যা এলএলএমগুলিকে ব্যবহারকারীর পছন্দ প্রকাশ করতে পারে এমন ক্রমানুসারী স্পষ্টীকরণ প্রশ্ন জিজ্ঞাসা করার জন্য প্রশিক্ষণ দেয়। এই পদ্ধতিটি বিস্তার মডেল দ্বারা অনুপ্রাণিত একটি দুই-পর্যায়ের প্রক্রিয়া ব্যবহার করে: সামনের দিকের প্রক্রিয়া ব্যবহারকারী প্রোফাইল থেকে শুরু করে স্পষ্টীকরণ প্রশ্ন তৈরি করে এবং ধীরে ধীরে উত্তরগুলি "শব্দ" হিসাবে সরিয়ে দেয়; বিপরীত প্রক্রিয়া মডেলটিকে কার্যকর স্পষ্টীকরণ প্রশ্ন জিজ্ঞাসা করে শিখে ব্যবহারকারী প্রোফাইল "ডিনোইজ" করার জন্য প্রশিক্ষণ দেয়। পরীক্ষামূলক ফলাফলগুলি দেখায় যে এই পদ্ধতিটি এলএলএমগুলির ফানেল-শৈলীর প্রশ্ন জিজ্ঞাসা করার এবং কার্যকরভাবে ব্যবহারকারী পছন্দ সংগ্রহ করার ক্ষমতা উল্লেখযোগ্যভাবে উন্নত করে।
এলএলএমগুলির দ্রুত বিকাশের সাথে, কথোপকথন সুপারিশ ব্যবস্থা (সিআরএস) সম্ভব হয়ে ওঠে, সরাসরি পছন্দ সংগ্রহের প্রশ্নের মাধ্যমে, সিস্টেমটি ব্যবহারকারীর চাহিদা স্পষ্ট করতে এবং উচ্চ-মানের ব্যক্তিগতকৃত সুপারিশ প্রদান করতে পারে।
সাধারণ প্রম্পটিং কৌশলগুলি এলএলএমগুলিকে উপযুক্ত সময়ে সংগ্রহের প্রশ্ন জিজ্ঞাসা করার জন্য গাইড করতে পারে, তবে ক্রস-ডোমেইন কার্যকর ক্রমানুসারী স্পষ্টীকরণ প্রশ্ন তৈরি করা এখনও একটি চ্যালেঞ্জ।
এই পেপারটি এলএলএমগুলির উচ্চ-মানের সংগ্রহ প্রশ্ন জিজ্ঞাসা করার ক্ষমতা অপ্টিমাইজ করার লক্ষ্য রাখে, বিশেষত "ফানেল-শৈলীর" প্রশ্ন জিজ্ঞাসা করা শিখতে—সাধারণ ধারণা থেকে শুরু করে, কথোপকথন অগ্রসর হওয়ার সাথে সাথে ধীরে ধীরে আরও নির্দিষ্ট হয়ে ওঠে।
ব্যবহারকারী প্রোফাইল P দেওয়া, লক্ষ্য হল ক্রমানুসারী প্রশ্ন Q₀, Q₁, ..., Qₙ₋₁ এবং সংশ্লিষ্ট উত্তর A₀, A₁, ..., Aₙ₋₁ এর মাধ্যমে, খালি প্রোফাইল P₀ = ∅ থেকে সম্পূর্ণ ব্যবহারকারী প্রোফাইল Pₙ পুনর্নির্মাণ করা।
মুভিলেন্স ডেটাসেট: সুপারিশ ব্যবস্থা গবেষণায় ব্যাপকভাবে ব্যবহৃত
ব্যবহারকারী প্রোফাইল: জিওং এবং অন্যদের এবং টেনেনহোল্টজ এবং অন্যদের দ্বারা তৈরি ব্যবহারকারী প্রোফাইল ব্যবহার করা, যা সম্পূর্ণ রেটিং ইতিহাসের উপর ভিত্তি করে এলএলএম দ্বারা তৈরি, ব্যবহারকারী রেটিংয়ের পূর্বাভাসমূলক হিসাবে যাচাই করা হয়েছে
পেপারটি 31টি সম্পর্কিত রেফারেন্স উদ্ধৃত করে, যা কথোপকথন সুপারিশ ব্যবস্থা, বড় ভাষা মডেল, বিস্তার মডেল, পছন্দ সংগ্রহ এবং অন্যান্য সম্পর্কিত ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, এই গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের গবেষণা পেপার যা সৃজনশীলভাবে বিস্তার মডেল ধারণাগুলি পছন্দ সংগ্রহ সমস্যায় প্রয়োগ করে, একটি সম্পূর্ণ সমাধান প্রস্তাব করে এবং পরীক্ষামূলক যাচাইকরণের মাধ্যমে কার্যকারিতা প্রদর্শন করে। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এর প্রযুক্তিগত অবদান এবং ব্যবহারিক মূল্য এটিকে কথোপকথন সুপারিশ ব্যবস্থা ক্ষেত্রের একটি গুরুত্বপূর্ণ অগ্রগতি করে তোলে।