Asking Clarifying Questions for Preference Elicitation With Large Language Models
Montazeralghaem, Tennenholtz, Boutilier et al.
Large Language Models (LLMs) have made it possible for recommendation systems to interact with users in open-ended conversational interfaces. In order to personalize LLM responses, it is crucial to elicit user preferences, especially when there is limited user history. One way to get more information is to present clarifying questions to the user. However, generating effective sequential clarifying questions across various domains remains a challenge. To address this, we introduce a novel approach for training LLMs to ask sequential questions that reveal user preferences. Our method follows a two-stage process inspired by diffusion models. Starting from a user profile, the forward process generates clarifying questions to obtain answers and then removes those answers step by step, serving as a way to add ``noise'' to the user profile. The reverse process involves training a model to ``denoise'' the user profile by learning to ask effective clarifying questions. Our results show that our method significantly improves the LLM's proficiency in asking funnel questions and eliciting user preferences effectively.
academic
Задание уточняющих вопросов для выявления предпочтений с использованием больших языковых моделей
Большие языковые модели (LLM) позволяют системам рекомендаций взаимодействовать с пользователями через открытые диалоговые интерфейсы. Для персонализации ответов LLM, особенно при ограниченной истории пользователя, критически важно эффективное выявление предпочтений пользователя. В данной статье предлагается новый подход к обучению LLM задавать последовательные уточняющие вопросы, способные раскрыть предпочтения пользователя. Метод использует двухэтапный процесс, вдохновленный моделями диффузии: прямой процесс начинается с профиля пользователя и генерирует уточняющие вопросы, постепенно удаляя ответы как «шум»; обратный процесс обучает модель «удалять шум» из профиля пользователя путем изучения эффективных уточняющих вопросов. Экспериментальные результаты показывают, что предложенный метод значительно улучшает способность LLM задавать воронкообразные вопросы и эффективно выявлять предпочтения пользователя.
Системы рекомендаций обычно полагаются на историю взаимодействия пользователя для изучения предпочтений, но сталкиваются с проблемами в следующих случаях:
Проблема холодного старта: отсутствие достаточной истории взаимодействия
Ограничения конфиденциальности: ограничение использования данных истории взаимодействия
Неопределенность контекста: текущие предпочтения зависят от настроения, социальной среды и других факторов
С быстрым развитием LLM становятся возможны диалоговые системы рекомендаций (CRS), которые могут уточнять потребности пользователя и предоставлять высококачественные персонализированные рекомендации через прямые вопросы выявления предпочтений.
Простые методы подсказок могут направить LLM на задание вопросов выявления в надлежащее время, однако генерация эффективных последовательных уточняющих вопросов в различных областях остается сложной задачей.
Данная работа направлена на оптимизацию способности LLM задавать высококачественные вопросы выявления, в частности на изучение задания «воронкообразных» вопросов — начиная с общих концепций и постепенно переходя к более конкретным по мере развития диалога.
Учитывая профиль пользователя P, целью является реконструкция полного профиля пользователя P_n из пустого профиля P₀ = ∅ посредством последовательных вопросов Q₀, Q₁, ..., Q_ и соответствующих ответов A₀, A₁, ..., A_.
Набор данных MovieLens: широко используется в исследованиях систем рекомендаций
Профили пользователей: используются профили, созданные Jeong и др., а также Tennenholtz и др., которые генерируются LLM на основе полной истории оценок и верифицированы на предсказательность оценок пользователей
Статья цитирует 31 связанную работу, охватывающую важные исследования в нескольких связанных областях, включая диалоговые системы рекомендаций, большие языковые модели, модели диффузии, выявление предпочтений и другие, обеспечивая прочную теоретическую основу для данного исследования.
Общая оценка: Это высококачественная исследовательская статья, которая инновационно применяет идеи моделей диффузии к проблеме выявления предпочтений, предлагает полное решение и верифицирует его эффективность экспериментально. Несмотря на некоторые ограничения, её технический вклад и практическая ценность делают её важным прогрессом в области диалоговых систем рекомендаций.