Asking Clarifying Questions for Preference Elicitation With Large Language Models
Montazeralghaem, Tennenholtz, Boutilier et al.
Large Language Models (LLMs) have made it possible for recommendation systems to interact with users in open-ended conversational interfaces. In order to personalize LLM responses, it is crucial to elicit user preferences, especially when there is limited user history. One way to get more information is to present clarifying questions to the user. However, generating effective sequential clarifying questions across various domains remains a challenge. To address this, we introduce a novel approach for training LLMs to ask sequential questions that reveal user preferences. Our method follows a two-stage process inspired by diffusion models. Starting from a user profile, the forward process generates clarifying questions to obtain answers and then removes those answers step by step, serving as a way to add ``noise'' to the user profile. The reverse process involves training a model to ``denoise'' the user profile by learning to ask effective clarifying questions. Our results show that our method significantly improves the LLM's proficiency in asking funnel questions and eliciting user preferences effectively.
대규모 언어 모델(LLMs)은 추천 시스템이 개방형 대화 인터페이스를 통해 사용자와 상호작용할 수 있게 한다. 특히 사용자 이력이 제한적인 경우 LLM 응답을 개인화하기 위해서는 사용자 선호도를 효과적으로 추출하는 것이 중요하다. 본 논문은 사용자 선호도를 드러낼 수 있는 순차적 명확화 질문을 제시하도록 LLM을 훈련하는 새로운 방법을 제안한다. 이 방법은 확산 모델에서 영감을 받은 2단계 프로세스를 채택한다: 전방 과정은 사용자 프로필에서 시작하여 명확화 질문을 생성하고 답변을 "노이즈"로 점진적으로 제거하며, 역방 과정은 효과적인 명확화 질문을 제시하여 사용자 프로필을 "노이즈 제거"하도록 모델을 훈련한다. 실험 결과는 이 방법이 LLM의 깔때기식 질문 제시 및 효과적인 사용자 선호도 추출 능력을 크게 향상시킴을 보여준다.