Leading the Follower: Learning Persuasive Agents in Social Deduction Games
Zheng, Ye, Zhao et al.
Large language model (LLM) agents have shown remarkable progress in social deduction games (SDGs). However, existing approaches primarily focus on information processing and strategy selection, overlooking the significance of persuasive communication in influencing other players' beliefs and responses. In SDGs, success depends not only on making correct deductions but on convincing others to response in alignment with one's intent. To address this limitation, we formalize turn-based dialogue in SDGs as a Stackelberg competition, where the current player acts as the leader who strategically influences the follower's response. Building on this theoretical foundation, we propose a reinforcement learning framework that trains agents to optimize utterances for persuasive impact. Through comprehensive experiments across three diverse SDGs, we demonstrate that our agents significantly outperform baselines. This work represents a significant step toward developing AI agents capable of strategic social influence, with implications extending to scenarios requiring persuasive communication.
대규모 언어 모델(LLM) 에이전트는 사회 추론 게임(SDGs)에서 상당한 진전을 보였다. 그러나 기존 방법들은 주로 정보 처리 및 전략 선택에 초점을 맞추고 있으며, 다른 플레이어의 신념과 반응에 영향을 미치는 설득적 의사소통의 중요성을 간과하고 있다. SDGs에서 성공은 올바른 추론뿐만 아니라 다른 사람들을 자신의 의도대로 행동하도록 설득하는 능력에 달려 있다. 이러한 한계를 해결하기 위해 저자들은 SDGs의 순차적 대화를 스택엘베르그 경쟁으로 형식화했으며, 현재 플레이어가 리더로서 추종자의 반응에 전략적으로 영향을 미친다. 이러한 이론적 기초를 바탕으로 저자들은 발화의 설득력 영향을 최적화하도록 에이전트를 훈련하는 강화학습 프레임워크를 제안했다. 세 가지 서로 다른 SDGs에 대한 포괄적인 실험을 통해 제안된 방법이 기존 방법들을 크게 능가함을 입증했다.