Leading the Follower: Learning Persuasive Agents in Social Deduction Games
Zheng, Ye, Zhao et al.
Large language model (LLM) agents have shown remarkable progress in social deduction games (SDGs). However, existing approaches primarily focus on information processing and strategy selection, overlooking the significance of persuasive communication in influencing other players' beliefs and responses. In SDGs, success depends not only on making correct deductions but on convincing others to response in alignment with one's intent. To address this limitation, we formalize turn-based dialogue in SDGs as a Stackelberg competition, where the current player acts as the leader who strategically influences the follower's response. Building on this theoretical foundation, we propose a reinforcement learning framework that trains agents to optimize utterances for persuasive impact. Through comprehensive experiments across three diverse SDGs, we demonstrate that our agents significantly outperform baselines. This work represents a significant step toward developing AI agents capable of strategic social influence, with implications extending to scenarios requiring persuasive communication.
academic
अनुयायी को नेतृत्व देना: सामाजिक निगमन खेलों में प्रेरक एजेंटों का सीखना
बड़े भाषा मॉडल (LLM) एजेंट सामाजिक निगमन खेलों (SDGs) में उल्लेखनीय प्रगति प्रदर्शित कर रहे हैं। हालांकि, मौजूदा तरीके मुख्य रूप से सूचना प्रसंस्करण और रणनीति चयन पर ध्यान केंद्रित करते हैं, जो अन्य खिलाड़ियों के विश्वास और प्रतिक्रियाओं को प्रभावित करने में प्रेरक संचार के महत्व को नजरअंदाज करते हैं। SDGs में, सफलता न केवल सही तर्क पर निर्भर करती है, बल्कि दूसरों को अपने इरादे के अनुसार कार्य करने के लिए प्रेरित करने पर भी निर्भर करती है। इस सीमा को दूर करने के लिए, लेखकों ने SDGs में बारी-बारी से संवाद को Stackelberg प्रतियोगिता के रूप में औपचारिक रूप दिया है, जहां वर्तमान खिलाड़ी नेता के रूप में कार्य करता है और रणनीतिक रूप से अनुयायी की प्रतिक्रिया को प्रभावित करता है। इस सैद्धांतिक आधार पर, लेखकों ने एक सुदृढ़ीकरण सीखने की रूपरेखा प्रस्तावित की है जो कथन के प्रेरक प्रभाव को अनुकूलित करने के लिए एजेंटों को प्रशिक्षित करती है। तीन विभिन्न SDGs पर व्यापक प्रयोगों के माध्यम से, यह दर्शाया गया है कि यह विधि आधारभूत तरीकों से काफी बेहतर है।
सैद्धांतिक नवाचार: SDGs में बारी-बारी से संवाद को Stackelberg प्रतियोगिता मॉडल के रूप में औपचारिक रूप दिया, जो प्रेरक संचार के लिए एक व्यवस्थित सैद्धांतिक आधार प्रदान करता है
विधि रूपरेखा: एक सुदृढ़ीकरण सीखने की रूपरेखा प्रस्तावित की जो सीधे बाद के खिलाड़ी की प्रतिक्रिया पर कथन के प्रभाव को अनुकूलित करती है
प्रायोगिक सत्यापन: तीन विभिन्न SDGs (Werewolf, Avalon, ONUW) पर विधि की प्रभावशीलता और सामान्यीकरण क्षमता का सत्यापन किया
तकनीकी योगदान: API-आधारित LLM और ओपन-सोर्स LLM के लाभों को जोड़ने वाली एक संपूर्ण प्रशिक्षण पाइपलाइन विकसित की
सामाजिक तर्क खेलों में, खिलाड़ियों को बारी-बारी से संवाद के माध्यम से अन्य खिलाड़ियों के व्यवहार को प्रभावित करने की आवश्यकता है, अंत में अपनी जीत की शर्तें पूरी करने के लिए। यह पेपर प्रत्येक संवाद मोड़ को Stackelberg प्रतियोगिता के रूप में मॉडल करता है:
इनपुट: खेल नियम R, वर्तमान खेल स्थिति G_t, संवाद इतिहास D_t, खिलाड़ी भूमिका r_t
आउटपुट: अनुकूलित प्रेरक कथन u_t
उद्देश्य: अगले खिलाड़ी की प्रतिक्रिया पर अनुकूल प्रभाव को अधिकतम करना
GPT-5 और Qwen3-14B पर परीक्षण किया गया, बिना अतिरिक्त प्रशिक्षण के सुसंगत प्रदर्शन सुधार प्राप्त किया, जो विधि की क्रॉस-मॉडल सामान्यीकरण क्षमता को साबित करता है।
यह पेपर सामाजिक तर्क खेल, सुदृढ़ीकरण सीखना, खेल सिद्धांत आदि कई क्षेत्रों के महत्वपूर्ण कार्यों का हवाला देता है, विशेष रूप से:
Xu et al. (2024): SLA विधि
Light et al. (2025): Strategist विधि
Shao et al. (2024): GRPO एल्गोरिथ्म
Bakhtin et al. (2022): Cicero प्रणाली
समग्र मूल्यांकन: यह AI सामाजिक बुद्धिमत्ता क्षेत्र में महत्वपूर्ण योगदान वाला एक उच्च-गुणवत्ता वाला पेपर है। नवीन सैद्धांतिक मॉडलिंग और प्रभावी तकनीकी कार्यान्वयन के माध्यम से, यह प्रेरक क्षमता वाले AI एजेंटों के विकास के लिए नई अनुसंधान दिशा और व्यावहारिक विधि प्रदान करता है।