Leading the Follower: Learning Persuasive Agents in Social Deduction Games
Zheng, Ye, Zhao et al.
Large language model (LLM) agents have shown remarkable progress in social deduction games (SDGs). However, existing approaches primarily focus on information processing and strategy selection, overlooking the significance of persuasive communication in influencing other players' beliefs and responses. In SDGs, success depends not only on making correct deductions but on convincing others to response in alignment with one's intent. To address this limitation, we formalize turn-based dialogue in SDGs as a Stackelberg competition, where the current player acts as the leader who strategically influences the follower's response. Building on this theoretical foundation, we propose a reinforcement learning framework that trains agents to optimize utterances for persuasive impact. Through comprehensive experiments across three diverse SDGs, we demonstrate that our agents significantly outperform baselines. This work represents a significant step toward developing AI agents capable of strategic social influence, with implications extending to scenarios requiring persuasive communication.
academic
Лидирование за последователем: обучение убедительных агентов в играх социальной дедукции
Агенты на основе больших языковых моделей (LLM) продемонстрировали значительный прогресс в играх социальной дедукции (SDGs). Однако существующие методы сосредоточены в основном на обработке информации и выборе стратегии, игнорируя важность убедительной коммуникации в влиянии на убеждения и реакции других игроков. В SDGs успех зависит не только от правильного рассуждения, но и от способности убедить других действовать в соответствии с собственными намерениями. Для решения этого ограничения авторы формализуют чередующуюся диалоговую форму в SDGs как конкуренцию Штакельберга, где текущий игрок как лидер стратегически влияет на реакцию последователя. На основе этой теоретической базы авторы предлагают структуру обучения с подкреплением для обучения агентов оптимизации убедительного влияния высказываний. Посредством комплексных экспериментов на трёх различных SDGs демонстрируется значительное превосходство предложенного метода над базовыми подходами.
Существующие агенты на основе LLM в играх социальной дедукции имеют следующие основные проблемы:
Игнорирование убедительной коммуникации: существующие методы сосредоточены в основном на обработке информации и выборе стратегии, без учёта убедительности
Отсутствие моделирования влияния: отсутствует систематическое моделирование того, как влиять на поведение других игроков посредством языка
Недостаточная локальная оптимизация: отсутствует стратегическая оптимизация каждого высказывания в чередующемся диалоге
Ориентация на выбор стратегии: существующие методы, такие как ReAct, ReCon и др., сосредоточены в основном на выборе стратегии из предопределённого пространства действий
Отсутствие оптимизации убедительности: нет специализированной оптимизации убедительного эффекта высказываний
Игнорирование динамики диалога: недостаточное использование стратегических возможностей чередующегося диалога
Теоретическое новшество: формализация чередующегося диалога в SDGs как модель конкуренции Штакельберга, обеспечивающая систематическую теоретическую базу для убедительной коммуникации
Методологическая структура: предложение структуры обучения с подкреплением, непосредственно оптимизирующей влияние высказываний на реакции последующих игроков
Экспериментальная верификация: проверка эффективности и обобщаемости метода на трёх различных SDGs (Werewolf, Avalon, ONUW)
Технический вклад: разработка полного конвейера обучения, объединяющего преимущества API-based LLM и открытых LLM
В играх социальной дедукции игроки должны влиять на поведение других игроков посредством чередующегося диалога для достижения условий собственной победы. В данной работе каждый раунд диалога моделируется как конкуренция Штакельберга:
Входные данные: правила игры R, текущее состояние игры G_t, история диалога D_t, роль игрока r_t
Тестирование на GPT-5 и Qwen3-14B без дополнительного обучения показало согласованное улучшение производительности, доказывая кроссмодельную обобщаемость метода.
Статья ссылается на важные работы из нескольких областей, включая игры социальной дедукции, обучение с подкреплением и теорию игр, в частности:
Xu et al. (2024): метод SLA
Light et al. (2025): метод Strategist
Shao et al. (2024): алгоритм GRPO
Bakhtin et al. (2022): система Cicero
Общая оценка: это высококачественная статья с важными вкладами в область социального интеллекта ИИ. Посредством инновационного теоретического моделирования и эффективной технической реализации она предоставляет новое направление исследований и практический метод для разработки убедительных агентов ИИ.