Leading the Follower: Learning Persuasive Agents in Social Deduction Games
Zheng, Ye, Zhao et al.
Large language model (LLM) agents have shown remarkable progress in social deduction games (SDGs). However, existing approaches primarily focus on information processing and strategy selection, overlooking the significance of persuasive communication in influencing other players' beliefs and responses. In SDGs, success depends not only on making correct deductions but on convincing others to response in alignment with one's intent. To address this limitation, we formalize turn-based dialogue in SDGs as a Stackelberg competition, where the current player acts as the leader who strategically influences the follower's response. Building on this theoretical foundation, we propose a reinforcement learning framework that trains agents to optimize utterances for persuasive impact. Through comprehensive experiments across three diverse SDGs, we demonstrate that our agents significantly outperform baselines. This work represents a significant step toward developing AI agents capable of strategic social influence, with implications extending to scenarios requiring persuasive communication.
academic
Diriger le Suiveur : Apprentissage d'Agents Persuasifs dans les Jeux de Déduction Sociale
Les agents basés sur les grands modèles de langage (LLM) ont démontré des progrès significatifs dans les jeux de déduction sociale (SDGs). Cependant, les méthodes existantes se concentrent principalement sur le traitement de l'information et la sélection de stratégies, en négligeant l'importance de la communication persuasive dans l'influence des croyances et des réactions des autres joueurs. Dans les SDGs, le succès dépend non seulement du raisonnement correct, mais aussi de la capacité à persuader les autres d'agir selon ses intentions. Pour résoudre cette limitation, les auteurs formalisent la structure de dialogue alterné dans les SDGs comme une compétition de Stackelberg, où le joueur actuel agit en tant que leader influençant stratégiquement les réactions du suiveur. Sur cette base théorique, les auteurs proposent un cadre d'apprentissage par renforcement entraînant les agents à optimiser l'impact persuasif du discours. Grâce à des expériences complètes sur trois SDGs différents, la méthode démontre une supériorité significative par rapport aux méthodes de base.
Les agents LLM existants dans les jeux de raisonnement social présentent les problèmes suivants :
Négligence de la communication persuasive : Les méthodes existantes se concentrent principalement sur le traitement de l'information et la sélection de stratégies, sans considération pour la persuasion
Absence de modélisation de l'influence : Pas de modélisation systématique de la manière d'influencer le comportement des autres joueurs par le langage
Optimisation locale insuffisante : Absence d'optimisation stratégique pour chaque tour de parole dans le dialogue alterné
Orientation vers la sélection de stratégies : Les méthodes existantes comme ReAct, ReCon, etc. se concentrent principalement sur la sélection de stratégies à partir d'espaces d'actions prédéfinis
Absence d'optimisation persuasive : Pas d'optimisation spécifique de l'effet persuasif du discours
Négligence de la dynamique dialogale : Utilisation insuffisante des opportunités stratégiques du dialogue alterné
Innovation théorique : Formalisation de la structure de dialogue alterné dans les SDGs comme modèle de compétition de Stackelberg, fournissant une base théorique systématique pour la communication persuasive
Cadre méthodologique : Proposition d'un cadre d'apprentissage par renforcement optimisant directement l'impact du discours sur les réactions des joueurs suivants
Validation expérimentale : Vérification de l'efficacité et de la généralisation de la méthode sur trois SDGs différents (Werewolf, Avalon, ONUW)
Contribution technique : Développement d'un pipeline d'entraînement complet combinant les avantages des LLM basés sur API et des LLM open-source
Dans les jeux de raisonnement social, les joueurs doivent influencer le comportement des autres par le dialogue alterné pour atteindre leurs conditions de victoire respectives. Cet article modélise chaque tour de dialogue comme une compétition de Stackelberg :
Entrées : Règles du jeu R, état du jeu actuel G_t, historique du dialogue D_t, rôle du joueur r_t
Sorties : Discours persuasif optimisé u_t
Objectif : Maximiser l'influence favorable sur la réaction du joueur suivant
Études d'ablation menées sur différentes variantes de la fonction de récompense :
Positive-Only : Maximisation uniquement de la probabilité de réaction souhaitée
Negative-Only : Minimisation uniquement de la probabilité de réaction non souhaitée
Complete : Considération simultanée des retours positifs et négatifs
Les résultats montrent que la méthode complète surpasse significativement les variantes à objectif unique, prouvant la nécessité de l'optimisation bidirectionnelle.
Tests sur GPT-5 et Qwen3-14B sans entraînement supplémentaire montrent des améliorations de performance cohérentes, démontrant la capacité de généralisation inter-modèles de la méthode.
Les premiers travaux s'appuyaient principalement sur des systèmes basés sur des règles, les travaux récents se tournant vers des méthodes pilotées par LLM :
Méthodes d'ingénierie des invites : Récupération d'informations et réflexion expérientielle de Xu et al. (2023)
Méthodes d'apprentissage par renforcement : SLA, LSPO, etc. sélectionnant des actions prédéfinies via RL
Méthodes de génération de code : Strategist via génération de code et recherche en arbre
Cet article cite des travaux importants dans plusieurs domaines : jeux de déduction sociale, apprentissage par renforcement, théorie des jeux, notamment :
Xu et al. (2024) : Méthode SLA
Light et al. (2025) : Méthode Strategist
Shao et al. (2024) : Algorithme GRPO
Bakhtin et al. (2022) : Système Cicero
Évaluation Globale : Cet article est une contribution de haute qualité et d'importance significative dans le domaine de l'intelligence sociale de l'IA. Grâce à une modélisation théorique innovante et une implémentation technique efficace, il fournit une nouvelle direction de recherche et une méthode pratique pour le développement d'agents IA dotés de capacités de persuasion.