Leading the Follower: Learning Persuasive Agents in Social Deduction Games
Zheng, Ye, Zhao et al.
Large language model (LLM) agents have shown remarkable progress in social deduction games (SDGs). However, existing approaches primarily focus on information processing and strategy selection, overlooking the significance of persuasive communication in influencing other players' beliefs and responses. In SDGs, success depends not only on making correct deductions but on convincing others to response in alignment with one's intent. To address this limitation, we formalize turn-based dialogue in SDGs as a Stackelberg competition, where the current player acts as the leader who strategically influences the follower's response. Building on this theoretical foundation, we propose a reinforcement learning framework that trains agents to optimize utterances for persuasive impact. Through comprehensive experiments across three diverse SDGs, we demonstrate that our agents significantly outperform baselines. This work represents a significant step toward developing AI agents capable of strategic social influence, with implications extending to scenarios requiring persuasive communication.
academic
Guidare il Seguace: Apprendimento di Agenti Persuasivi nei Giochi di Deduzione Sociale
Gli agenti basati su modelli di linguaggio di grandi dimensioni (LLM) hanno dimostrato progressi significativi nei giochi di deduzione sociale (SDGs). Tuttavia, i metodi esistenti si concentrano principalmente sull'elaborazione delle informazioni e sulla selezione strategica, trascurando l'importanza della comunicazione persuasiva nell'influenzare le convinzioni e le reazioni degli altri giocatori. Negli SDGs, il successo dipende non solo dal ragionamento corretto, ma anche dalla capacità di persuadere gli altri ad agire secondo le proprie intenzioni. Per affrontare questa limitazione, gli autori formalizzano la comunicazione a turni negli SDGs come competizione di Stackelberg, dove il giocatore attuale agisce come leader influenzando strategicamente le risposte del seguace. Sulla base di questo fondamento teorico, gli autori propongono un framework di apprendimento per rinforzo che addestra gli agenti a ottimizzare l'impatto persuasivo del discorso. Attraverso esperimenti completi su tre diversi SDGs, dimostrano che il metodo supera significativamente i metodi di base.
Gli agenti basati su LLM nei giochi di ragionamento sociale presentano i seguenti problemi principali:
Trascuratezza della comunicazione persuasiva: I metodi esistenti si concentrano principalmente sull'elaborazione delle informazioni e sulla selezione strategica, mancando di considerare la persuasività
Mancanza di modellazione dell'influenza: Nessuna modellazione sistematica di come influenzare il comportamento degli altri giocatori attraverso il linguaggio
Insufficienza dell'ottimizzazione locale: Mancanza di ottimizzazione strategica per ogni turno di conversazione
Orientamento alla selezione strategica: Metodi esistenti come ReAct e ReCon si concentrano principalmente sulla selezione di strategie da uno spazio di azioni predefinite
Mancanza di ottimizzazione della persuasività: Nessuna ottimizzazione specializzata per l'effetto persuasivo del discorso
Trascuratezza della dinamica conversazionale: Mancato sfruttamento completo delle opportunità strategiche nella comunicazione a turni
Innovazione teorica: Formalizzazione della comunicazione a turni negli SDGs come modello di competizione di Stackelberg, fornendo una base teorica sistematica per la comunicazione persuasiva
Framework metodologico: Proposta di un framework di apprendimento per rinforzo che ottimizza direttamente l'impatto del discorso sulle risposte dei giocatori successivi
Verifica sperimentale: Validazione dell'efficacia e della generalizzabilità del metodo su tre diversi SDGs (Werewolf, Avalon, ONUW)
Contributi tecnici: Sviluppo di una pipeline di addestramento completa che combina i vantaggi degli LLM basati su API e degli LLM open-source
Nei giochi di deduzione sociale, i giocatori devono influenzare il comportamento degli altri attraverso la comunicazione a turni per raggiungere le proprie condizioni di vittoria. Questo articolo modella ogni turno di conversazione come una competizione di Stackelberg:
Input: Regole del gioco R, stato attuale del gioco G_t, cronologia della conversazione D_t, ruolo del giocatore r_t
Output: Discorso persuasivo ottimizzato u_t
Obiettivo: Massimizzare l'influenza favorevole sulla risposta del giocatore successivo
Sono stati condotti studi di ablazione su diverse varianti della funzione di ricompensa:
Solo Positivo: Massimizzazione solo della probabilità di risposta desiderata
Solo Negativo: Minimizzazione solo della probabilità di risposta indesiderata
Completo: Considerazione simultanea del feedback positivo e negativo
I risultati mostrano che il metodo completo supera significativamente le varianti a obiettivo singolo, provando la necessità dell'ottimizzazione bidirezionale.
Test su GPT-5 e Qwen3-14B senza addestramento aggiuntivo dimostrano miglioramenti coerenti delle prestazioni, confermando la capacità di generalizzazione cross-modello del metodo.
Questo articolo cita importanti lavori da molteplici campi inclusi giochi di deduzione sociale, apprendimento per rinforzo e teoria dei giochi, in particolare:
Xu et al. (2024): Metodo SLA
Light et al. (2025): Metodo Strategist
Shao et al. (2024): Algoritmo GRPO
Bakhtin et al. (2022): Sistema Cicero
Valutazione Complessiva: Questo è un articolo di alta qualità con importanti contributi nel campo dell'intelligenza sociale dell'IA. Attraverso la modellazione teorica innovativa e l'implementazione tecnica efficace, fornisce nuove direzioni di ricerca e metodi pratici per lo sviluppo di agenti IA con capacità persuasive.