2025-11-12T04:28:10.201322

AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation

Wang, Wang, Wu et al.

Constrained by the cost and ethical concerns of involving real seekers in AI-driven mental health, researchers develop LLM-based conversational agents (CAs) with tailored configurations, such as profiles, symptoms, and scenarios, to simulate seekers. While these efforts advance AI in mental health, achieving more realistic seeker simulation remains hindered by two key challenges: dynamic evolution and multi-session memory. Seekers' mental states often fluctuate during counseling, which typically spans multiple sessions. To address this, we propose AnnaAgent, an emotional and cognitive dynamic agent system equipped with tertiary memory. AnnaAgent incorporates an emotion modulator and a complaint elicitor trained on real counseling dialogues, enabling dynamic control of the simulator's configurations. Additionally, its tertiary memory mechanism effectively integrates short-term and long-term memory across sessions. Evaluation results, both automated and manual, demonstrate that AnnaAgent achieves more realistic seeker simulation in psychological counseling compared to existing baselines. The ethically reviewed and screened code can be found on https://github.com/sci-m-wang/AnnaAgent.

academic

AnnaAgent: Système d'Agent Évolutif Dynamique avec Mémoire Multi-Session pour la Simulation Réaliste de Demandeurs d'Aide

Informations Fondamentales

ID de l'article: 2506.00551
Titre: AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation
Auteurs: Ming Wang, Peidong Wang, Lin Wu, Xiaocui Yang, Daling Wang, Shi Feng, Yuxin Chen, Bixuan Wang, Yifei Zhang
Classification: cs.CL cs.AI
Date de publication: 10 juin 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2506.00551

Résumé

En raison des coûts et des enjeux éthiques liés à l'implication de véritables demandeurs d'aide dans la recherche en santé mentale assistée par l'IA, les chercheurs ont développé des agents conversationnels basés sur les LLM pour simuler les demandeurs d'aide, en utilisant des configurations personnalisées telles que les profils personnels, les symptômes et les scénarios. Bien que ces efforts fassent progresser l'application de l'IA dans le domaine de la santé mentale, la réalisation d'une simulation plus réaliste des demandeurs d'aide se heurte à deux défis clés : l'évolution dynamique et la mémoire multi-session. L'état psychologique des demandeurs d'aide fluctue souvent au cours du processus de consultation, qui s'étend généralement sur plusieurs sessions. Pour résoudre ce problème, cet article propose AnnaAgent, un système d'agent dynamique émotionnel et cognitif équipé d'une mémoire à trois niveaux. AnnaAgent intègre un régulateur émotionnel et un guide de plainte principale entraînés sur des dialogues de consultation réels, permettant un contrôle dynamique de la configuration du simulateur. De plus, son mécanisme de mémoire à trois niveaux intègre efficacement les mémoires à court et long terme entre les sessions. Les résultats d'évaluation montrent qu'AnnaAgent réalise une simulation de demandeur d'aide plus réaliste que les méthodes de base existantes dans les consultations psychologiques.

Contexte de Recherche et Motivation

Définition du Problème

Le problème fondamental que cette recherche vise à résoudre est comment simuler plus fidèlement le comportement des demandeurs d'aide dans la recherche en santé mentale assistée par l'IA. Plus précisément :

Limitations de coûts et d'éthique : Impliquer un grand nombre de véritables demandeurs d'aide dans la recherche est non seulement coûteux, mais soulève également des préoccupations éthiques
Insuffisances des méthodes de simulation existantes : Les agents conversationnels actuels basés sur les LLM présentent des problèmes tels que l'affectivité plate et l'acceptation facile des conseils lors de la simulation des demandeurs d'aide
Manque de dynamique : Les méthodes existantes ne peuvent pas simuler les fluctuations émotionnelles et les changements cognitifs des demandeurs d'aide au cours du processus de consultation
Absence de mémoire multi-session : La consultation psychologique est généralement un processus à long terme et multi-session, mais les méthodes existantes manquent de mécanismes de mémoire entre les sessions

Importance de la Recherche

Les problèmes de santé mentale constituent un défi majeur auquel la société contemporaine est confrontée, tandis que le nombre de thérapeutes formés est limité. La technologie de l'IA présente un énorme potentiel pour le soutien en santé mentale, mais nécessite une simulation plus réaliste des demandeurs d'aide pour :

Construire des données et évaluer l'efficacité
Former les conseillers psychologiques
Mener des recherches et des expériences en psychologie

Limitations des Approches Existantes

Par le biais d'une revue de la littérature, les auteurs ont identifié les problèmes suivants dans les méthodes existantes de simulation des demandeurs d'aide :

Configuration statique : Les émotions et la cognition des symptômes restent inchangées tout au long du processus de consultation
Absence de mécanisme de mémoire : Incapacité à traiter les dialogues impliquant le contenu des sessions précédentes
Comportement non réaliste : Tendance à accepter les conseils, trop soumis, expression émotionnelle plate

Contributions Principales

Première identification des deux défis clés que sont l'évolution dynamique et la mémoire multi-session, formalisant l'évolution dynamique comme des changements d'émotions et de plaintes principales, et divisant la mémoire multi-session en différentes phases
Conception du système AnnaAgent : Un système d'agent dynamique émotionnel et cognitif doté d'une mémoire à trois niveaux, simulant l'évolution dynamique en consultation en contrôlant les changements d'émotions et de cognition des symptômes dans le dialogue
Validation de l'efficacité du système : Démonstration par évaluation expérimentale qu'AnnaAgent peut simuler plus fidèlement le comportement des demandeurs d'aide dans les consultations psychologiques

Explication Détaillée de la Méthode

Définition de la Tâche

La tâche de simulation des demandeurs d'aide nécessite d'assigner une configuration de rôle au LLM, incluant :

Profil : Informations personnelles de base (âge, sexe, profession, etc.)
Plainte : Cognition du demandeur d'aide concernant ses symptômes et problèmes principaux
Situation : Environnement de vie et événements vécus
Statut : États physiques et psychologiques pertinents
Émotion : Style de réponse émotionnelle attendu

Architecture du Modèle

AnnaAgent adopte une architecture multi-agents, comprenant deux groupes d'agents principaux :

1. Groupe de Contrôle d'Évolution Dynamique

Régulation Émotionnelle :

Raisonneur Émotionnel : Entraîné sur Qwen2.5-7B-Instruct, apprenant les modèles d'évolution émotionnelle dans les consultations réelles à partir du dataset D4
Perturbateur Émotionnel : Introduit une perturbation aléatoire pour éviter des modèles d'évolution émotionnelle figés, attribuant des poids de probabilité selon la distance émotionnelle :

$P(emo_T) = \frac{w(d(G_T, G_B) \times |G_T|)}{\sum_{G_j} w(d(G_B, G_j)) \times |G_j|}$

où $G_B$ et $G_T$ représentent respectivement les groupes émotionnels de base et cibles, et $d(\cdot)$ représente la distance entre les groupes émotionnels.

Guidage de la Plainte Principale :

Génération de Chaîne de Plainte : Génère une chaîne d'évolution de plainte basée sur la configuration du demandeur d'aide et les événements récents
Contrôle de Commutation de Plainte : Détermine algorithmiquement s'il faut passer à l'étape suivante de la plainte dans la chaîne

2. Groupe de Planification de Mémoire à Trois Niveaux

Mémoire en Temps Réel : Contenu du dialogue de la session actuelle
Mémoire à Court Terme : Événements récents et changements d'état, capturés via des échelles d'auto-évaluation
Mémoire à Long Terme : Dialogues et enregistrements d'échelles des sessions précédentes, planifiés via RAG Agentic

Points d'Innovation Technique

Modélisation de l'Évolution Dynamique : Première formalisation des changements dynamiques des demandeurs d'aide comme évolution selon deux dimensions : émotions et plaintes principales
Mécanisme de Mémoire à Trois Niveaux : Système de mémoire hiérarchisé temporellement conçu selon la théorie de la mémoire
Apprentissage d'Évolution Guidé par les Données : Entraînement de modèles de changement émotionnel et de plainte basé sur des données de consultation réelles
Coordination Multi-Agents : Réalisation d'un contrôle dynamique complexe et d'une planification de mémoire par la collaboration entre agents

Configuration Expérimentale

Ensembles de Données

Dataset D4 : Ensemble de données de dialogue orienté vers le diagnostic de la dépression en chinois
Dataset DAIC-WOZ : Ensemble de données de dialogue sur la santé mentale en anglais
Annotation des données effectuée avec GPT-4o, avec révision par 3 experts en psychologie des données de chaîne de plainte

Indicateurs d'Évaluation

Degré d'Anthropomorphisme : Évaluation via BERT-score de la cohérence entre le discours du simulateur et celui des véritables demandeurs d'aide
Fidélité de la Personnalité : Conception de questions d'entrevue, évaluation du degré de correspondance de configuration via notation G-Eval
Précision Cognitive de Session Précédente : Évaluation de l'efficacité de la mémoire à long terme

Méthodes de Comparaison

Trois méthodes de base sélectionnées :

Chen et al. (2023a)
Duro et al. (2024)
Qiu and Lan (2024)

Détails d'Implémentation

Modèle Backbone : Qwen2.5-7B-Instruct
Modèles de Conseiller : PsycoLLM, EmoLLM, SoulChat
Classification Émotionnelle : Basée sur les catégories émotionnelles GoEmotions
Outils d'Échelle : Échelles d'auto-évaluation SCL-90, BDI, SAAS, etc.

Résultats Expérimentaux

Résultats Principaux

Comparaison du Degré d'Anthropomorphisme : Sur les datasets D4 et DAIC, AnnaAgent obtient les meilleures ou deuxièmes meilleures performances en dialogue avec différents modèles de conseillers :

Dataset	Conseiller	Chen et al.	Duro et al.	Qiu & Lan	AnnaAgent
D4	PsycoLLM	0.6293	0.6455	0.6866	0.6691
D4	EmoLLM	0.6529	0.6469	0.6449	0.6649
DAIC	PsycoLLM	0.3458	0.4864	0.3426	0.4910

Fidélité de la Personnalité : AnnaAgent surpasse globalement les méthodes de base dans la notation G-Eval.

Expériences d'Ablation

Ablation de l'Évolution Dynamique : La suppression du composant d'évolution dynamique réduit le score F1 de 0.6691 à 0.6144 (dataset D4)
Ablation de la Mémoire à Long Terme : La suppression de la mémoire à long terme réduit significativement la précision cognitive du demandeur d'aide virtuel concernant les sessions précédentes

Étude de Généralisation

Les expériences sur GPT-4o-mini et Llama-3.1-8B-Instruct démontrent qu'AnnaAgent possède une bonne stabilité inter-modèles, avec des écarts-types relatifs tous inférieurs à 10%.

Travaux Connexes

Applications des LLM en Santé Mentale

Systèmes Conversationnels : ChatCounselor, Serena et autres fournissant un soutien en consultation psychologique
Diagnostic et Traitement : Amélioration de la précision diagnostique, de l'efficacité du traitement et de l'accessibilité des services

Simulation Traditionnelle des Demandeurs d'Aide

Patients Standardisés : Interprétation par des acteurs, coûteux mais plus réaliste
Demandeurs d'Aide Virtuels : Peu coûteux mais fidélité insuffisante

Jeu de Rôle avec LLM

Construction de Connaissances de Rôle : Via des informations de rôle granulaires et des annotations émotionnelles
Entraînement Personnalisé : Affinage d'instructions conditionnelles combinant les informations de traits de personnalité

Conclusion et Discussion

Conclusions Principales

AnnaAgent résout avec succès les défis de l'évolution dynamique et de la mémoire multi-session dans la simulation des demandeurs d'aide
Les modèles d'évolution émotionnelle et de plainte entraînés sur des données réelles améliorent efficacement la fidélité de la simulation
Le mécanisme de mémoire à trois niveaux démontre une excellente performance dans le traitement des informations inter-sessions

Limitations

Simplification Formelle : Certaine simplification formelle du processus d'évolution dynamique pour la commodité de l'implémentation technique
Système de Mémoire Rudimentaire : Le mécanisme de coordination du système de mémoire à trois niveaux reste relativement primitif
Dépendance aux Données : Dépendance élevée de la qualité et de la quantité des données de consultation réelles

Directions Futures

Modélisation d'évolution dynamique plus granulaire
Mécanismes de coordination de mémoire multi-session plus complexes
Extension à davantage de scénarios de santé mentale et de langues

Évaluation Approfondie

Points Forts

Identification Précise du Problème : Première identification explicite des deux défis fondamentaux que sont l'évolution dynamique et la mémoire multi-session
Conception Méthodologique Rationnelle : Architecture multi-agents claire avec des fonctions de modules bien définies
Expérimentation Complète : Incluant résultats principaux, expériences d'ablation et validation de généralisation
Valeur Pratique Élevée : Fournit un outil important pour la recherche en IA en santé mentale

Insuffisances

Profondeur Théorique Limitée : Manque d'analyse théorique approfondie en psychologie des mécanismes d'évolution dynamique
Indicateurs d'Évaluation Uniques : Dépendance principale aux indicateurs automatisés, manque d'évaluation humaine par des psychologues professionnels
Considérations Éthiques Insuffisantes : Bien que l'examen éthique soit mentionné, la discussion sur les risques d'abus potentiels manque de profondeur

Impact

Contribution Académique : Fournit de nouvelles directions de recherche et des points de référence pour le domaine de l'IA en santé mentale
Valeur Pratique : Applicable à la formation et l'évaluation des conseillers, à la recherche en psychologie et à d'autres scénarios
Reproductibilité : Code source fourni, facilitant la reproduction et l'extension de la recherche

Scénarios Applicables

Formation et évaluation des conseillers psychologiques
Développement de systèmes de dialogue en santé mentale
Recherche et expérimentation en psychologie
Augmentation de données en santé mentale

Références

L'article cite des travaux connexes abondants, incluant :

Travaux de synthèse sur les applications de l'IA en santé mentale
Recherche sur le jeu de rôle avec LLM et les systèmes multi-agents
Recherche sur la consultation psychologique et les patients standardisés
Littérature sur la théorie de la mémoire et la technologie RAG

Évaluation Générale : Cet article constitue une contribution importante dans le domaine de l'IA en santé mentale, résolvant systématiquement pour la première fois les défis techniques clés de la simulation des demandeurs d'aide. Bien qu'il y ait place à l'amélioration en termes de profondeur théorique et d'évaluation, sa méthode innovante et sa valeur pratique en font un progrès important dans ce domaine.