2025-11-12T04:28:10.201322

AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation

Wang, Wang, Wu et al.
Constrained by the cost and ethical concerns of involving real seekers in AI-driven mental health, researchers develop LLM-based conversational agents (CAs) with tailored configurations, such as profiles, symptoms, and scenarios, to simulate seekers. While these efforts advance AI in mental health, achieving more realistic seeker simulation remains hindered by two key challenges: dynamic evolution and multi-session memory. Seekers' mental states often fluctuate during counseling, which typically spans multiple sessions. To address this, we propose AnnaAgent, an emotional and cognitive dynamic agent system equipped with tertiary memory. AnnaAgent incorporates an emotion modulator and a complaint elicitor trained on real counseling dialogues, enabling dynamic control of the simulator's configurations. Additionally, its tertiary memory mechanism effectively integrates short-term and long-term memory across sessions. Evaluation results, both automated and manual, demonstrate that AnnaAgent achieves more realistic seeker simulation in psychological counseling compared to existing baselines. The ethically reviewed and screened code can be found on https://github.com/sci-m-wang/AnnaAgent.
academic

AnnaAgent: Système d'Agent Évolutif Dynamique avec Mémoire Multi-Session pour la Simulation Réaliste de Demandeurs d'Aide

Informations Fondamentales

  • ID de l'article: 2506.00551
  • Titre: AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation
  • Auteurs: Ming Wang, Peidong Wang, Lin Wu, Xiaocui Yang, Daling Wang, Shi Feng, Yuxin Chen, Bixuan Wang, Yifei Zhang
  • Classification: cs.CL cs.AI
  • Date de publication: 10 juin 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2506.00551

Résumé

En raison des coûts et des enjeux éthiques liés à l'implication de véritables demandeurs d'aide dans la recherche en santé mentale assistée par l'IA, les chercheurs ont développé des agents conversationnels basés sur les LLM pour simuler les demandeurs d'aide, en utilisant des configurations personnalisées telles que les profils personnels, les symptômes et les scénarios. Bien que ces efforts fassent progresser l'application de l'IA dans le domaine de la santé mentale, la réalisation d'une simulation plus réaliste des demandeurs d'aide se heurte à deux défis clés : l'évolution dynamique et la mémoire multi-session. L'état psychologique des demandeurs d'aide fluctue souvent au cours du processus de consultation, qui s'étend généralement sur plusieurs sessions. Pour résoudre ce problème, cet article propose AnnaAgent, un système d'agent dynamique émotionnel et cognitif équipé d'une mémoire à trois niveaux. AnnaAgent intègre un régulateur émotionnel et un guide de plainte principale entraînés sur des dialogues de consultation réels, permettant un contrôle dynamique de la configuration du simulateur. De plus, son mécanisme de mémoire à trois niveaux intègre efficacement les mémoires à court et long terme entre les sessions. Les résultats d'évaluation montrent qu'AnnaAgent réalise une simulation de demandeur d'aide plus réaliste que les méthodes de base existantes dans les consultations psychologiques.

Contexte de Recherche et Motivation

Définition du Problème

Le problème fondamental que cette recherche vise à résoudre est comment simuler plus fidèlement le comportement des demandeurs d'aide dans la recherche en santé mentale assistée par l'IA. Plus précisément :

  1. Limitations de coûts et d'éthique : Impliquer un grand nombre de véritables demandeurs d'aide dans la recherche est non seulement coûteux, mais soulève également des préoccupations éthiques
  2. Insuffisances des méthodes de simulation existantes : Les agents conversationnels actuels basés sur les LLM présentent des problèmes tels que l'affectivité plate et l'acceptation facile des conseils lors de la simulation des demandeurs d'aide
  3. Manque de dynamique : Les méthodes existantes ne peuvent pas simuler les fluctuations émotionnelles et les changements cognitifs des demandeurs d'aide au cours du processus de consultation
  4. Absence de mémoire multi-session : La consultation psychologique est généralement un processus à long terme et multi-session, mais les méthodes existantes manquent de mécanismes de mémoire entre les sessions

Importance de la Recherche

Les problèmes de santé mentale constituent un défi majeur auquel la société contemporaine est confrontée, tandis que le nombre de thérapeutes formés est limité. La technologie de l'IA présente un énorme potentiel pour le soutien en santé mentale, mais nécessite une simulation plus réaliste des demandeurs d'aide pour :

  • Construire des données et évaluer l'efficacité
  • Former les conseillers psychologiques
  • Mener des recherches et des expériences en psychologie

Limitations des Approches Existantes

Par le biais d'une revue de la littérature, les auteurs ont identifié les problèmes suivants dans les méthodes existantes de simulation des demandeurs d'aide :

  1. Configuration statique : Les émotions et la cognition des symptômes restent inchangées tout au long du processus de consultation
  2. Absence de mécanisme de mémoire : Incapacité à traiter les dialogues impliquant le contenu des sessions précédentes
  3. Comportement non réaliste : Tendance à accepter les conseils, trop soumis, expression émotionnelle plate

Contributions Principales

  1. Première identification des deux défis clés que sont l'évolution dynamique et la mémoire multi-session, formalisant l'évolution dynamique comme des changements d'émotions et de plaintes principales, et divisant la mémoire multi-session en différentes phases
  2. Conception du système AnnaAgent : Un système d'agent dynamique émotionnel et cognitif doté d'une mémoire à trois niveaux, simulant l'évolution dynamique en consultation en contrôlant les changements d'émotions et de cognition des symptômes dans le dialogue
  3. Validation de l'efficacité du système : Démonstration par évaluation expérimentale qu'AnnaAgent peut simuler plus fidèlement le comportement des demandeurs d'aide dans les consultations psychologiques

Explication Détaillée de la Méthode

Définition de la Tâche

La tâche de simulation des demandeurs d'aide nécessite d'assigner une configuration de rôle au LLM, incluant :

  • Profil : Informations personnelles de base (âge, sexe, profession, etc.)
  • Plainte : Cognition du demandeur d'aide concernant ses symptômes et problèmes principaux
  • Situation : Environnement de vie et événements vécus
  • Statut : États physiques et psychologiques pertinents
  • Émotion : Style de réponse émotionnelle attendu

Architecture du Modèle

AnnaAgent adopte une architecture multi-agents, comprenant deux groupes d'agents principaux :

1. Groupe de Contrôle d'Évolution Dynamique

Régulation Émotionnelle :

  • Raisonneur Émotionnel : Entraîné sur Qwen2.5-7B-Instruct, apprenant les modèles d'évolution émotionnelle dans les consultations réelles à partir du dataset D4
  • Perturbateur Émotionnel : Introduit une perturbation aléatoire pour éviter des modèles d'évolution émotionnelle figés, attribuant des poids de probabilité selon la distance émotionnelle :

P(emoT)=w(d(GT,GB)×GT)Gjw(d(GB,Gj))×GjP(emo_T) = \frac{w(d(G_T, G_B) \times |G_T|)}{\sum_{G_j} w(d(G_B, G_j)) \times |G_j|}

GBG_B et GTG_T représentent respectivement les groupes émotionnels de base et cibles, et d()d(\cdot) représente la distance entre les groupes émotionnels.

Guidage de la Plainte Principale :

  • Génération de Chaîne de Plainte : Génère une chaîne d'évolution de plainte basée sur la configuration du demandeur d'aide et les événements récents
  • Contrôle de Commutation de Plainte : Détermine algorithmiquement s'il faut passer à l'étape suivante de la plainte dans la chaîne

2. Groupe de Planification de Mémoire à Trois Niveaux

  • Mémoire en Temps Réel : Contenu du dialogue de la session actuelle
  • Mémoire à Court Terme : Événements récents et changements d'état, capturés via des échelles d'auto-évaluation
  • Mémoire à Long Terme : Dialogues et enregistrements d'échelles des sessions précédentes, planifiés via RAG Agentic

Points d'Innovation Technique

  1. Modélisation de l'Évolution Dynamique : Première formalisation des changements dynamiques des demandeurs d'aide comme évolution selon deux dimensions : émotions et plaintes principales
  2. Mécanisme de Mémoire à Trois Niveaux : Système de mémoire hiérarchisé temporellement conçu selon la théorie de la mémoire
  3. Apprentissage d'Évolution Guidé par les Données : Entraînement de modèles de changement émotionnel et de plainte basé sur des données de consultation réelles
  4. Coordination Multi-Agents : Réalisation d'un contrôle dynamique complexe et d'une planification de mémoire par la collaboration entre agents

Configuration Expérimentale

Ensembles de Données

  • Dataset D4 : Ensemble de données de dialogue orienté vers le diagnostic de la dépression en chinois
  • Dataset DAIC-WOZ : Ensemble de données de dialogue sur la santé mentale en anglais
  • Annotation des données effectuée avec GPT-4o, avec révision par 3 experts en psychologie des données de chaîne de plainte

Indicateurs d'Évaluation

  1. Degré d'Anthropomorphisme : Évaluation via BERT-score de la cohérence entre le discours du simulateur et celui des véritables demandeurs d'aide
  2. Fidélité de la Personnalité : Conception de questions d'entrevue, évaluation du degré de correspondance de configuration via notation G-Eval
  3. Précision Cognitive de Session Précédente : Évaluation de l'efficacité de la mémoire à long terme

Méthodes de Comparaison

Trois méthodes de base sélectionnées :

  • Chen et al. (2023a)
  • Duro et al. (2024)
  • Qiu and Lan (2024)

Détails d'Implémentation

  • Modèle Backbone : Qwen2.5-7B-Instruct
  • Modèles de Conseiller : PsycoLLM, EmoLLM, SoulChat
  • Classification Émotionnelle : Basée sur les catégories émotionnelles GoEmotions
  • Outils d'Échelle : Échelles d'auto-évaluation SCL-90, BDI, SAAS, etc.

Résultats Expérimentaux

Résultats Principaux

Comparaison du Degré d'Anthropomorphisme : Sur les datasets D4 et DAIC, AnnaAgent obtient les meilleures ou deuxièmes meilleures performances en dialogue avec différents modèles de conseillers :

DatasetConseillerChen et al.Duro et al.Qiu & LanAnnaAgent
D4PsycoLLM0.62930.64550.68660.6691
D4EmoLLM0.65290.64690.64490.6649
DAICPsycoLLM0.34580.48640.34260.4910

Fidélité de la Personnalité : AnnaAgent surpasse globalement les méthodes de base dans la notation G-Eval.

Expériences d'Ablation

  1. Ablation de l'Évolution Dynamique : La suppression du composant d'évolution dynamique réduit le score F1 de 0.6691 à 0.6144 (dataset D4)
  2. Ablation de la Mémoire à Long Terme : La suppression de la mémoire à long terme réduit significativement la précision cognitive du demandeur d'aide virtuel concernant les sessions précédentes

Étude de Généralisation

Les expériences sur GPT-4o-mini et Llama-3.1-8B-Instruct démontrent qu'AnnaAgent possède une bonne stabilité inter-modèles, avec des écarts-types relatifs tous inférieurs à 10%.

Travaux Connexes

Applications des LLM en Santé Mentale

  • Systèmes Conversationnels : ChatCounselor, Serena et autres fournissant un soutien en consultation psychologique
  • Diagnostic et Traitement : Amélioration de la précision diagnostique, de l'efficacité du traitement et de l'accessibilité des services

Simulation Traditionnelle des Demandeurs d'Aide

  • Patients Standardisés : Interprétation par des acteurs, coûteux mais plus réaliste
  • Demandeurs d'Aide Virtuels : Peu coûteux mais fidélité insuffisante

Jeu de Rôle avec LLM

  • Construction de Connaissances de Rôle : Via des informations de rôle granulaires et des annotations émotionnelles
  • Entraînement Personnalisé : Affinage d'instructions conditionnelles combinant les informations de traits de personnalité

Conclusion et Discussion

Conclusions Principales

  1. AnnaAgent résout avec succès les défis de l'évolution dynamique et de la mémoire multi-session dans la simulation des demandeurs d'aide
  2. Les modèles d'évolution émotionnelle et de plainte entraînés sur des données réelles améliorent efficacement la fidélité de la simulation
  3. Le mécanisme de mémoire à trois niveaux démontre une excellente performance dans le traitement des informations inter-sessions

Limitations

  1. Simplification Formelle : Certaine simplification formelle du processus d'évolution dynamique pour la commodité de l'implémentation technique
  2. Système de Mémoire Rudimentaire : Le mécanisme de coordination du système de mémoire à trois niveaux reste relativement primitif
  3. Dépendance aux Données : Dépendance élevée de la qualité et de la quantité des données de consultation réelles

Directions Futures

  1. Modélisation d'évolution dynamique plus granulaire
  2. Mécanismes de coordination de mémoire multi-session plus complexes
  3. Extension à davantage de scénarios de santé mentale et de langues

Évaluation Approfondie

Points Forts

  1. Identification Précise du Problème : Première identification explicite des deux défis fondamentaux que sont l'évolution dynamique et la mémoire multi-session
  2. Conception Méthodologique Rationnelle : Architecture multi-agents claire avec des fonctions de modules bien définies
  3. Expérimentation Complète : Incluant résultats principaux, expériences d'ablation et validation de généralisation
  4. Valeur Pratique Élevée : Fournit un outil important pour la recherche en IA en santé mentale

Insuffisances

  1. Profondeur Théorique Limitée : Manque d'analyse théorique approfondie en psychologie des mécanismes d'évolution dynamique
  2. Indicateurs d'Évaluation Uniques : Dépendance principale aux indicateurs automatisés, manque d'évaluation humaine par des psychologues professionnels
  3. Considérations Éthiques Insuffisantes : Bien que l'examen éthique soit mentionné, la discussion sur les risques d'abus potentiels manque de profondeur

Impact

  1. Contribution Académique : Fournit de nouvelles directions de recherche et des points de référence pour le domaine de l'IA en santé mentale
  2. Valeur Pratique : Applicable à la formation et l'évaluation des conseillers, à la recherche en psychologie et à d'autres scénarios
  3. Reproductibilité : Code source fourni, facilitant la reproduction et l'extension de la recherche

Scénarios Applicables

  • Formation et évaluation des conseillers psychologiques
  • Développement de systèmes de dialogue en santé mentale
  • Recherche et expérimentation en psychologie
  • Augmentation de données en santé mentale

Références

L'article cite des travaux connexes abondants, incluant :

  • Travaux de synthèse sur les applications de l'IA en santé mentale
  • Recherche sur le jeu de rôle avec LLM et les systèmes multi-agents
  • Recherche sur la consultation psychologique et les patients standardisés
  • Littérature sur la théorie de la mémoire et la technologie RAG

Évaluation Générale : Cet article constitue une contribution importante dans le domaine de l'IA en santé mentale, résolvant systématiquement pour la première fois les défis techniques clés de la simulation des demandeurs d'aide. Bien qu'il y ait place à l'amélioration en termes de profondeur théorique et d'évaluation, sa méthode innovante et sa valeur pratique en font un progrès important dans ce domaine.