Constrained by the cost and ethical concerns of involving real seekers in AI-driven mental health, researchers develop LLM-based conversational agents (CAs) with tailored configurations, such as profiles, symptoms, and scenarios, to simulate seekers. While these efforts advance AI in mental health, achieving more realistic seeker simulation remains hindered by two key challenges: dynamic evolution and multi-session memory. Seekers' mental states often fluctuate during counseling, which typically spans multiple sessions. To address this, we propose AnnaAgent, an emotional and cognitive dynamic agent system equipped with tertiary memory. AnnaAgent incorporates an emotion modulator and a complaint elicitor trained on real counseling dialogues, enabling dynamic control of the simulator's configurations. Additionally, its tertiary memory mechanism effectively integrates short-term and long-term memory across sessions. Evaluation results, both automated and manual, demonstrate that AnnaAgent achieves more realistic seeker simulation in psychological counseling compared to existing baselines. The ethically reviewed and screened code can be found on https://github.com/sci-m-wang/AnnaAgent.
- ID статьи: 2506.00551
- Название: AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation
- Авторы: Ming Wang, Peidong Wang, Lin Wu, Xiaocui Yang, Daling Wang, Shi Feng, Yuxin Chen, Bixuan Wang, Yifei Zhang
- Классификация: cs.CL cs.AI
- Дата публикации: 10 июня 2025 г. (препринт arXiv)
- Ссылка на статью: https://arxiv.org/abs/2506.00551
Из-за затрат и этических проблем, связанных с привлечением реальных обратившихся за помощью в исследованиях психического здоровья на основе ИИ, исследователи разработали диалоговых агентов на основе LLM для моделирования обратившихся, используя настраиваемые конфигурации, такие как профиль, симптомы и сценарии. Несмотря на эти достижения в применении ИИ в области психического здоровья, достижение более реалистичного моделирования обратившихся сталкивается с двумя ключевыми вызовами: динамической эволюцией и многосеансовой памятью. Психическое состояние обратившихся часто колеблется в процессе консультирования, обычно охватывающем несколько сеансов. Для решения этой проблемы в статье предлагается AnnaAgent — система динамического эмоционального и когнитивного агента, оснащённая трёхуровневой памятью. AnnaAgent интегрирует регулятор эмоций и направляющий основной жалобы, обученные на реальных консультационных диалогах, что позволяет динамически управлять конфигурацией моделирующего агента. Кроме того, его трёхуровневый механизм памяти эффективно объединяет краткосрочную и долгосрочную память между сеансами. Результаты оценки показывают, что AnnaAgent обеспечивает более реалистичное моделирование обратившихся в психологическом консультировании по сравнению с существующими базовыми методами.
Основная проблема, которую решает данное исследование, заключается в том, как более реалистично моделировать поведение обратившихся за помощью в исследованиях психического здоровья на основе ИИ. В частности:
- Затраты и этические ограничения: привлечение большого количества реальных обратившихся для исследований не только дорогостоящее, но и может вызвать этические проблемы
- Недостатки существующих методов моделирования: текущие диалоговые агенты на основе LLM при моделировании обратившихся демонстрируют эмоциональную плоскость, легко принимают советы и другие проблемы
- Отсутствие динамичности: существующие методы не могут моделировать эмоциональные колебания и когнитивные изменения обратившихся в процессе консультирования
- Отсутствие многосеансовой памяти: психологическое консультирование обычно представляет собой долгосрочный многосеансовый процесс, но существующие методы не имеют механизма памяти между сеансами
Проблемы психического здоровья являются важным вызовом, стоящим перед современным обществом, а количество подготовленных терапевтов ограничено. Технология ИИ имеет огромный потенциал в поддержке психического здоровья, но требует более реалистичного моделирования обратившихся для:
- построения данных и оценки эффективности
- подготовки психологических консультантов
- проведения психологических исследований и экспериментов
На основе анализа литературы авторы выявили следующие проблемы в существующих методах моделирования обратившихся:
- Статические конфигурации: эмоции и когнитивные симптомы остаются неизменными на протяжении всего процесса консультирования
- Отсутствие механизма памяти: невозможность обработки диалогов, содержащих информацию из предыдущих сеансов
- Нереалистичное поведение: легко согласиться с советами, чрезмерная покорность, плоское выражение эмоций
- Первое выявление двух ключевых вызовов — динамической эволюции и многосеансовой памяти, формализация динамической эволюции как изменения эмоций и основной жалобы, разделение многосеансовой памяти на различные уровни
- Разработка системы AnnaAgent: система динамического эмоционального и когнитивного агента с трёхуровневой памятью, которая моделирует динамическую эволюцию в консультировании путём управления изменениями эмоций и когнитивных симптомов в диалоге
- Верификация эффективности системы: экспериментальная оценка доказывает, что AnnaAgent может более реалистично моделировать поведение обратившихся в психологическом консультировании
Задача моделирования обратившихся требует назначения конфигурации роли для LLM, включающей:
- Profile (профиль): основная личная информация (возраст, пол, профессия и т.д.)
- Complaint (жалоба): понимание обратившимся своих симптомов и основные проблемы
- Situation (ситуация): жизненная среда и пережитые события
- Status (статус): физическое и психологическое состояние
- Emotion (эмоция): ожидаемый стиль эмоционального ответа
AnnaAgent использует архитектуру многоагентной системы, включающую две основные группы агентов:
Регулирование эмоций:
- Рассуждающий об эмоциях: обучен на Qwen2.5-7B-Instruct, использует набор данных D4 для изучения моделей эволюции эмоций в реальных консультациях
- Возмущающий эмоции: вводит случайные возмущения для избежания фиксированных моделей изменения эмоций, назначает вероятностные веса на основе эмоционального расстояния:
P(emoT)=∑Gjw(d(GB,Gj))×∣Gj∣w(d(GT,GB)×∣GT∣)
где GB и GT обозначают базовую и целевую эмоциональные группы соответственно, d(⋅) обозначает расстояние между эмоциональными группами.
Направление основной жалобы:
- Генерация цепи жалоб: генерирует цепь изменений жалоб на основе конфигурации обратившегося и недавних событий
- Управление переключением жалоб: алгоритмически определяет, следует ли переключиться на следующий этап жалобы в цепи
- Оперативная память: содержание диалога текущего сеанса
- Краткосрочная память: недавние события и изменения состояния, захватываемые через шкалы самоотчёта
- Долгосрочная память: диалоги и записи шкал из предыдущих сеансов, планируемые через Agentic RAG
- Моделирование динамической эволюции: первая формализация динамических изменений обратившихся как эволюции по двум измерениям — эмоциям и жалобам
- Трёхуровневый механизм памяти: система памяти с временной иерархией, разработанная на основе теории памяти
- Обучение эволюции на основе данных: обучение моделей изменения эмоций и жалоб на основе реальных данных консультаций
- Координация многоагентной системы: реализация сложного динамического управления и планирования памяти через сотрудничество агентов
- Набор данных D4: китайский набор данных диалогов, ориентированных на диагностику депрессии
- Набор данных DAIC-WOZ: английский набор данных диалогов о психическом здоровье
- Использование GPT-4o для аннотирования данных, привлечение 3 экспертов-психологов для проверки данных цепи жалоб
- Степень антропоморфизма (Anthropomorphism): использование BERT-score для оценки согласованности высказываний моделирующего агента с реальными обратившимися
- Верность личности (Personality Fidelity): разработка интервью-вопросов, использование оценки G-Eval для оценки соответствия конфигурации
- Точность когнитивной информации из предыдущего сеанса: оценка эффективности долгосрочной памяти
Выбраны три базовых метода:
- Chen et al. (2023a)
- Duro et al. (2024)
- Qiu and Lan (2024)
- Базовая модель: Qwen2.5-7B-Instruct
- Модель консультанта: PsycoLLM, EmoLLM, SoulChat
- Классификация эмоций: на основе категорий эмоций GoEmotions
- Инструменты шкал: SCL-90, BDI, SAAS и другие шкалы самоотчёта
Сравнение степени антропоморфизма:
На наборах данных D4 и DAIC AnnaAgent достигает лучших или близких к лучшим результатов при диалоге с различными моделями консультантов:
| Набор данных | Консультант | Chen et al. | Duro et al. | Qiu & Lan | AnnaAgent |
|---|
| D4 | PsycoLLM | 0.6293 | 0.6455 | 0.6866 | 0.6691 |
| D4 | EmoLLM | 0.6529 | 0.6469 | 0.6449 | 0.6649 |
| DAIC | PsycoLLM | 0.3458 | 0.4864 | 0.3426 | 0.4910 |
Верность личности: AnnaAgent в целом превосходит базовые методы по оценке G-Eval.
- Абляция динамической эволюции: удаление компонента динамической эволюции приводит к снижению F1-оценки с 0.6691 до 0.6144 (набор данных D4)
- Абляция долгосрочной памяти: удаление долгосрочной памяти значительно снижает точность когнитивной информации виртуального обратившегося о предыдущих сеансах
Эксперименты на GPT-4o-mini и Llama-3.1-8B-Instruct демонстрируют хорошую стабильность AnnaAgent между моделями, с относительным стандартным отклонением менее 10%.
- Диалоговые системы: ChatCounselor, Serena и другие предоставляют поддержку в консультировании по психическому здоровью
- Диагностика и лечение: повышение точности диагностики, эффективности лечения и доступности услуг
- Стандартизированные пациенты: реальные люди, более реалистично, но дорого
- Виртуальные обратившиеся: дешево, но менее реалистично
- Построение ролевых знаний: через мелкозернистую информацию о роли и аннотирование эмоций
- Персонализированное обучение: условная инструкционная настройка с информацией о личностных чертах
- AnnaAgent успешно решает вызовы динамической эволюции и многосеансовой памяти в моделировании обратившихся
- Модели эволюции эмоций и жалоб, обученные на реальных данных, эффективно повышают реалистичность моделирования
- Трёхуровневый механизм памяти демонстрирует отличные результаты при обработке информации между сеансами
- Формализационные упрощения: для удобства технической реализации процесс динамической эволюции подвергся определённому упрощению
- Грубость системы памяти: механизм координации трёхуровневой системы памяти остаётся на начальном уровне
- Зависимость от данных: высокая зависимость от качества и количества реальных данных консультаций
- Более мелкозернистое моделирование динамической эволюции
- Более сложные механизмы координации многосеансовой памяти
- Расширение на более широкий спектр сценариев психического здоровья и языков
- Точное выявление проблемы: первое явное выделение двух ключевых вызовов — динамической эволюции и многосеансовой памяти
- Разумный дизайн метода: архитектура многоагентной системы ясна, функции каждого модуля определены
- Полные эксперименты: включают основные результаты, абляционные эксперименты и проверку обобщаемости
- Высокая практическая ценность: предоставляет важный инструмент для исследований ИИ в области психического здоровья
- Ограниченная теоретическая глубина: отсутствует глубокий анализ механизмов динамической эволюции с позиций психологической теории
- Однообразные показатели оценки: в основном полагаются на автоматизированные показатели, недостаточно человеческой оценки профессиональными психологами
- Недостаточное рассмотрение этических аспектов: хотя упоминается этическая экспертиза, обсуждение потенциальных рисков злоупотребления недостаточно глубоко
- Академический вклад: предоставляет новое направление исследований и эталон для области ИИ в психическом здоровье
- Практическая ценность: может использоваться для подготовки консультантов, психологических исследований и других сценариев
- Воспроизводимость: предоставляет открытый исходный код, облегчающий воспроизведение и расширение исследований
- Подготовка и оценка психологических консультантов
- Разработка диалоговых систем поддержки психического здоровья
- Психологические исследования и эксперименты
- Увеличение данных о психическом здоровье
Статья цитирует богатый объём связанных работ, включая:
- Обзорные работы по применению ИИ в психическом здоровье
- Исследования ролевого воплощения LLM и многоагентных систем
- Исследования психологического консультирования и стандартизированных пациентов
- Литературу по теории памяти и технологии RAG
Общая оценка: Это статья с важным вкладом в область ИИ и психического здоровья, которая впервые систематически решает ключевые технические вызовы в моделировании обратившихся. Хотя есть место для улучшения в теоретической глубине и методах оценки, её инновационный подход и практическая ценность делают её важным прогрессом в данной области.