Constrained by the cost and ethical concerns of involving real seekers in AI-driven mental health, researchers develop LLM-based conversational agents (CAs) with tailored configurations, such as profiles, symptoms, and scenarios, to simulate seekers. While these efforts advance AI in mental health, achieving more realistic seeker simulation remains hindered by two key challenges: dynamic evolution and multi-session memory. Seekers' mental states often fluctuate during counseling, which typically spans multiple sessions. To address this, we propose AnnaAgent, an emotional and cognitive dynamic agent system equipped with tertiary memory. AnnaAgent incorporates an emotion modulator and a complaint elicitor trained on real counseling dialogues, enabling dynamic control of the simulator's configurations. Additionally, its tertiary memory mechanism effectively integrates short-term and long-term memory across sessions. Evaluation results, both automated and manual, demonstrate that AnnaAgent achieves more realistic seeker simulation in psychological counseling compared to existing baselines. The ethically reviewed and screened code can be found on https://github.com/sci-m-wang/AnnaAgent.
- 論文ID: 2506.00551
- タイトル: AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation
- 著者: Ming Wang, Peidong Wang, Lin Wu, Xiaocui Yang, Daling Wang, Shi Feng, Yuxin Chen, Bixuan Wang, Yifei Zhang
- 分類: cs.CL cs.AI
- 発表日: 2025年6月10日(arXiv プレプリント)
- 論文リンク: https://arxiv.org/abs/2506.00551
AI駆動型の心理健康研究において実際の相談者を対象とすることは、コストと倫理的な問題を引き起こすため、研究者はLLMベースの対話エージェント(CA)を開発し、個人プロフィール、症状、シナリオなどのカスタマイズされた設定を使用して相談者をシミュレートしている。これらの取り組みはAIの心理健康分野への応用を進めているが、より現実的な相談者シミュレーションの実現には、動的進化と多セッション記憶という2つの重要な課題が残されている。相談者の心理状態は、通常複数のセッションにわたるカウンセリングプロセス中に頻繁に変動する。この問題に対処するため、本論文ではAnnaAgentを提案する。これは3段階の記憶を備えた感情および認知動的エージェントシステムである。AnnaAgentは実際のカウンセリング対話で訓練された感情調整器と主訴ガイダンスを統合し、シミュレータの設定を動的に制御できる。さらに、その3段階の記憶メカニズムは、セッション間の短期および長期記憶を効果的に統合する。評価結果は、AnnaAgentが既存のベースラインよりも現実的な相談者シミュレーションを実現することを示している。
本研究が解決する中核的な問題は、AI駆動型の心理健康研究において、相談者の行動をより現実的にシミュレートする方法である。具体的には:
- コストと倫理的制限:多数の実際の相談者を対象とした研究は、コストが高いだけでなく、倫理的な問題をもたらす可能性がある
- 既存シミュレーション方法の不十分さ:現在のLLMベースの対話エージェントは、相談者をシミュレートする際に、感情が平坦で提案を容易に受け入れるなどの問題を抱えている
- 動的性の欠如:既存の方法は、カウンセリングプロセス中の相談者の感情変動と認知変化をシミュレートできない
- 多セッション記憶の欠落:心理カウンセリングは通常、長期的で複数セッションのプロセスであるが、既存の方法はセッション間の記憶メカニズムに欠ける
心理健康の問題は現代社会が直面する重要な課題であり、訓練を受けたセラピストの数は限定されている。AI技術は心理健康支援において大きな可能性を持つが、より現実的な相談者シミュレーションが必要である:
- データ構築と効果評価の実施
- 心理カウンセラーの訓練
- 心理学研究と実験の実施
文献調査を通じて、著者は既存の相談者シミュレーション方法に以下の問題があることを発見した:
- 静的設定:感情と症状認知がカウンセリングプロセス全体を通じて変わらない
- 記憶メカニズムの欠如:前回のセッション内容に関する対話を処理できない
- 行動の非現実性:提案に容易に同意し、過度に従順で、感情表現が平坦
- 初めて提案した動的進化と多セッション記憶という2つの重要な課題、および動的進化を感情と主訴の変化として形式化し、多セッション記憶を異なるステージに分類した
- AnnaAgentシステムを設計:3段階の記憶を備えた感情および認知動的エージェントシステムで、対話中の感情と症状認知の変化を制御することにより、カウンセリング中の動的進化をシミュレートする
- システムの有効性を検証:実験評価を通じて、AnnaAgentが心理カウンセリング中の相談者行動をより現実的にシミュレートできることを証明した
相談者シミュレーションタスクでは、LLMに役割設定を割り当てる必要があり、以下を含む:
- Profile(プロフィール):基本的な個人情報(年齢、性別、職業など)
- Complaint(主訴):症状に対する相談者の認知と主な問題
- Situation(状況):生活環境と経験した出来事
- Status(状態):身体的および心理的関連状態
- Emotion(感情):期待される感情反応スタイル
AnnaAgentは複数エージェントシステムアーキテクチャを採用し、2つの主要なエージェントグループを含む:
感情調整:
- 感情推論器:Qwen2.5-7B-Instructで訓練され、D4データセットを使用して実際のカウンセリング中の感情進化パターンを学習
- 感情摂動器:固定化された感情変化パターンを回避するためにランダムな摂動を導入し、感情距離に基づいて確率重みを割り当てる:
P(emoT)=∑Gjw(d(GB,Gj))×∣Gj∣w(d(GT,GB)×∣GT∣)
ここでGBとGTはそれぞれ基本感情グループと目標感情グループを表し、d(⋅)は感情グループ間の距離を表す。
主訴ガイダンス:
- 主訴チェーン生成:相談者の設定と最近の出来事に基づいて主訴変化チェーンを生成
- 主訴切り替え制御:アルゴリズムを通じてチェーン内の次のステージの主訴に切り替えるかどうかを判定
- リアルタイム記憶:現在のセッションの対話内容
- 短期記憶:最近の出来事と状態変化で、自己報告尺度を通じて捕捉
- 長期記憶:前回のセッションの対話と尺度記録で、Agentic RAGを通じてスケジューリング
- 動的進化モデリング:相談者の動的変化を感情と主訴の2つの次元の進化として初めて形式化
- 3段階記憶メカニズム:記憶理論を参考にして設計された時間階層化記憶システム
- データ駆動型進化学習:実際のカウンセリングデータに基づいて訓練された感情と主訴変化モデル
- マルチエージェント協調:エージェント間の協力を通じた複雑な動的制御と記憶スケジューリング
- D4データセット:中国語うつ病診断指向対話データセット
- DAIC-WOZデータセット:英語心理健康対話データセット
- GPT-4oを使用したデータ注釈、3名の心理学専門家による主訴チェーンデータの審査
- 人間らしさ(Anthropomorphism):BERT-scoreを使用してシミュレータの発話と実際の相談者の一致性を評価
- 人格忠実度(Personality Fidelity):インタビュー質問を設計し、G-Eval評点を使用して設定マッチ度を評価
- 前回セッション認知精度:長期記憶の有効性を評価
3つのベースライン方法を選択:
- Chen et al. (2023a)
- Duro et al. (2024)
- Qiu and Lan (2024)
- バックボーンモデル:Qwen2.5-7B-Instruct
- カウンセラーモデル:PsycoLLM、EmoLLM、SoulChat
- 感情分類:GoEmotions感情カテゴリに基づく
- 尺度ツール:SCL-90、BDI、SAASなどの自己報告尺度
人間らしさの比較:
D4およびDAICデータセット上で、AnnaAgentは異なるカウンセラーモデルとの対話時に最良または次点の性能を達成:
| データセット | カウンセラー | Chen et al. | Duro et al. | Qiu & Lan | AnnaAgent |
|---|
| D4 | PsycoLLM | 0.6293 | 0.6455 | 0.6866 | 0.6691 |
| D4 | EmoLLM | 0.6529 | 0.6469 | 0.6449 | 0.6649 |
| DAIC | PsycoLLM | 0.3458 | 0.4864 | 0.3426 | 0.4910 |
人格忠実度:AnnaAgentはG-Eval評点においてベースライン方法を全体的に上回った。
- 動的進化のアブレーション:動的進化コンポーネントを削除すると、F1スコアは0.6691から0.6144に低下(D4データセット)
- 長期記憶のアブレーション:長期記憶を削除すると、仮想相談者の前回セッション認知精度が大幅に低下
GPT-4o-miniおよびLlama-3.1-8B-Instruct上での実験は、AnnaAgentが良好なクロスモデル安定性を持つことを示し、相対標準偏差はすべて10%未満である。
- 対話システム:ChatCounselor、Serenaなどが心理健康カウンセリング支援を提供
- 診断と治療:診断精度、治療効果、サービスアクセス可能性の向上
- 標準化患者:実人による演技で、コストは高いがより現実的
- 仮想相談者:コストは低いが現実性が不足
- 役割知識構築:細粒度の役割情報と感情注釈を通じて
- 個性化訓練:人格特性情報を組み合わせた条件付き命令微調整
- AnnaAgentは相談者シミュレーションの動的進化と多セッション記憶の課題を成功裏に解決した
- 実際のデータに基づいて訓練された感情と主訴進化モデルは、シミュレーション現実性を効果的に向上させることができる
- 3段階記憶メカニズムはセッション間情報の処理において優れた性能を示す
- 形式化の簡略化:技術実装の便宜のため、動的進化プロセスに一定程度の形式化簡略化を行った
- 記憶システムの粗さ:3段階記憶システムの協調メカニズムはまだ初期段階である
- データ依存性:実際のカウンセリングデータの質と量に高度に依存
- より細粒度の動的進化モデリング
- より複雑な多セッション記憶協調メカニズム
- より多くの心理健康シナリオと言語への拡張
- 問題認識の正確性:動的進化と多セッション記憶という2つの中核的課題を初めて明確に提案
- 方法設計の合理性:マルチエージェントシステムアーキテクチャが明確で、各モジュール機能が明確
- 実験の充実:主要結果、アブレーション実験、汎化性検証を含む
- 実用価値の高さ:心理健康AI研究に重要なツールを提供
- 理論的深さの限定:動的進化メカニズムの深層的な心理学理論分析が不足
- 評価指標の単一性:主に自動化指標に依存し、専門心理学者による人工評価が不足
- 倫理的考慮の不十分さ:倫理審査に言及しているが、潜在的な悪用リスクの議論が不十分
- 学術的貢献:AI心理健康分野に新しい研究方向とベンチマークを提供
- 実用価値:カウンセラー訓練、心理学研究など複数のシナリオで使用可能
- 再現性:オープンソースコードを提供し、研究の再現と拡張を容易にする
- 心理カウンセラーの訓練と評価
- 心理健康対話システムの開発
- 心理学研究と実験
- 心理健康データの増強
論文は豊富な関連研究を引用しており、以下を含む:
- 心理健康AI応用のサーベイ論文
- LLM役割扮演とマルチエージェントシステム研究
- 心理カウンセリングと標準化患者関連研究
- 記憶理論とRAG技術文献
総合評価:これはAI心理健康分野における重要な貢献を持つ論文であり、相談者シミュレーションの重要な技術的課題を初めて体系的に解決している。理論的深さと評価方法に改善の余地はあるが、その革新的な方法と実用価値により、この分野における重要な進展となっている。