2025-11-12T04:28:10.201322

AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation

Wang, Wang, Wu et al.

Constrained by the cost and ethical concerns of involving real seekers in AI-driven mental health, researchers develop LLM-based conversational agents (CAs) with tailored configurations, such as profiles, symptoms, and scenarios, to simulate seekers. While these efforts advance AI in mental health, achieving more realistic seeker simulation remains hindered by two key challenges: dynamic evolution and multi-session memory. Seekers' mental states often fluctuate during counseling, which typically spans multiple sessions. To address this, we propose AnnaAgent, an emotional and cognitive dynamic agent system equipped with tertiary memory. AnnaAgent incorporates an emotion modulator and a complaint elicitor trained on real counseling dialogues, enabling dynamic control of the simulator's configurations. Additionally, its tertiary memory mechanism effectively integrates short-term and long-term memory across sessions. Evaluation results, both automated and manual, demonstrate that AnnaAgent achieves more realistic seeker simulation in psychological counseling compared to existing baselines. The ethically reviewed and screened code can be found on https://github.com/sci-m-wang/AnnaAgent.

academic

AnnaAgent: यथार्थवादी साधक सिमुलेशन के लिए बहु-सत्र स्मृति के साथ गतिशील विकास एजेंट प्रणाली

मूल जानकारी

पेपर ID: 2506.00551
शीर्षक: AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation
लेखक: Ming Wang, Peidong Wang, Lin Wu, Xiaocui Yang, Daling Wang, Shi Feng, Yuxin Chen, Bixuan Wang, Yifei Zhang
वर्गीकरण: cs.CL cs.AI
प्रकाशन तिथि: 10 जून 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2506.00551

सारांश

AI-संचालित मानसिक स्वास्थ्य अनुसंधान में वास्तविक साधकों के उपयोग से जुड़ी लागत और नैतिक समस्याओं के कारण, शोधकर्ताओं ने LLM-आधारित संवाद एजेंट (CA) विकसित किए हैं जो साधकों का अनुकरण करते हैं, व्यक्तिगत प्रोफ़ाइल, लक्षण और परिदृश्य जैसे अनुकूलित कॉन्फ़िगरेशन का उपयोग करते हुए। हालांकि ये प्रयास मानसिक स्वास्थ्य क्षेत्र में AI के अनुप्रयोग को आगे बढ़ाते हैं, लेकिन अधिक यथार्थवादी साधक सिमुलेशन प्राप्त करना दो महत्वपूर्ण चुनौतियों का सामना करता है: गतिशील विकास और बहु-सत्र स्मृति। साधक की मानसिक स्थिति परामर्श प्रक्रिया के दौरान अक्सर उतार-चढ़ाव करती है, जो आमतौर पर कई सत्रों तक फैली होती है। इस समस्या को हल करने के लिए, यह पेपर AnnaAgent प्रस्तावित करता है - एक तीन-स्तरीय स्मृति से सुसज्जित भावनात्मक और संज्ञानात्मक गतिशील एजेंट प्रणाली। AnnaAgent वास्तविक परामर्श संवादों पर प्रशिक्षित भावनात्मक नियामक और मुख्य शिकायत मार्गदर्शक को एकीकृत करता है, जो सिमुलेटर के कॉन्फ़िगरेशन को गतिशील रूप से नियंत्रित कर सकता है। इसके अलावा, इसका तीन-स्तरीय स्मृति तंत्र सत्रों के पार अल्पकालिक और दीर्घकालिक स्मृति को प्रभावी ढंग से एकीकृत करता है। मूल्यांकन परिणाम दर्शाते हैं कि AnnaAgent मानसिक परामर्श में मौजूदा आधारभूत विधियों की तुलना में अधिक यथार्थवादी साधक सिमुलेशन प्राप्त करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

इस अनुसंधान द्वारा समाधान की जाने वाली मूल समस्या यह है कि AI-संचालित मानसिक स्वास्थ्य अनुसंधान में साधक के व्यवहार का अधिक यथार्थवादी अनुकरण कैसे किया जाए। विशेष रूप से:

लागत और नैतिक प्रतिबंध: बड़ी संख्या में वास्तविक साधकों के साथ अनुसंधान न केवल महंगा है, बल्कि नैतिक समस्याएं भी ला सकता है
मौजूदा सिमुलेशन विधियों की कमी: वर्तमान LLM-आधारित संवाद एजेंट साधकों का अनुकरण करते समय भावनात्मक सपाटता और सुझाव स्वीकार करने की प्रवृत्ति जैसी समस्याओं का सामना करते हैं
गतिशीलता की कमी: मौजूदा विधियां परामर्श प्रक्रिया के दौरान साधक की भावनात्मक उतार-चढ़ाव और संज्ञानात्मक परिवर्तन का अनुकरण नहीं कर सकती हैं
बहु-सत्र स्मृति की कमी: मानसिक परामर्श आमतौर पर एक दीर्घकालिक, बहु-सत्र प्रक्रिया है, लेकिन मौजूदा विधियों में सत्रों के पार स्मृति तंत्र की कमी है

अनुसंधान का महत्व

मानसिक स्वास्थ्य समस्याएं आज के समाज के सामने एक महत्वपूर्ण चुनौती हैं, जबकि प्रशिक्षित चिकित्सकों की संख्या सीमित है। मानसिक स्वास्थ्य समर्थन में AI तकनीक में विशाल संभावनाएं हैं, लेकिन अधिक यथार्थवादी साधक सिमुलेशन की आवश्यकता है:

डेटा निर्माण और प्रभाव मूल्यांकन के लिए
मानसिक परामर्श प्रदाताओं को प्रशिक्षित करने के लिए
मनोविज्ञान अनुसंधान और प्रयोग संचालित करने के लिए

मौजूदा विधियों की सीमाएं

साहित्य सर्वेक्षण के माध्यम से, लेखकों ने पाया कि मौजूदा साधक सिमुलेशन विधियों में निम्नलिखित समस्याएं हैं:

स्थिर कॉन्फ़िगरेशन: भावनाएं और लक्षण संज्ञान पूरी परामर्श प्रक्रिया के दौरान अपरिवर्तित रहते हैं
स्मृति तंत्र की कमी: पिछले सत्र की सामग्री से संबंधित संवादों को संभालने में असमर्थ
अयथार्थवादी व्यवहार: सुझावों को आसानी से स्वीकार करना, अत्यधिक आज्ञाकारिता, सपाट भावनात्मक अभिव्यक्ति

मूल योगदान

पहली बार प्रस्तावित: गतिशील विकास और बहु-सत्र स्मृति दो महत्वपूर्ण चुनौतियां, और गतिशील विकास को भावनाओं और मुख्य शिकायतों के परिवर्तन के रूप में औपचारिक रूप दिया, बहु-सत्र स्मृति को विभिन्न चरणों में विभाजित किया
AnnaAgent प्रणाली डिजाइन की: एक तीन-स्तरीय स्मृति वाली भावनात्मक और संज्ञानात्मक गतिशील एजेंट प्रणाली, जो संवाद में भावनाओं और लक्षण संज्ञान के परिवर्तन को नियंत्रित करके परामर्श में गतिशील विकास का अनुकरण करती है
प्रणाली की प्रभावशीलता को सत्यापित किया: प्रायोगिक मूल्यांकन के माध्यम से साबित किया कि AnnaAgent मानसिक परामर्श में साधक के व्यवहार का अधिक यथार्थवादी अनुकरण कर सकता है

विधि विवरण

कार्य परिभाषा

साधक सिमुलेशन कार्य को LLM को भूमिका कॉन्फ़िगरेशन प्रदान करने की आवश्यकता है, जिसमें शामिल हैं:

Profile: मूल व्यक्तिगत जानकारी (आयु, लिंग, व्यवसाय, आदि)
Complaint: साधक के लक्षणों के बारे में संज्ञान और मुख्य समस्याएं
Situation: जीवन का वातावरण और अनुभव की गई घटनाएं
Status: शारीरिक और मानसिक संबंधित स्थिति
Emotion: अपेक्षित भावनात्मक प्रतिक्रिया शैली

मॉडल आर्किटेक्चर

AnnaAgent एक बहु-एजेंट प्रणाली आर्किटेक्चर अपनाता है, जिसमें दो मुख्य एजेंट समूह शामिल हैं:

1. गतिशील विकास नियंत्रण समूह

भावनात्मक नियमन:

भावनात्मक तर्क: Qwen2.5-7B-Instruct पर आधारित, D4 डेटासेट का उपयोग करके वास्तविक परामर्श में भावनात्मक विकास पैटर्न सीखने के लिए प्रशिक्षित
भावनात्मक विक्षोभ: निश्चित भावनात्मक परिवर्तन पैटर्न से बचने के लिए यादृच्छिक विक्षोभ पेश करता है, भावनात्मक दूरी के आधार पर संभावना भार आवंटित करता है:

$P(emo_T) = \frac{w(d(G_T, G_B) \times |G_T|)}{\sum_{G_j} w(d(G_B, G_j)) \times |G_j|}$

जहां $G_B$ और $G_T$ क्रमशः आधार और लक्ष्य भावनात्मक समूह का प्रतिनिधित्व करते हैं, $d(\cdot)$ भावनात्मक समूहों के बीच दूरी को दर्शाता है।

मुख्य शिकायत मार्गदर्शन:

मुख्य शिकायत श्रृंखला निर्माण: साधक के कॉन्फ़िगरेशन और हाल की घटनाओं के आधार पर मुख्य शिकायत परिवर्तन श्रृंखला उत्पन्न करता है
मुख्य शिकायत स्विच नियंत्रण: एल्गोरिदम के माध्यम से यह निर्धारित करता है कि श्रृंखला में अगले चरण की मुख्य शिकायत पर स्विच करना है या नहीं

2. तीन-स्तरीय स्मृति शेड्यूलिंग समूह

वास्तविक समय स्मृति: वर्तमान सत्र की संवाद सामग्री
अल्पकालिक स्मृति: हाल की घटनाएं और स्थिति परिवर्तन, स्व-रिपोर्ट पैमानों के माध्यम से कैप्चर किए गए
दीर्घकालिक स्मृति: पिछले सत्र के संवाद और पैमाने रिकॉर्ड, Agentic RAG के माध्यम से शेड्यूल किए गए

तकनीकी नवाचार बिंदु

गतिशील विकास मॉडलिंग: पहली बार साधक के गतिशील परिवर्तन को भावनाओं और मुख्य शिकायतों के दो आयामों के विकास के रूप में औपचारिक रूप दिया
तीन-स्तरीय स्मृति तंत्र: स्मृति सिद्धांत के संदर्भ में डिजाइन की गई समय-स्तरीय स्मृति प्रणाली
डेटा-संचालित विकास सीखना: वास्तविक परामर्श डेटा के आधार पर प्रशिक्षित भावनात्मक और मुख्य शिकायत परिवर्तन मॉडल
बहु-एजेंट समन्वय: एजेंटों के बीच सहयोग के माध्यम से जटिल गतिशील नियंत्रण और स्मृति शेड्यूलिंग प्राप्त करता है

प्रायोगिक सेटअप

डेटासेट

D4 डेटासेट: चीनी अवसाद निदान-निर्देशित संवाद डेटासेट
DAIC-WOZ डेटासेट: अंग्रेजी मानसिक स्वास्थ्य संवाद डेटासेट
डेटा एनोटेशन के लिए GPT-4o का उपयोग, मुख्य शिकायत श्रृंखला डेटा की समीक्षा के लिए 3 मानसिक स्वास्थ्य विशेषज्ञों को आमंत्रित किया

मूल्यांकन मेट्रिक्स

मानवीकरण की डिग्री (Anthropomorphism): BERT-score का उपयोग करके सिमुलेटर के कथन और वास्तविक साधक की सामंजस्य का मूल्यांकन
व्यक्तित्व निष्ठा (Personality Fidelity): साक्षात्कार प्रश्न डिजाइन किए, G-Eval स्कोरिंग का उपयोग करके कॉन्फ़िगरेशन मिलान की डिग्री का मूल्यांकन
पिछले सत्र की संज्ञान सटीकता: दीर्घकालिक स्मृति की प्रभावशीलता का मूल्यांकन

तुलनात्मक विधियां

तीन आधारभूत विधियां चुनी गईं:

Chen et al. (2023a)
Duro et al. (2024)
Qiu and Lan (2024)

कार्यान्वयन विवरण

मुख्य मॉडल: Qwen2.5-7B-Instruct
परामर्शदाता मॉडल: PsycoLLM, EmoLLM, SoulChat
भावनात्मक वर्गीकरण: GoEmotions भावनात्मक श्रेणियों पर आधारित
पैमाने उपकरण: SCL-90, BDI, SAAS आदि स्व-रिपोर्ट पैमाने

प्रायोगिक परिणाम

मुख्य परिणाम

मानवीकरण की डिग्री तुलना: D4 और DAIC डेटासेट पर, AnnaAgent विभिन्न परामर्शदाता मॉडल के साथ संवाद करते समय सर्वोत्तम या दूसरे सर्वोत्तम प्रदर्शन प्राप्त करता है:

डेटासेट	परामर्शदाता	Chen et al.	Duro et al.	Qiu & Lan	AnnaAgent
D4	PsycoLLM	0.6293	0.6455	0.6866	0.6691
D4	EmoLLM	0.6529	0.6469	0.6449	0.6649
DAIC	PsycoLLM	0.3458	0.4864	0.3426	0.4910

व्यक्तित्व निष्ठा: AnnaAgent G-Eval स्कोरिंग में समग्र रूप से आधारभूत विधियों से बेहतर प्रदर्शन करता है।

विलोपन प्रयोग

गतिशील विकास विलोपन: गतिशील विकास घटक को हटाने के बाद, F1 स्कोर 0.6691 से 0.6144 तक गिरा (D4 डेटासेट)
दीर्घकालिक स्मृति विलोपन: दीर्घकालिक स्मृति को हटाने से आभासी साधक की पिछले सत्र की संज्ञान सटीकता में उल्लेखनीय कमी आई

सामान्यीकरण अनुसंधान

GPT-4o-mini और Llama-3.1-8B-Instruct पर प्रयोग दर्शाते हैं कि AnnaAgent में अच्छी क्रॉस-मॉडल स्थिरता है, सापेक्ष मानक विचलन 10% से कम है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

AnnaAgent ने साधक सिमुलेशन में गतिशील विकास और बहु-सत्र स्मृति की चुनौतियों को सफलतापूर्वक हल किया
वास्तविक डेटा पर प्रशिक्षित भावनात्मक और मुख्य शिकायत विकास मॉडल सिमुलेशन यथार्थवाद को प्रभावी ढंग से बढ़ा सकते हैं
तीन-स्तरीय स्मृति तंत्र सत्रों के पार जानकारी को संभालने में उत्कृष्ट प्रदर्शन करता है

सीमाएं

औपचारिकीकरण सरलीकरण: तकनीकी कार्यान्वयन की सुविधा के लिए, गतिशील विकास प्रक्रिया को एक निश्चित स्तर तक सरल बनाया गया है
स्मृति प्रणाली कच्ची: तीन-स्तरीय स्मृति प्रणाली का समन्वय तंत्र अभी भी प्रारंभिक है
डेटा निर्भरता: वास्तविक परामर्श डेटा की गुणवत्ता और मात्रा पर अत्यधिक निर्भर

भविष्य की दिशाएं

अधिक सूक्ष्म-अनाज गतिशील विकास मॉडलिंग
अधिक जटिल बहु-सत्र स्मृति समन्वय तंत्र
अधिक मानसिक स्वास्थ्य परिदृश्यों और भाषाओं तक विस्तार

गहन मूल्यांकन

शक्तियां

समस्या पहचान सटीक: पहली बार गतिशील विकास और बहु-सत्र स्मृति दो मूल चुनौतियों को स्पष्ट रूप से प्रस्तावित किया
विधि डिजाइन उचित: बहु-एजेंट प्रणाली आर्किटेक्चर स्पष्ट, प्रत्येक मॉड्यूल का कार्य निश्चित
प्रयोग व्यापक: मुख्य परिणाम, विलोपन प्रयोग और सामान्यीकरण सत्यापन शामिल
व्यावहारिक मूल्य उच्च: मानसिक स्वास्थ्य AI अनुसंधान के लिए महत्वपूर्ण उपकरण प्रदान करता है

कमियां

सैद्धांतिक गहराई सीमित: गतिशील विकास तंत्र के गहन मनोविज्ञान सिद्धांत विश्लेषण की कमी
मूल्यांकन मेट्रिक्स एकल: मुख्य रूप से स्वचालित मेट्रिक्स पर निर्भर, व्यावसायिक मनोवैज्ञानिकों के मानव मूल्यांकन की कमी
नैतिक विचार अपर्याप्त: हालांकि नैतिक समीक्षा का उल्लेख किया गया है, लेकिन संभावित दुरुपयोग जोखिमों की चर्चा पर्याप्त नहीं है

प्रभाव

शैक्षणिक योगदान: AI मानसिक स्वास्थ्य क्षेत्र के लिए नई अनुसंधान दिशा और बेंचमार्क प्रदान करता है
व्यावहारिक मूल्य: परामर्शदाता प्रशिक्षण, मनोविज्ञान अनुसंधान आदि कई परिदृश्यों में उपयोग किया जा सकता है
पुनरुत्पादनीयता: खुला स्रोत कोड प्रदान करता है, अनुसंधान पुनरुत्पादन और विस्तार को सुविधाजनक बनाता है

लागू परिदृश्य

मानसिक परामर्शदाता प्रशिक्षण और मूल्यांकन
मानसिक स्वास्थ्य संवाद प्रणाली विकास
मनोविज्ञान अनुसंधान और प्रयोग
मानसिक स्वास्थ्य डेटा वृद्धि

संदर्भ

पेपर में संबंधित कार्यों के समृद्ध संदर्भ शामिल हैं, जिनमें शामिल हैं:

मानसिक स्वास्थ्य AI अनुप्रयोगों के सर्वेक्षण कार्य
LLM भूमिका निभाना और बहु-एजेंट प्रणाली अनुसंधान
मानसिक परामर्श और मानकीकृत रोगी संबंधित अनुसंधान
स्मृति सिद्धांत और RAG तकनीक साहित्य

समग्र मूल्यांकन: यह AI मानसिक स्वास्थ्य क्षेत्र में महत्वपूर्ण योगदान वाला एक पेपर है, जो पहली बार साधक सिमुलेशन में मुख्य तकनीकी चुनौतियों को व्यवस्थित रूप से हल करता है। हालांकि सैद्धांतिक गहराई और मूल्यांकन के पहलुओं में सुधार की गुंजाइश है, लेकिन इसकी नवीन विधि और व्यावहारिक मूल्य इसे इस क्षेत्र में एक महत्वपूर्ण प्रगति बनाता है।