2025-11-12T04:28:10.201322

AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation

Wang, Wang, Wu et al.

Constrained by the cost and ethical concerns of involving real seekers in AI-driven mental health, researchers develop LLM-based conversational agents (CAs) with tailored configurations, such as profiles, symptoms, and scenarios, to simulate seekers. While these efforts advance AI in mental health, achieving more realistic seeker simulation remains hindered by two key challenges: dynamic evolution and multi-session memory. Seekers' mental states often fluctuate during counseling, which typically spans multiple sessions. To address this, we propose AnnaAgent, an emotional and cognitive dynamic agent system equipped with tertiary memory. AnnaAgent incorporates an emotion modulator and a complaint elicitor trained on real counseling dialogues, enabling dynamic control of the simulator's configurations. Additionally, its tertiary memory mechanism effectively integrates short-term and long-term memory across sessions. Evaluation results, both automated and manual, demonstrate that AnnaAgent achieves more realistic seeker simulation in psychological counseling compared to existing baselines. The ethically reviewed and screened code can be found on https://github.com/sci-m-wang/AnnaAgent.

academic

AnnaAgent: বহু-সেশন মেমরি সহ গতিশীল বিবর্তন এজেন্ট সিস্টেম বাস্তবসম্মত সন্ধানকারী সিমুলেশনের জন্য

মৌলিক তথ্য

পেপার আইডি: 2506.00551
শিরোনাম: AnnaAgent: Dynamic Evolution Agent System with Multi-Session Memory for Realistic Seeker Simulation
লেখক: Ming Wang, Peidong Wang, Lin Wu, Xiaocui Yang, Daling Wang, Shi Feng, Yuxin Chen, Bixuan Wang, Yifei Zhang
শ্রেণীবিভাগ: cs.CL cs.AI
প্রকাশনার সময়: ২০২৫ সালের ১০ জুন (arXiv প্রি-প্রিন্ট)
পেপার লিংক: https://arxiv.org/abs/2506.00551

সারসংক্ষেপ

কৃত্রিম বুদ্ধিমত্তা-চালিত মানসিক স্বাস্থ্য গবেষণায় প্রকৃত সন্ধানকারীদের জড়িত করার খরচ এবং নৈতিক সমস্যার কারণে, গবেষকরা বড় ভাষা মডেল (LLM) ভিত্তিক কথোপকথন এজেন্ট (CA) তৈরি করেছেন যা ব্যক্তিগত প্রোফাইল, লক্ষণ এবং পরিস্থিতির মতো কাস্টমাইজড কনফিগারেশন ব্যবহার করে সন্ধানকারীদের অনুকরণ করে। যদিও এই প্রচেষ্টা মানসিক স্বাস্থ্য ক্ষেত্রে AI প্রয়োগ এগিয়ে নিয়ে গেছে, তবে আরও বাস্তবসম্মত সন্ধানকারী সিমুলেশন বাস্তবায়ন দুটি মূল চ্যালেঞ্জের সম্মুখীন: গতিশীল বিবর্তন এবং বহু-সেশন মেমরি। সন্ধানকারীর মানসিক অবস্থা সাধারণত একাধিক সেশন জুড়ে বিস্তৃত পরামর্শ প্রক্রিয়ায় ওঠানামা করে। এই সমস্যা সমাধানের জন্য, এই পেপারটি AnnaAgent প্রস্তাব করে, যা তিন-স্তরীয় মেমরি সহ একটি আবেগ এবং জ্ঞানীয় গতিশীল এজেন্ট সিস্টেম। AnnaAgent প্রকৃত পরামর্শ কথোপকথনের উপর ভিত্তি করে প্রশিক্ষিত আবেগ নিয়ন্ত্রক এবং প্রধান অভিযোগ গাইড একীভূত করে, যা সিমুলেটরের কনফিগারেশন গতিশীলভাবে নিয়ন্ত্রণ করতে পারে। অতিরিক্তভাবে, এর তিন-স্তরীয় মেমরি প্রক্রিয়া সেশন জুড়ে স্বল্পমেয়াদী এবং দীর্ঘমেয়াদী মেমরি কার্যকরভাবে একীভূত করে। মূল্যায়ন ফলাফল দেখায় যে AnnaAgent বিদ্যমান ভিত্তিরেখার তুলনায় মানসিক পরামর্শে আরও বাস্তবসম্মত সন্ধানকারী সিমুলেশন অর্জন করেছে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

এই গবেষণার মূল সমস্যা হল কৃত্রিম বুদ্ধিমত্তা-চালিত মানসিক স্বাস্থ্য গবেষণায় সন্ধানকারীর আচরণ আরও বাস্তবসম্মতভাবে কীভাবে অনুকরণ করা যায়। নির্দিষ্টভাবে:

খরচ এবং নৈতিক সীমাবদ্ধতা: অসংখ্য প্রকৃত সন্ধানকারীদের সাথে গবেষণা পরিচালনা শুধুমাত্র ব্যয়বহুল নয়, বরং নৈতিক সমস্যাও সৃষ্টি করতে পারে
বিদ্যমান সিমুলেশন পদ্ধতির অপর্যাপ্ততা: বর্তমান LLM-ভিত্তিক কথোপকথন এজেন্টগুলি সন্ধানকারীদের অনুকরণ করার সময় আবেগহীন অভিব্যক্তি এবং পরামর্শ সহজে গ্রহণের সমস্যা রয়েছে
গতিশীলতার অভাব: বিদ্যমান পদ্ধতি পরামর্শ প্রক্রিয়ায় সন্ধানকারীর আবেগ ওঠানামা এবং জ্ঞানীয় পরিবর্তন অনুকরণ করতে পারে না
বহু-সেশন মেমরি অনুপস্থিতি: মানসিক পরামর্শ সাধারণত দীর্ঘমেয়াদী, বহু-সেশন প্রক্রিয়া, কিন্তু বিদ্যমান পদ্ধতিতে সেশন জুড়ে মেমরি প্রক্রিয়া নেই

গবেষণার গুরুত্ব

মানসিক স্বাস্থ্য সমস্যা আজকের সমাজের একটি গুরুত্বপূর্ণ চ্যালেঞ্জ, যখন প্রশিক্ষিত থেরাপিস্টের সংখ্যা সীমিত। AI প্রযুক্তি মানসিক স্বাস্থ্য সহায়তায় বিশাল সম্ভাবনা রাখে, কিন্তু নিম্নলিখিত উদ্দেশ্যে আরও বাস্তবসম্মত সন্ধানকারী সিমুলেশন প্রয়োজন:

ডেটা নির্মাণ এবং কার্যকারিতা মূল্যায়ন
মানসিক পরামর্শদাতা প্রশিক্ষণ
মনোবিজ্ঞান গবেষণা এবং পরীক্ষা-নিরীক্ষা পরিচালনা

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

সাহিত্য পর্যালোচনার মাধ্যমে, লেখকরা বিদ্যমান সন্ধানকারী সিমুলেশন পদ্ধতিতে নিম্নলিখিত সমস্যা খুঁজে পেয়েছেন:

স্ট্যাটিক কনফিগারেশন: পরামর্শ প্রক্রিয়া জুড়ে আবেগ এবং লক্ষণ সচেতনতা অপরিবর্তিত থাকে
মেমরি প্রক্রিয়া অনুপস্থিতি: পূর্ববর্তী সেশনের বিষয়বস্তু জড়িত কথোপকথন পরিচালনা করতে পারে না
অবাস্তব আচরণ: পরামর্শ সহজে স্বীকার করা, অত্যধিক আজ্ঞাবহ, আবেগ প্রকাশ নিস্তেজ

মূল অবদান

প্রথমবারের মতো প্রস্তাব গতিশীল বিবর্তন এবং বহু-সেশন মেমরি দুটি মূল চ্যালেঞ্জ, এবং গতিশীল বিবর্তনকে আবেগ এবং প্রধান অভিযোগের পরিবর্তন হিসাবে আনুষ্ঠানিক করা, বহু-সেশন মেমরিকে বিভিন্ন পর্যায়ে বিভক্ত করা
AnnaAgent সিস্টেম ডিজাইন: তিন-স্তরীয় মেমরি সহ একটি আবেগ এবং জ্ঞানীয় গতিশীল এজেন্ট সিস্টেম, কথোপকথনে আবেগ এবং লক্ষণ সচেতনতা পরিবর্তন নিয়ন্ত্রণের মাধ্যমে পরামর্শে গতিশীল বিবর্তন অনুকরণ করা
সিস্টেম কার্যকারিতা যাচাই: পরীক্ষামূলক মূল্যায়নের মাধ্যমে প্রমাণ করা যে AnnaAgent মানসিক পরামর্শে সন্ধানকারীর আচরণ আরও বাস্তবসম্মতভাবে অনুকরণ করতে পারে

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

সন্ধানকারী সিমুলেশন কাজের জন্য LLM-কে ভূমিকা কনফিগারেশন বরাদ্দ করা প্রয়োজন, যার মধ্যে রয়েছে:

প্রোফাইল: মৌলিক ব্যক্তিগত তথ্য (বয়স, লিঙ্গ, পেশা ইত্যাদি)
অভিযোগ: সন্ধানকারীর লক্ষণ সম্পর্কে সচেতনতা এবং প্রধান সমস্যা
পরিস্থিতি: জীবনের পরিবেশ এবং অভিজ্ঞ ঘটনা
অবস্থা: শারীরিক এবং মানসিক সম্পর্কিত অবস্থা
আবেগ: প্রত্যাশিত আবেগ প্রতিক্রিয়া শৈলী

মডেল আর্কিটেকচার

AnnaAgent একটি বহু-এজেন্ট সিস্টেম আর্কিটেকচার গ্রহণ করে, যার মধ্যে দুটি প্রধান এজেন্ট গ্রুপ রয়েছে:

১. গতিশীল বিবর্তন নিয়ন্ত্রণ গ্রুপ

আবেগ নিয়ন্ত্রণ:

আবেগ যুক্তিকর: Qwen2.5-7B-Instruct এর উপর ভিত্তি করে প্রশিক্ষিত, D4 ডেটাসেট ব্যবহার করে প্রকৃত পরামর্শে আবেগ বিবর্তন প্যাটার্ন শিখতে
আবেগ বিঘ্নকারী: নির্ধারিত আবেগ পরিবর্তন প্যাটার্ন এড়াতে র্যান্ডম বিঘ্ন প্রবর্তন করে, আবেগ দূরত্বের উপর ভিত্তি করে সম্ভাবনা ওজন বরাদ্দ করে:

$P(emo_T) = \frac{w(d(G_T, G_B) \times |G_T|)}{\sum_{G_j} w(d(G_B, G_j)) \times |G_j|}$

যেখানে $G_B$ এবং $G_T$ যথাক্রমে ভিত্তি এবং লক্ষ্য আবেগ গ্রুপ প্রতিনিধিত্ব করে, $d(\cdot)$ আবেগ গ্রুপের মধ্যে দূরত্ব প্রতিনিধিত্ব করে।

প্রধান অভিযোগ নির্দেশনা:

প্রধান অভিযোগ চেইন উৎপাদন: সন্ধানকারীর কনফিগারেশন এবং সাম্প্রতিক ঘটনার উপর ভিত্তি করে প্রধান অভিযোগ পরিবর্তন চেইন উৎপাদন করা
প্রধান অভিযোগ স্যুইচ নিয়ন্ত্রণ: অ্যালগরিদমের মাধ্যমে চেইনে পরবর্তী পর্যায়ের প্রধান অভিযোগে স্যুইচ করা উচিত কিনা তা নির্ধারণ করা

২. তিন-স্তরীয় মেমরি সময়সূচী গ্রুপ

রিয়েল-টাইম মেমরি: বর্তমান সেশনের কথোপকথন বিষয়বস্তু
স্বল্পমেয়াদী মেমরি: সাম্প্রতিক ঘটনা এবং অবস্থা পরিবর্তন, স্ব-প্রতিবেদন স্কেল দ্বারা ক্যাপচার করা
দীর্ঘমেয়াদী মেমরি: পূর্ববর্তী সেশনের কথোপকথন এবং স্কেল রেকর্ড, এজেন্টিক RAG দ্বারা সময়সূচী করা

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

গতিশীল বিবর্তন মডেলিং: প্রথমবারের মতো সন্ধানকারীর গতিশীল পরিবর্তনকে আবেগ এবং প্রধান অভিযোগ দুটি মাত্রার বিবর্তন হিসাবে আনুষ্ঠানিক করা
তিন-স্তরীয় মেমরি প্রক্রিয়া: মেমরি তত্ত্বের উপর ভিত্তি করে ডিজাইন করা সময় স্তরযুক্ত মেমরি সিস্টেম
ডেটা-চালিত বিবর্তন শিক্ষা: প্রকৃত পরামর্শ ডেটার উপর ভিত্তি করে প্রশিক্ষিত আবেগ এবং প্রধান অভিযোগ পরিবর্তন মডেল
বহু-এজেন্ট সমন্বয়: এজেন্টদের মধ্যে সহযোগিতার মাধ্যমে জটিল গতিশীল নিয়ন্ত্রণ এবং মেমরি সময়সূচী বাস্তবায়ন

পরীক্ষা সেটআপ

ডেটাসেট

D4 ডেটাসেট: চীনা বিষণ্নতা নির্ণয় নির্দেশিত কথোপকথন ডেটাসেট
DAIC-WOZ ডেটাসেট: ইংরেজি মানসিক স্বাস্থ্য কথোপকথন ডেটাসেট
ডেটা মনোনীত করার জন্য GPT-4o ব্যবহার করা, তিনজন মনোবিজ্ঞানী বিশেষজ্ঞকে প্রধান অভিযোগ চেইন ডেটা পর্যালোচনা করার জন্য আমন্ত্রণ জানানো

মূল্যায়ন মেট্রিক্স

মানবিকীকরণ ডিগ্রি (Anthropomorphism): BERT-score ব্যবহার করে সিমুলেটরের কথা এবং প্রকৃত সন্ধানকারীর সামঞ্জস্য মূল্যায়ন করা
ব্যক্তিত্ব বিশ্বস্ততা (Personality Fidelity): সাক্ষাৎকার প্রশ্ন ডিজাইন করা, G-Eval স্কোরিং ব্যবহার করে কনফিগারেশন ম্যাচিং ডিগ্রি মূল্যায়ন করা
পূর্ববর্তী সেশন সচেতনতা নির্ভুলতা: দীর্ঘমেয়াদী মেমরির কার্যকারিতা মূল্যায়ন করা

তুলনা পদ্ধতি

তিনটি ভিত্তিরেখা পদ্ধতি নির্বাচন করা:

Chen et al. (2023a)
Duro et al. (2024)
Qiu and Lan (2024)

বাস্তবায়ন বিবরণ

মেরুদণ্ড মডেল: Qwen2.5-7B-Instruct
পরামর্শদাতা মডেল: PsycoLLM, EmoLLM, SoulChat
আবেগ শ্রেণীবিভাগ: GoEmotions আবেগ বিভাগের উপর ভিত্তি করে
স্কেল সরঞ্জাম: SCL-90, BDI, SAAS ইত্যাদি স্ব-প্রতিবেদন স্কেল

পরীক্ষা ফলাফল

প্রধান ফলাফল

মানবিকীকরণ ডিগ্রি তুলনা: D4 এবং DAIC ডেটাসেটে, AnnaAgent বিভিন্ন পরামর্শদাতা মডেলের সাথে কথোপকথনে সর্বোত্তম বা দ্বিতীয় সর্বোত্তম কর্মক্ষমতা অর্জন করেছে:

ডেটাসেট	পরামর্শদাতা	Chen et al.	Duro et al.	Qiu & Lan	AnnaAgent
D4	PsycoLLM	0.6293	0.6455	0.6866	0.6691
D4	EmoLLM	0.6529	0.6469	0.6449	0.6649
DAIC	PsycoLLM	0.3458	0.4864	0.3426	0.4910

ব্যক্তিত্ব বিশ্বস্ততা: AnnaAgent G-Eval স্কোরিংয়ে সামগ্রিকভাবে ভিত্তিরেখা পদ্ধতির চেয়ে উন্নত।

বিলোপন পরীক্ষা

গতিশীল বিবর্তন বিলোপন: গতিশীল বিবর্তন উপাদান সরানোর পরে, F1 স্কোর 0.6691 থেকে 0.6144 এ হ্রাস পায় (D4 ডেটাসেট)
দীর্ঘমেয়াদী মেমরি বিলোপন: দীর্ঘমেয়াদী মেমরি সরানো ভার্চুয়াল সন্ধানকারীর পূর্ববর্তী সেশনের সচেতনতা নির্ভুলতা উল্লেখযোগ্যভাবে হ্রাস করে

সাধারণীকরণ গবেষণা

GPT-4o-mini এবং Llama-3.1-8B-Instruct-এ পরীক্ষা দেখায় যে AnnaAgent ভাল ক্রস-মডেল স্থিতিশীলতা রয়েছে, আপেক্ষিক মান বিচ্যুতি সব ১০% এর নিচে।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

AnnaAgent সন্ধানকারী সিমুলেশনে গতিশীল বিবর্তন এবং বহু-সেশন মেমরি চ্যালেঞ্জ সফলভাবে সমাধান করেছে
প্রকৃত ডেটার উপর ভিত্তি করে প্রশিক্ষিত আবেগ এবং প্রধান অভিযোগ বিবর্তন মডেল সিমুলেশন বাস্তবতা কার্যকরভাবে উন্নত করতে পারে
তিন-স্তরীয় মেমরি প্রক্রিয়া সেশন জুড়ে তথ্য পরিচালনায় চমৎকার কর্মক্ষমতা প্রদর্শন করে

সীমাবদ্ধতা

আনুষ্ঠানিকীকরণ সরলীকরণ: প্রযুক্তিগত বাস্তবায়নের সুবিধার জন্য, গতিশীল বিবর্তন প্রক্রিয়ায় একটি নির্দিষ্ট স্তরের আনুষ্ঠানিকীকরণ সরলীকরণ করা হয়েছে
মেমরি সিস্টেম অপরিশোধিত: তিন-স্তরীয় মেমরি সিস্টেমের সমন্বয় প্রক্রিয়া এখনও প্রাথমিক
ডেটা নির্ভরতা: প্রকৃত পরামর্শ ডেটার গুণমান এবং পরিমাণের উপর অত্যন্ত নির্ভরশীল

ভবিষ্যত দিকনির্দেশনা

আরও সূক্ষ্ম-দানাদার গতিশীল বিবর্তন মডেলিং
আরও জটিল বহু-সেশন মেমরি সমন্বয় প্রক্রিয়া
আরও মানসিক স্বাস্থ্য পরিস্থিতি এবং ভাষায় সম্প্রসারণ

গভীর মূল্যায়ন

শক্তি

সমস্যা সনাক্তকরণ নির্ভুল: প্রথমবারের মতো গতিশীল বিবর্তন এবং বহু-সেশন মেমরি দুটি মূল চ্যালেঞ্জ স্পষ্টভাবে প্রস্তাব করা
পদ্ধতি ডিজাইন যুক্তিসঙ্গত: বহু-এজেন্ট সিস্টেম আর্কিটেকচার স্পষ্ট, প্রতিটি মডিউল কার্যকারিতা নির্দিষ্ট
পরীক্ষা পর্যাপ্ত: প্রধান ফলাফল, বিলোপন পরীক্ষা এবং সাধারণীকরণ যাচাইকরণ অন্তর্ভুক্ত
ব্যবহারিক মূল্য উচ্চ: মানসিক স্বাস্থ্য AI গবেষণার জন্য গুরুত্বপূর্ণ সরঞ্জাম প্রদান করা

অপূর্ণতা

তাত্ত্বিক গভীরতা সীমিত: গতিশীল বিবর্তন প্রক্রিয়ার গভীর মনোবিজ্ঞান তত্ত্ব বিশ্লেষণের অভাব
মূল্যায়ন মেট্রিক্স একক: প্রধানত স্বয়ংক্রিয় মেট্রিক্সের উপর নির্ভর করে, পেশাদার মনোবিজ্ঞানীদের মানব মূল্যায়নের অভাব
নৈতিক বিবেচনা অপর্যাপ্ত: যদিও নৈতিক পর্যালোচনা উল্লেখ করা হয়েছে, সম্ভাব্য অপব্যবহার ঝুঁকির আলোচনা যথেষ্ট গভীর নয়

প্রভাব

একাডেমিক অবদান: AI মানসিক স্বাস্থ্য ক্ষেত্রে নতুন গবেষণা দিকনির্দেশনা এবং মানদণ্ড প্রদান করা
ব্যবহারিক মূল্য: পরামর্শদাতা প্রশিক্ষণ, মনোবিজ্ঞান গবেষণা ইত্যাদি একাধিক পরিস্থিতিতে ব্যবহার করা যায়
পুনরুৎপাদনযোগ্যতা: খোলা উৎস কোড প্রদান করা, গবেষণা পুনরুৎপাদন এবং সম্প্রসারণ সহজতর করা

প্রযোজ্য পরিস্থিতি

মানসিক পরামর্শদাতা প্রশিক্ষণ এবং মূল্যায়ন
মানসিক স্বাস্থ্য কথোপকথন সিস্টেম উন্নয়ন
মনোবিজ্ঞান গবেষণা এবং পরীক্ষা-নিরীক্ষা
মানসিক স্বাস্থ্য ডেটা বৃদ্ধি

রেফারেন্স

পেপারটি সমৃদ্ধ সম্পর্কিত কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:

মানসিক স্বাস্থ্য AI প্রয়োগের পর্যালোচনা কাজ
LLM ভূমিকা অভিনয় এবং বহু-এজেন্ট সিস্টেম গবেষণা
মানসিক পরামর্শ এবং মানক রোগী সম্পর্কিত গবেষণা
মেমরি তত্ত্ব এবং RAG প্রযুক্তি সাহিত্য

সামগ্রিক মূল্যায়ন: এটি AI মানসিক স্বাস্থ্য ক্ষেত্রে গুরুত্বপূর্ণ অবদান সহ একটি পেপার, যা সন্ধানকারী সিমুলেশনে মূল প্রযুক্তিগত চ্যালেঞ্জ সিস্টেমেটিকভাবে সমাধান করে। যদিও তাত্ত্বিক গভীরতা এবং মূল্যায়ন দিকে উন্নতির সুযোগ রয়েছে, তবে এর উদ্ভাবনী পদ্ধতি এবং ব্যবহারিক মূল্য এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ অগ্রগতি করে তোলে।