From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models
Dong, Jin, Yang et al.
Purpose: Emotion is a fundamental component of human communication, shaping understanding, trust, and engagement across domains such as education, healthcare, and mental health. While large language models (LLMs) exhibit strong reasoning and knowledge generation capabilities, they still struggle to express emotions in a consistent, controllable, and contextually appropriate manner. This limitation restricts their potential for authentic human-AI interaction. Methods: We propose a controllable emotion generation framework based on Emotion Vectors (EVs) - latent representations derived from internal activation shifts between neutral and emotion-conditioned responses. By injecting these vectors into the hidden states of pretrained LLMs during inference, our method enables fine-grained, continuous modulation of emotional tone without any additional training or architectural modification. We further provide theoretical analysis proving that EV steering enhances emotional expressivity while maintaining semantic fidelity and linguistic fluency. Results: Extensive experiments across multiple LLM families show that the proposed approach achieves consistent emotional alignment, stable topic adherence, and controllable affect intensity. Compared with existing prompt-based and fine-tuning-based baselines, our method demonstrates superior flexibility and generalizability. Conclusion: Emotion Vector (EV) steering provides an efficient and interpretable means of bridging rational reasoning and affective understanding in large language models, offering a promising direction for building emotionally resonant AI systems capable of more natural human-machine interaction.
academic
من الإجابات العقلانية إلى الرنين العاطفي: دور توليد العاطفة القابلة للتحكم في نماذج اللغة
تعالج هذه الورقة أوجه القصور في نماذج اللغة الكبيرة (LLMs) في التعبير العاطفي، وتقترح إطار عمل لتوليد عاطفة قابلة للتحكم بناءً على متجهات العاطفة (Emotion Vectors, EVs). تعمل هذه الطريقة على استخراج الفروقات في التنشيط الداخلي بين الاستجابات المحايدة والمشروطة بالعاطفة، وبناء تمثيلات كامنة، وحقن هذه المتجهات في الحالات المخفية لنماذج اللغة المدربة مسبقاً أثناء الاستدلال، مما يحقق تعديلاً دقيقاً ومستمراً للنبرة العاطفية دون الحاجة إلى تدريب إضافي أو تعديل معماري. يثبت التحليل النظري أن توجيه EV يعزز القدرة على التعبير العاطفي مع الحفاظ على الدقة الدلالية والسلاسة اللغوية.
على الرغم من أن نماذج اللغة الكبيرة الحالية تتفوق في الاستدلال وتوليد المعرفة، إلا أنها تعاني من نقص ملحوظ في التعبير العاطفي:
عدم اتساق التعبير العاطفي: المحتوى الذي تولده النماذج إما محايد عاطفياً أو غير متسق في النبرة أو غير قابل للتحكم في التوجه العاطفي
نقص الذكاء العاطفي: في مجالات التعليم والرعاية الصحية والصحة النفسية، غالباً ما تفشل الاستجابات الواقعية البحتة والخالية من العاطفة في تلبية توقعات المستخدمين
محدودية السيناريوهات التطبيقية: يحد نقص القدرة على التعبير العاطفي من تطبيق أنظمة الذكاء الاصطناعي في سيناريوهات التفاعل بين الإنسان والآلة التي تتطلب الرنين العاطفي
طرق ضبط التعليمات: غالباً ما تكون غير مرنة بما يكفي وتصعب التكيف مع التطبيقات الواسعة والمعماريات المختلفة
استراتيجيات الإشارات: تعتمد على قوالب مصممة بعناية وعلى وحدات تقييم خارجية
تحرير المتجهات في وقت الاستدلال: يركز بشكل أساسي على موضع الرمز الأخير، ويفتقر إلى المعنى العام، ويصعب تطبيقه على المهام مثل العاطفة التي تتطلب قابلية تعميم عالية
اقتراح إطار عمل لتوليد عاطفة قابلة للتحكم بناءً على متجهات العاطفة (EV): من خلال مقارنة استجابات النموذج تحت التحريض العاطفي والإشارات المحايدة لاستخراج متجهات عاطفية قابلة لإعادة الاستخدام وفعالة
تحقيق التحكم العاطفي غير الخاضع للإشراف وعالي الثبات: بدون تدريب أو تغيير معماري، مع اتساق عام
توفير تحليل نظري صارم: إثبات أن توجيه EV يعزز التعبير العاطفي مع الحفاظ على الدقة الدلالية
بناء مجموعة بيانات تقييم متخصصة: مجموعات بيانات EmotionQuery و EmotionQuery+ لتقييم توليد العاطفة
تحقيق التحكم الدقيق المستمر: من خلال التحجيم العددي لتوفير تحكم دقيق ومستمر في شدة العاطفة، مع دعم قابلية التطبيق الواسعة عبر عائلات النماذج
بالنظر إلى نموذج لغة مدرب مسبقاً M وحالة عاطفية مستهدفة e∈{joy, anger, disgust, fear, sadness}، الهدف من المهمة هو تعديل التمثيلات الداخلية للنموذج في وقت الاستدلال للتحكم في النبرة العاطفية للنص المُولّد، مع الحفاظ على المحتوى الدلالي والسلاسة اللغوية.
درجة احتمالية العاطفة: بعد تطبيق 2×EV، تحسنت درجة احتمالية العاطفة بشكل كبير لمعظم النماذج، مثل Llama3.1 و Qwen2 و MiniCPM التي وصلت إلى 1.000 و 0.9825 و 0.9950
درجة العاطفة المطلقة: بعد تطبيق 1×EV، زادت EAS لمعظم النماذج بما لا يقل عن 400%، بينما أدى -1×EV إلى تقليل EAS بنسبة تقارب 90%
توفر الورقة إثباتاً نظرياً صارماً، بناءً على توسع تايلور من الدرجة الأولى:
الكسب العاطفي الرتيب: إذا كان اتجاه التمييز الخطي لـ Fisher متوافقاً مع EV بالمعنى المتوسط، فإن α الموجب الصغير يزيد بشكل رتيب من درجة العاطفة المستهدفة
الحفاظ على الدلالات: نظراً لأن EV يتم بناؤه من أزواج الإشارات الدلالية المتطابقة ولكن المختلفة عاطفياً، فإن إسقاطه على تدرج الدلالات يقترب من الصفر
القابلية للتحكم الخطي: الاعتماد الخطي لشدة العاطفة على α، وقابلية الدمج الخطي لعدة عواطف
تستشهد الورقة بأبحاث ذات صلة غنية، تشمل بشكل أساسي:
الأساس النظري للعاطفة: نموذج العواطف الأساسية لـ Ekman
نماذج اللغة الكبيرة: سلسلة Llama وسلسلة Qwen والنماذج السائدة الأخرى
الحوسبة العاطفية: استخدام نموذج MNLI للتصنيف العاطفي
تحرير المتجهات: طرق التدخل ذات الصلة في وقت الاستدلال
التقييم الشامل: هذه ورقة بحثية عالية الجودة تقترح طريقة توجيه متجهات عاطفية مبتكرة، مع أساس نظري متين وتحقق تجريبي شامل. يوفر هذا العمل مسار تقني فعال لبناء أنظمة ذكاء اصطناعي أكثر ذكاءً عاطفياً، مع قيمة أكاديمية وعملية مهمة.