From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models
Dong, Jin, Yang et al.
Purpose: Emotion is a fundamental component of human communication, shaping understanding, trust, and engagement across domains such as education, healthcare, and mental health. While large language models (LLMs) exhibit strong reasoning and knowledge generation capabilities, they still struggle to express emotions in a consistent, controllable, and contextually appropriate manner. This limitation restricts their potential for authentic human-AI interaction. Methods: We propose a controllable emotion generation framework based on Emotion Vectors (EVs) - latent representations derived from internal activation shifts between neutral and emotion-conditioned responses. By injecting these vectors into the hidden states of pretrained LLMs during inference, our method enables fine-grained, continuous modulation of emotional tone without any additional training or architectural modification. We further provide theoretical analysis proving that EV steering enhances emotional expressivity while maintaining semantic fidelity and linguistic fluency. Results: Extensive experiments across multiple LLM families show that the proposed approach achieves consistent emotional alignment, stable topic adherence, and controllable affect intensity. Compared with existing prompt-based and fine-tuning-based baselines, our method demonstrates superior flexibility and generalizability. Conclusion: Emotion Vector (EV) steering provides an efficient and interpretable means of bridging rational reasoning and affective understanding in large language models, offering a promising direction for building emotionally resonant AI systems capable of more natural human-machine interaction.
academic
Des Réponses Rationnelles à la Résonance Émotionnelle : Le Rôle de la Génération d'Émotions Contrôlable dans les Modèles de Langage
Cet article aborde les insuffisances des grands modèles de langage (LLMs) en matière d'expression émotionnelle en proposant un cadre de génération d'émotions contrôlable basé sur des vecteurs émotionnels (Emotion Vectors, EVs). Cette méthode extrait les différences d'activation interne entre les réponses neutres et celles conditionnées par l'émotion, construit des représentations latentes, et injecte ces vecteurs dans les états cachés des LLMs préentraînés lors de l'inférence, réalisant une modulation fine et continue du ton émotionnel sans nécessiter d'entraînement supplémentaire ni de modification architecturale. L'analyse théorique démontre que l'orientation par EV renforce l'expressivité émotionnelle tout en préservant la fidélité sémantique et la fluidité linguistique.
Bien que les grands modèles de langage actuels excellent dans le raisonnement et la génération de connaissances, ils présentent des lacunes significatives en matière d'expression émotionnelle :
Incohérence de l'expression émotionnelle : Le contenu généré par le modèle est soit émotionnellement neutre, soit présente un ton incohérent ou une orientation émotionnelle incontrôlable
Manque d'intelligence émotionnelle : Dans les domaines de l'éducation, de la santé et de la santé mentale, les réponses purement factuelles mais émotionnellement froides ne répondent souvent pas aux attentes des utilisateurs
Champ d'application limité : L'absence de capacité d'expression émotionnelle restreint l'application des systèmes d'IA dans les scénarios d'interaction humain-machine nécessitant une résonance émotionnelle
L'émotion est un élément fondamental de la communication humaine, jouant un rôle crucial dans plusieurs domaines clés :
Domaine éducatif : L'encouragement et la patience des enseignants influencent significativement la motivation et la persévérance des étudiants
Soins de santé : L'engagement émotionnel et la communication empathique des médecins améliorent l'observance thérapeutique, la satisfaction et même la trajectoire de rétablissement clinique des patients
Santé mentale : La capacité de résonance émotionnelle est une condition préalable à la fourniture d'un soutien significatif
Méthodes d'ajustement par instruction : Manquent souvent de flexibilité et s'adaptent difficilement à un large éventail d'applications et d'architectures de modèles
Stratégies d'incitation : Dépendent de modèles soigneusement conçus et de modules d'évaluation externes
Édition de vecteurs au moment de l'inférence : Se concentrent principalement sur la position du dernier token, manquent de signification globale et s'appliquent difficilement aux tâches comme l'émotion nécessitant une haute généralisation
Proposition d'un cadre de génération d'émotions contrôlable basé sur les vecteurs émotionnels (EV) : Extraction de vecteurs émotionnels réutilisables et efficaces par comparaison des réponses du modèle sous incitations induisant l'émotion et neutres
Réalisation d'un contrôle émotionnel non supervisé et hautement robuste : Sans nécessiter d'entraînement ou de modification architecturale, avec cohérence globale
Fourniture d'une analyse théorique rigoureuse : Démonstration que l'orientation par EV renforce l'expression émotionnelle tout en préservant la fidélité sémantique
Construction d'ensembles de données d'évaluation spécialisés : Ensembles de données EmotionQuery et EmotionQuery+ pour l'évaluation de la génération émotionnelle
Réalisation d'un contrôle fin et continu : Fourniture d'un contrôle fin et continu de l'intensité émotionnelle par mise à l'échelle scalaire, soutenant une large applicabilité entre familles de modèles
Étant donné un modèle de langage préentraîné M et un état émotionnel cible e∈{joy, anger, disgust, fear, sadness}, l'objectif de la tâche est de contrôler le ton émotionnel du texte généré en modifiant les représentations internes du modèle au moment de l'inférence, tout en préservant le contenu sémantique et la fluidité linguistique.
Cohérence globale : Contrairement aux méthodes antérieures se concentrant principalement sur le contrôle au niveau des phrases, cette méthode réalise un contrôle émotionnel global
Sans entraînement : Fonctionne entièrement au moment de l'inférence, sans nécessiter de modification des paramètres du modèle
Contrôle continu : Réalise l'ajustement continu de l'intensité émotionnelle par le scalaire α
Additivité : Plusieurs émotions peuvent être combinées linéairement : Σk αk EV^(ek)_l
Score de probabilité émotionnelle : Après application de 2×EV, le score de probabilité émotionnelle de la plupart des modèles augmente significativement, comme Llama3.1, Qwen2, MiniCPM atteignant 1.000, 0.9825, 0.9950
Score absolu d'émotion : Après application de 1×EV, l'EAS de la plupart des modèles augmente d'au moins 400%, tandis que -1×EV réduit l'EAS de près de 90%
Les résultats montrent que 1× et 2×EV renforcent significativement l'alignement émotionnel, tandis qu'une intensité de 4× entraîne des rendements décroissants voire une légère dégradation.
Contrôlabilité linéaire : La relation entre l'intensité émotionnelle et le facteur d'échelle α est approximativement linéaire
Généralisation entre modèles : La méthode est efficace sur différentes architectures et tailles de modèles
Spécificité émotionnelle : Différents vecteurs émotionnels peuvent orienter de manière fiable le modèle pour produire l'expression émotionnelle correspondante
L'article fournit une démonstration théorique rigoureuse basée sur l'expansion de Taylor au premier ordre :
Gain émotionnel monotone : Si la direction de discrimination de Fisher s'aligne avec EV au sens moyen, alors un petit α positif augmente monotoniquement le score d'émotion cible
Préservation sémantique : Puisque EV est construit à partir de paires d'incitations sémantiquement identiques mais émotionnellement différentes, sa projection sur le gradient sémantique est approximativement nulle
Contrôlabilité linéaire : Dépendance linéaire de l'intensité émotionnelle à α, composabilité additive multi-émotions
Au sens de l'analyse discriminante linéaire de Fisher, la construction d'EV est proche de l'optimum statistique : sous l'approximation de blanchiment, la direction de Fisher optimale est parallèle au vecteur de différence moyenne.
L'orientation par EV fournit une méthode efficace et interprétable : Comblant le fossé entre le raisonnement rationnel et la compréhension émotionnelle dans les grands modèles de langage
Réalisation d'un contrôle émotionnel fin : Permettant un ajustement émotionnel continu et contrôlable sans entraînement supplémentaire
Préservation de la fidélité sémantique : La théorie et les expériences démontrent que la méthode renforce l'expression émotionnelle tout en maintenant la cohérence sémantique
Effet de saturation des EV à haute intensité : Une intensité de 4× peut entraîner des sorties répétitives et une dégradation des performances
Dépendance du modèle pour l'amplitude d'EV : Certains modèles (comme Llama-3.1) extraient des EV d'amplitude plus grande, pouvant affecter le décodage ultérieur
Limitation aux émotions fondamentales : Actuellement axé sur cinq émotions fondamentales, le traitement des émotions complexes reste à explorer
Innovation méthodologique forte : Première proposition d'une méthode d'orientation par vecteur émotionnel globalement cohérente, réalisant un contrôle émotionnel fin sans entraînement
Fondements théoriques solides : Fourniture de démonstrations mathématiques rigoureuses, expliquant l'optimalité approximative de la méthode du point de vue de l'analyse discriminante de Fisher
Expérimentation complète et approfondie : Expériences étendues sur 11 modèles différents, métriques d'évaluation variées et raisonnables
Valeur pratique élevée : Méthode simple à implémenter avec bonne capacité de généralisation entre modèles
Variété émotionnelle limitée : Considération de seulement cinq émotions fondamentales, capacité de traitement des états émotionnels complexes inconnue
Adaptation culturelle : Absence de considération des différences dans l'expression émotionnelle selon les contextes culturels
Cohérence sur textes longs : L'effet de maintien de la cohérence émotionnelle pour les dialogues longs ou au niveau des documents nécessite une vérification ultérieure
Analyse des frais de calcul : Manque d'analyse détaillée de la complexité de calcul et de l'impact sur la vitesse d'inférence de la méthode
Grands modèles de langage : Séries Llama, Qwen et autres modèles dominants
Calcul émotionnel : Modèle MNLI pour la classification émotionnelle
Édition de vecteurs : Méthodes d'intervention au moment de l'inférence connexes
Évaluation Globale : Ceci est un article de recherche de haute qualité proposant une méthode innovante d'orientation par vecteur émotionnel, avec des fondements théoriques solides et une vérification expérimentale complète. Ce travail fournit un chemin technique efficace pour la construction de systèmes d'IA possédant une plus grande intelligence émotionnelle, possédant une importance académique et pratique significative.