2025-11-25T10:34:17.502250

From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models

Dong, Jin, Yang et al.
Purpose: Emotion is a fundamental component of human communication, shaping understanding, trust, and engagement across domains such as education, healthcare, and mental health. While large language models (LLMs) exhibit strong reasoning and knowledge generation capabilities, they still struggle to express emotions in a consistent, controllable, and contextually appropriate manner. This limitation restricts their potential for authentic human-AI interaction. Methods: We propose a controllable emotion generation framework based on Emotion Vectors (EVs) - latent representations derived from internal activation shifts between neutral and emotion-conditioned responses. By injecting these vectors into the hidden states of pretrained LLMs during inference, our method enables fine-grained, continuous modulation of emotional tone without any additional training or architectural modification. We further provide theoretical analysis proving that EV steering enhances emotional expressivity while maintaining semantic fidelity and linguistic fluency. Results: Extensive experiments across multiple LLM families show that the proposed approach achieves consistent emotional alignment, stable topic adherence, and controllable affect intensity. Compared with existing prompt-based and fine-tuning-based baselines, our method demonstrates superior flexibility and generalizability. Conclusion: Emotion Vector (EV) steering provides an efficient and interpretable means of bridging rational reasoning and affective understanding in large language models, offering a promising direction for building emotionally resonant AI systems capable of more natural human-machine interaction.
academic

From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models

基本信息

  • 论文ID: 2502.04075
  • 标题: From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models
  • 作者: Yurui Dong, Luozhijie Jin, Yao Yang, Bingjie Lu, Jiaxi Yang, Zhi Liu
  • 分类: cs.CL (Computation and Language)
  • 发表时间: 2025年2月 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2502.04075

摘要

本文针对大语言模型(LLMs)在情感表达方面的不足,提出了基于情感向量(Emotion Vectors, EVs)的可控情感生成框架。该方法通过提取中性和情感条件响应之间的内部激活差异,构建潜在表示,并在推理时将这些向量注入预训练LLMs的隐藏状态中,实现对情感语调的精细连续调制,无需额外训练或架构修改。理论分析证明EV引导在增强情感表达力的同时保持了语义保真度和语言流畅性。

研究背景与动机

问题定义

当前大语言模型虽然在推理和知识生成方面表现出色,但在情感表达方面存在显著不足:

  1. 情感表达不一致:模型生成的内容要么情感中性,要么语调不一致,或情感导向不可控
  2. 缺乏情感智能:在教育、医疗、心理健康等领域,纯粹事实性但情感冷漠的回应往往无法满足用户期望
  3. 应用场景受限:情感表达能力的缺失限制了AI系统在需要情感共鸣的人机交互场景中的应用

研究重要性

情感是人类交流的基本组成部分,在多个关键领域发挥重要作用:

  • 教育领域:教师的鼓励和耐心能显著影响学生的动机和坚持性
  • 医疗保健:医生的情感参与和共情沟通能改善患者依从性、满意度甚至临床康复轨迹
  • 心理健康:情感共鸣能力是提供有意义支持的先决条件

现有方法局限性

  1. 指令调优方法:往往不够灵活,难以适应广泛的应用和模型架构
  2. 提示策略:依赖精心设计的模板和外部评估模块
  3. 推理时向量编辑:主要关注最后token位置,缺乏全局意义,难以应用于需要高泛化性的情感等任务

核心贡献

  1. 提出了基于情感向量(EV)的可控情感生成框架:通过比较情感诱导和中性提示的模型响应来提取可重用且高效的情感向量
  2. 实现了无监督、高鲁棒性的情感控制:无需训练或架构更改,具有全局一致性
  3. 提供了严格的理论分析:证明EV引导在增强情感表达的同时保持语义保真度
  4. 构建了专门的评估数据集:EmotionQuery和EmotionQuery+数据集用于情感生成评估
  5. 实现了连续精细控制:通过标量缩放提供对情感强度的连续精细控制,支持跨模型家族的广泛适用性

方法详解

任务定义

给定预训练语言模型M和目标情感状态e∈{joy, anger, disgust, fear, sadness},任务目标是在推理时通过修改模型内部表示来控制生成文本的情感语调,同时保持语义内容和语言流畅性。

模型架构

情感向量构建

  1. 数据集构建:创建EmotionQuery数据集,包含500个查询,每种情感状态100个查询
  2. 内部输出捕获:对每个查询,模型在中性和情感设置下生成内部表示
    Ōl = (1/T) Σ(t=1 to T) Ol[t]
    
  3. 情感偏移测量:计算情感和中性设置下的输出差异
    ΔO^(ek)_l = Ō^(emotion(ek))_l - Ō^(neutral)_l
    
  4. 情感向量构建:在数据集上平均情感偏移
    EV^(ek)_l = (1/N) Σ(i=1 to N) ΔO^(i,ek)_l
    

情感向量引导

在推理时,通过修改每层隐藏状态来应用情感向量:

Ĥl = Hl + αEV^(ek)_l

其中α为控制情感强度的缩放因子。

技术创新点

  1. 全局一致性:与以往主要关注句子级控制的方法不同,本方法实现了全局情感控制
  2. 无需训练:完全在推理时操作,不需要修改模型参数
  3. 连续控制:通过标量α实现情感强度的连续调节
  4. 可加性:多种情感可以线性组合:Σk αk EV^(ek)_l

实验设置

数据集

  1. EmotionQuery:500个查询,涵盖5种基本情感,每种100个
  2. EmotionQuery+ (EQ+):400个查询的扩展版本,包含250个情感查询和150个中性查询

评价指标

  1. 句子流畅性:使用Llama 3.1计算困惑度(Perplexity)
  2. 主题一致性:使用GPT-4o-mini评估生成回应与用户查询的主题对齐度
  3. 情感概率得分(EPS):使用bart-large-mnli分类器测量情感表达概率
  4. 情感绝对得分(EAS):使用GPT-4o-mini对五种基本情感进行0-100评分
  5. 目标情感置信度(TEC):测量分类器对目标情感的置信度

对比方法

  • 原始模型(无EV)
  • 不同强度的EV应用(-1×EV, 1×EV, 2×EV, 4×EV)
  • 基于提示和微调的基线方法

实现细节

  • 测试了11个代表性大语言模型,包括Llama系列、Qwen系列、Baichuan2等
  • 使用基础情感向量EVbase(所有情感向量的平均)进行通用情感调节

实验结果

主要结果

流畅性和主题一致性

  • 困惑度结果:EV应用对句子流畅性影响微乎其微,某些情况下甚至有所改善
  • 主题一致性:大多数模型在应用EV后保持了与原始响应相当的高主题一致性

情感表达能力

  • 情感概率得分:应用2×EV后,多数模型的情感概率得分显著提升,如Llama3.1、Qwen2、MiniCPM达到1.000、0.9825、0.9950
  • 情感绝对得分:应用1×EV后,多数模型的EAS至少增加400%,而-1×EV使得EAS减少近90%

消融实验

不同EV强度的效果

模型
Llama2-7B (anger)21.40%45.93%98.07%90.71%
Qwen2.5-7B (anger)14.01%33.36%94.89%95.68%

结果显示1×和2×EV能显著增强情感对齐,4×强度时出现收益递减甚至轻微退化。

案例分析

论文提供了丰富的案例展示不同情感条件下的输出变化:

  • 愤怒条件:模型从中性回应转为"I'm so angry and frustrated! I've been busting my butt..."
  • 快乐条件:生成"I was absolutely over the moon! My heart was bursting with love!"

实验发现

  1. 线性可控性:情感强度与缩放因子α呈近似线性关系
  2. 跨模型泛化:方法在不同架构和规模的模型上均有效
  3. 情感特异性:不同情感向量能够可靠地引导模型产生对应的情感表达

理论分析

数学基础

论文提供了严格的理论证明,基于一阶泰勒展开:

  1. 单调情感增益:如果Fisher判别方向与EV在平均意义下对齐,则小的正α单调增加目标情感得分
  2. 语义保持:由于EV从语义相同但情感不同的提示对构建,其在语义梯度上的投影近似为零
  3. 线性可控性:情感强度对α的线性依赖性,多情感可加性组合

近似最优性

在Fisher线性判别分析意义下,EV构建接近统计最优:在白化近似下,最优Fisher方向与均值差向量平行。

相关工作

情感表示和对话系统

  • 分类方法(离散情感如joy、sadness、anger)
  • 维度方法(效价-唤醒量表)
  • 现有方法过于复杂或需要进一步训练

指令调优和基于提示的情感控制

  • 微调方法往往不够灵活,难以适应广泛应用
  • 提示策略依赖精心设计的模板

推理时向量编辑

  • 现有方法主要关注最后token位置,缺乏全局意义
  • 大多数控制向量相关工作是句子级控制,需要训练

结论与讨论

主要结论

  1. EV引导提供了高效且可解释的方法:在大语言模型中桥接理性推理和情感理解
  2. 实现了精细的情感控制:无需额外训练即可实现连续、可控的情感调节
  3. 保持了语义保真度:理论和实验均证明方法在增强情感表达的同时保持语义一致性

局限性

  1. 高强度EV的饱和效应:4×强度时可能导致重复输出和性能下降
  2. EV幅度的模型依赖性:某些模型(如Llama-3.1)提取的EV幅度较大,可能影响后续解码
  3. 基本情感限制:目前主要关注五种基本情感,复杂情感的处理有待探索

未来方向

  1. 扩展到更复杂的情感状态
  2. 优化EV提取和应用策略
  3. 探索多模态情感控制
  4. 研究情感与个性化的结合

深度评价

优点

  1. 方法创新性强:首次提出全局一致的情感向量引导方法,无需训练即可实现精细情感控制
  2. 理论基础扎实:提供了严格的数学证明,从Fisher判别分析角度解释了方法的近似最优性
  3. 实验充分全面:在11个不同模型上进行了广泛实验,评估指标多样且合理
  4. 实用价值高:方法简单易实现,具有良好的跨模型泛化能力

不足

  1. 情感种类有限:仅考虑了五种基本情感,对复杂情感状态的处理能力未知
  2. 文化适应性:未考虑不同文化背景下情感表达的差异
  3. 长文本一致性:对于长对话或文档级别的情感一致性保持效果需要进一步验证
  4. 计算开销分析:缺乏对方法计算复杂度和推理速度影响的详细分析

影响力

  1. 学术贡献:为情感计算和可控文本生成领域提供了新的研究范式
  2. 实用价值:在教育、医疗、心理健康等领域具有广阔应用前景
  3. 可复现性:作者承诺开源代码和数据集,有利于后续研究

适用场景

  1. 教育AI助手:提供个性化、情感适宜的学习支持
  2. 医疗对话系统:增强医患沟通的情感共鸣
  3. 心理健康支持:构建更具同理心的AI咨询师
  4. 客户服务机器人:提升用户体验和满意度

参考文献

论文引用了丰富的相关研究,主要包括:

  • 情感理论基础:Ekman的基本情感模型
  • 大语言模型:Llama系列、Qwen系列等主流模型
  • 情感计算:MNLI模型用于情感分类
  • 向量编辑:相关的推理时干预方法

总体评价:这是一篇高质量的研究论文,提出了创新的情感向量引导方法,理论基础扎实,实验验证充分。该工作为构建更具情感智能的AI系统提供了有效的技术路径,具有重要的学术价值和实用意义。