2025-11-25T10:34:17.502250

From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models

Dong, Jin, Yang et al.

Purpose: Emotion is a fundamental component of human communication, shaping understanding, trust, and engagement across domains such as education, healthcare, and mental health. While large language models (LLMs) exhibit strong reasoning and knowledge generation capabilities, they still struggle to express emotions in a consistent, controllable, and contextually appropriate manner. This limitation restricts their potential for authentic human-AI interaction. Methods: We propose a controllable emotion generation framework based on Emotion Vectors (EVs) - latent representations derived from internal activation shifts between neutral and emotion-conditioned responses. By injecting these vectors into the hidden states of pretrained LLMs during inference, our method enables fine-grained, continuous modulation of emotional tone without any additional training or architectural modification. We further provide theoretical analysis proving that EV steering enhances emotional expressivity while maintaining semantic fidelity and linguistic fluency. Results: Extensive experiments across multiple LLM families show that the proposed approach achieves consistent emotional alignment, stable topic adherence, and controllable affect intensity. Compared with existing prompt-based and fine-tuning-based baselines, our method demonstrates superior flexibility and generalizability. Conclusion: Emotion Vector (EV) steering provides an efficient and interpretable means of bridging rational reasoning and affective understanding in large language models, offering a promising direction for building emotionally resonant AI systems capable of more natural human-machine interaction.

academic

От рациональных ответов к эмоциональному резонансу: роль управляемого генерирования эмоций в языковых моделях

Основная информация

ID статьи: 2502.04075
Название: From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models
Авторы: Yurui Dong, Luozhijie Jin, Yao Yang, Bingjie Lu, Jiaxi Yang, Zhi Liu
Категория: cs.CL (Вычислительная лингвистика)
Дата публикации: Февраль 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2502.04075

Аннотация

В данной работе предлагается структура управляемого генерирования эмоций на основе эмоциональных векторов (Emotion Vectors, EVs) для решения проблемы недостаточного выражения эмоций в больших языковых моделях (LLMs). Метод извлекает различия во внутренней активации между нейтральными и эмоционально обусловленными ответами, конструирует скрытые представления и внедряет эти векторы в скрытые состояния предварительно обученных LLMs во время вывода, обеспечивая точную непрерывную модуляцию эмоционального тона без дополнительного обучения или изменения архитектуры. Теоретический анализ доказывает, что руководство EV усиливает выразительность эмоций, сохраняя при этом семантическую верность и языковую беглость.

Исследовательский контекст и мотивация

Определение проблемы

Несмотря на превосходные возможности в рассуждении и генерировании знаний, современные большие языковые модели имеют значительные недостатки в выражении эмоций:

Непоследовательное выражение эмоций: модели генерируют содержание, которое либо эмоционально нейтрально, либо имеет непоследовательный тон, либо неконтролируемую эмоциональную направленность
Отсутствие эмоционального интеллекта: в образовании, здравоохранении и психическом здоровье чисто фактические, но эмоционально холодные ответы часто не соответствуют ожиданиям пользователей
Ограниченные сценарии применения: отсутствие способности выражать эмоции ограничивает применение систем ИИ в сценариях взаимодействия человека и машины, требующих эмоционального резонанса

Значимость исследования

Эмоции являются фундаментальным компонентом человеческого общения и играют важную роль в нескольких ключевых областях:

Образование: поощрение и терпение учителя значительно влияют на мотивацию и настойчивость учащихся
Здравоохранение: эмоциональное участие врача и сочувственное общение улучшают соблюдение пациентом назначений, удовлетворенность и даже клинические результаты
Психическое здоровье: способность к эмоциональному резонансу является предпосылкой для оказания значимой поддержки

Ограничения существующих методов

Методы инструктивной настройки: часто недостаточно гибкие, сложно адаптируются к широкому спектру приложений и архитектур моделей
Стратегии подсказок: зависят от тщательно разработанных шаблонов и внешних модулей оценки
Редактирование векторов во время вывода: в основном сосредоточены на последней позиции токена, имеют ограниченное глобальное значение, сложно применяются к задачам, требующим высокой обобщаемости, таким как эмоции

Основные вклады

Предложена структура управляемого генерирования эмоций на основе эмоциональных векторов (EV): путем сравнения ответов модели при эмоционально индуцирующих и нейтральных подсказках извлекаются переиспользуемые и эффективные эмоциональные векторы
Реализовано неконтролируемое управление эмоциями с высокой робастностью: без необходимости обучения или изменения архитектуры, с глобальной согласованностью
Предоставлен строгий теоретический анализ: доказано, что руководство EV усиливает выражение эмоций, сохраняя семантическую верность
Построены специализированные наборы данных для оценки: наборы данных EmotionQuery и EmotionQuery+ для оценки генерирования эмоций
Реализовано непрерывное точное управление: посредством масштабирования скаляра обеспечивается непрерывное точное управление интенсивностью эмоций с широкой применимостью в семействах моделей

Подробное описание метода

Определение задачи

Учитывая предварительно обученную языковую модель M и целевое эмоциональное состояние e∈{joy, anger, disgust, fear, sadness}, цель задачи состоит в управлении эмоциональным тоном генерируемого текста путем изменения внутренних представлений модели во время вывода, сохраняя при этом семантическое содержание и языковую беглость.

Архитектура модели

Конструирование эмоциональных векторов

Конструирование набора данных: создание набора данных EmotionQuery, содержащего 500 запросов, по 100 запросов для каждого эмоционального состояния
Захват внутренних выходов: для каждого запроса модель генерирует внутренние представления при нейтральных и эмоциональных условиях
```
Ōl = (1/T) Σ(t=1 to T) Ol[t]
```
Измерение эмоционального смещения: вычисление различий в выходах при эмоциональных и нейтральных условиях
```
ΔO^(ek)_l = Ō^(emotion(ek))_l - Ō^(neutral)_l
```
Конструирование эмоциональных векторов: усреднение эмоциональных смещений по набору данных
```
EV^(ek)_l = (1/N) Σ(i=1 to N) ΔO^(i,ek)_l
```

Руководство эмоциональными векторами

Во время вывода эмоциональные векторы применяются путем изменения скрытых состояний каждого слоя:

Ĥl = Hl + αEV^(ek)_l

где α — масштабирующий коэффициент, управляющий интенсивностью эмоций.

Технические инновации

Глобальная согласованность: в отличие от предыдущих методов, сосредоточенных в основном на управлении на уровне предложений, данный метод реализует глобальное управление эмоциями
Без необходимости обучения: полностью работает во время вывода, не требует изменения параметров модели
Непрерывное управление: через скалярный коэффициент α реализуется непрерывная регулировка интенсивности эмоций
Аддитивность: несколько эмоций можно линейно комбинировать: Σk αk EV^(ek)_l

Экспериментальная установка

Наборы данных

EmotionQuery: 500 запросов, охватывающих 5 базовых эмоций, по 100 на каждую
EmotionQuery+ (EQ+): расширенная версия из 400 запросов, включающая 250 эмоциональных запросов и 150 нейтральных запросов

Метрики оценки

Беглость предложения: использование困惑度 (Perplexity) с помощью Llama 3.1
Тематическая согласованность: оценка выравнивания генерируемого ответа с запросом пользователя с помощью GPT-4o-mini
Оценка вероятности эмоций (EPS): измерение вероятности выражения эмоций с помощью классификатора bart-large-mnli
Абсолютная оценка эмоций (EAS): оценка пяти базовых эмоций по шкале 0-100 с помощью GPT-4o-mini
Уверенность в целевой эмоции (TEC): измерение уверенности классификатора в целевой эмоции

Методы сравнения

Исходная модель (без EV)
Применение EV с различной интенсивностью (-1×EV, 1×EV, 2×EV, 4×EV)
Базовые методы на основе подсказок и тонкой настройки

Детали реализации

Тестирование на 11 репрезентативных больших языковых моделях, включая серии Llama, Qwen, Baichuan2 и др.
Использование базовых эмоциональных векторов EVbase (среднее значение всех эмоциональных векторов) для универсального регулирования эмоций

Результаты экспериментов

Основные результаты

Беглость и тематическая согласованность

Результаты困惑度: применение EV оказывает минимальное влияние на беглость предложения, в некоторых случаях даже улучшает ее
Тематическая согласованность: большинство моделей сохраняют высокую тематическую согласованность с исходными ответами после применения EV

Способность выражения эмоций

Оценка вероятности эмоций: после применения 2×EV оценка вероятности эмоций большинства моделей значительно повышается, например Llama3.1, Qwen2, MiniCPM достигают 1.000, 0.9825, 0.9950 соответственно
Абсолютная оценка эмоций: после применения 1×EV оценка EAS большинства моделей увеличивается как минимум на 400%, тогда как -1×EV снижает EAS почти на 90%

Абляционные исследования

Эффекты различной интенсивности EV

Модель	0×	1×	2×	4×
Llama2-7B (anger)	21.40%	45.93%	98.07%	90.71%
Qwen2.5-7B (anger)	14.01%	33.36%	94.89%	95.68%

Результаты показывают, что интенсивность 1× и 2× значительно усиливает выравнивание эмоций, тогда как при интенсивности 4× наблюдается убывающая отдача и даже незначительное ухудшение производительности.

Анализ примеров

Статья предоставляет богатые примеры, демонстрирующие изменения выходов при различных эмоциональных условиях:

Условие гнева: модель переходит от нейтрального ответа к "I'm so angry and frustrated! I've been busting my butt..."
Условие радости: генерирует "I was absolutely over the moon! My heart was bursting with love!"

Экспериментальные находки

Линейная управляемость: интенсивность эмоций имеет приблизительно линейную зависимость от масштабирующего коэффициента α
Кроссмодельная обобщаемость: метод эффективен на моделях различных архитектур и размеров
Специфичность эмоций: различные эмоциональные векторы надежно направляют модель на создание соответствующих эмоциональных выражений

Теоретический анализ

Математические основы

Статья предоставляет строгое теоретическое доказательство, основанное на разложении Тейлора первого порядка:

Монотонное усиление эмоций: если направление линейного дискриминанта Фишера выравнивается с EV в среднем смысле, то малые положительные α монотонно увеличивают оценку целевой эмоции
Сохранение семантики: поскольку EV конструируется из пар подсказок, семантически идентичных, но эмоционально различных, его проекция на семантический градиент приблизительно равна нулю
Линейная управляемость: линейная зависимость интенсивности эмоций от α, аддитивная комбинируемость множественных эмоций

Приблизительная оптимальность

В смысле линейного дискриминантного анализа Фишера конструирование EV близко к статистически оптимальному: при приближении отбеливания оптимальное направление Фишера параллельно вектору средней разности.

Связанные работы

Представление эмоций и системы диалога

Категориальные методы (дискретные эмоции, такие как joy, sadness, anger)
Размерные методы (шкалы валентности-возбуждения)
Существующие методы слишком сложны или требуют дополнительного обучения

Инструктивная настройка и управление эмоциями на основе подсказок

Методы тонкой настройки часто недостаточно гибкие, сложно адаптируются к широкому спектру приложений
Стратегии подсказок зависят от тщательно разработанных шаблонов

Редактирование векторов во время вывода

Существующие методы в основном сосредоточены на последней позиции токена, имеют ограниченное глобальное значение
Большинство работ по управляющим векторам реализуют управление на уровне предложений, требуют обучения

Заключение и обсуждение

Основные выводы

Руководство EV обеспечивает эффективный и интерпретируемый метод: для связи рационального рассуждения и эмоционального понимания в больших языковых моделях
Реализовано точное управление эмоциями: непрерывное, управляемое регулирование эмоций без дополнительного обучения
Сохранена семантическая верность: теория и эксперименты доказывают, что метод усиливает выражение эмоций, сохраняя семантическую согласованность

Ограничения

Эффект насыщения при высокой интенсивности EV: при интенсивности 4× может привести к повторяющимся выходам и снижению производительности
Зависимость амплитуды EV от модели: некоторые модели (например, Llama-3.1) извлекают EV с большей амплитудой, что может влиять на последующее декодирование
Ограничение базовыми эмоциями: в настоящее время сосредоточено на пяти базовых эмоциях, обработка сложных эмоций требует дальнейшего исследования

Направления будущих исследований

Расширение на более сложные эмоциональные состояния
Оптимизация стратегий извлечения и применения EV
Исследование мультимодального управления эмоциями
Изучение взаимосвязи эмоций и персонализации

Глубокая оценка

Преимущества

Высокая инновационность метода: впервые предложен метод глобально согласованного руководства эмоциональными векторами, обеспечивающий точное управление эмоциями без обучения
Прочная теоретическая база: предоставлено строгое математическое доказательство, объясняющее приблизительную оптимальность метода с точки зрения анализа линейного дискриминанта Фишера
Полные и всесторонние эксперименты: проведены широкие эксперименты на 11 различных моделях с разнообразными и обоснованными метриками оценки
Высокая практическая ценность: метод прост в реализации, обладает хорошей кроссмодельной обобщаемостью

Недостатки

Ограниченное количество типов эмоций: рассмотрены только пять базовых эмоций, способность обработки сложных эмоциональных состояний неизвестна
Культурная адаптивность: не учитываются различия в выражении эмоций в различных культурных контекстах
Согласованность в длинных текстах: эффективность сохранения эмоциональной согласованности в длинных диалогах или на уровне документов требует дальнейшей проверки
Анализ вычислительных затрат: отсутствует подробный анализ влияния метода на вычислительную сложность и скорость вывода

Влияние

Академический вклад: предоставляет новую исследовательскую парадигму для области эмоциональных вычислений и управляемого генерирования текста
Практическая ценность: имеет широкие перспективы применения в образовании, здравоохранении, психическом здоровье и других областях
Воспроизводимость: авторы обещают открыть исходный код и наборы данных, что способствует последующим исследованиям

Применимые сценарии

Образовательные AI-помощники: предоставление персонализированной, эмоционально адекватной поддержки обучения
Системы медицинского диалога: усиление эмоционального резонанса в коммуникации врача и пациента
Поддержка психического здоровья: построение более сочувственных AI-консультантов
Боты обслуживания клиентов: повышение пользовательского опыта и удовлетворенности

Библиография

Статья цитирует богатый объем связанных исследований, включая в основном:

Теоретические основы эмоций: модель базовых эмоций Экмана
Большие языковые модели: основные модели серий Llama, Qwen и др.
Эмоциональные вычисления: модель MNLI для классификации эмоций
Редактирование векторов: связанные методы вмешательства во время вывода

Общая оценка: Это высококачественная исследовательская статья, предлагающая инновационный метод руководства эмоциональными векторами с прочной теоретической базой и полной экспериментальной верификацией. Данная работа предоставляет эффективный технологический путь для построения более эмоционально интеллектуальных систем ИИ и имеет важное академическое значение и практическую ценность.