From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models
Dong, Jin, Yang et al.
Purpose: Emotion is a fundamental component of human communication, shaping understanding, trust, and engagement across domains such as education, healthcare, and mental health. While large language models (LLMs) exhibit strong reasoning and knowledge generation capabilities, they still struggle to express emotions in a consistent, controllable, and contextually appropriate manner. This limitation restricts their potential for authentic human-AI interaction. Methods: We propose a controllable emotion generation framework based on Emotion Vectors (EVs) - latent representations derived from internal activation shifts between neutral and emotion-conditioned responses. By injecting these vectors into the hidden states of pretrained LLMs during inference, our method enables fine-grained, continuous modulation of emotional tone without any additional training or architectural modification. We further provide theoretical analysis proving that EV steering enhances emotional expressivity while maintaining semantic fidelity and linguistic fluency. Results: Extensive experiments across multiple LLM families show that the proposed approach achieves consistent emotional alignment, stable topic adherence, and controllable affect intensity. Compared with existing prompt-based and fine-tuning-based baselines, our method demonstrates superior flexibility and generalizability. Conclusion: Emotion Vector (EV) steering provides an efficient and interpretable means of bridging rational reasoning and affective understanding in large language models, offering a promising direction for building emotionally resonant AI systems capable of more natural human-machine interaction.
academic
От рациональных ответов к эмоциональному резонансу: роль управляемого генерирования эмоций в языковых моделях
В данной работе предлагается структура управляемого генерирования эмоций на основе эмоциональных векторов (Emotion Vectors, EVs) для решения проблемы недостаточного выражения эмоций в больших языковых моделях (LLMs). Метод извлекает различия во внутренней активации между нейтральными и эмоционально обусловленными ответами, конструирует скрытые представления и внедряет эти векторы в скрытые состояния предварительно обученных LLMs во время вывода, обеспечивая точную непрерывную модуляцию эмоционального тона без дополнительного обучения или изменения архитектуры. Теоретический анализ доказывает, что руководство EV усиливает выразительность эмоций, сохраняя при этом семантическую верность и языковую беглость.
Несмотря на превосходные возможности в рассуждении и генерировании знаний, современные большие языковые модели имеют значительные недостатки в выражении эмоций:
Непоследовательное выражение эмоций: модели генерируют содержание, которое либо эмоционально нейтрально, либо имеет непоследовательный тон, либо неконтролируемую эмоциональную направленность
Отсутствие эмоционального интеллекта: в образовании, здравоохранении и психическом здоровье чисто фактические, но эмоционально холодные ответы часто не соответствуют ожиданиям пользователей
Ограниченные сценарии применения: отсутствие способности выражать эмоции ограничивает применение систем ИИ в сценариях взаимодействия человека и машины, требующих эмоционального резонанса
Эмоции являются фундаментальным компонентом человеческого общения и играют важную роль в нескольких ключевых областях:
Образование: поощрение и терпение учителя значительно влияют на мотивацию и настойчивость учащихся
Здравоохранение: эмоциональное участие врача и сочувственное общение улучшают соблюдение пациентом назначений, удовлетворенность и даже клинические результаты
Психическое здоровье: способность к эмоциональному резонансу является предпосылкой для оказания значимой поддержки
Методы инструктивной настройки: часто недостаточно гибкие, сложно адаптируются к широкому спектру приложений и архитектур моделей
Стратегии подсказок: зависят от тщательно разработанных шаблонов и внешних модулей оценки
Редактирование векторов во время вывода: в основном сосредоточены на последней позиции токена, имеют ограниченное глобальное значение, сложно применяются к задачам, требующим высокой обобщаемости, таким как эмоции
Предложена структура управляемого генерирования эмоций на основе эмоциональных векторов (EV): путем сравнения ответов модели при эмоционально индуцирующих и нейтральных подсказках извлекаются переиспользуемые и эффективные эмоциональные векторы
Реализовано неконтролируемое управление эмоциями с высокой робастностью: без необходимости обучения или изменения архитектуры, с глобальной согласованностью
Предоставлен строгий теоретический анализ: доказано, что руководство EV усиливает выражение эмоций, сохраняя семантическую верность
Построены специализированные наборы данных для оценки: наборы данных EmotionQuery и EmotionQuery+ для оценки генерирования эмоций
Реализовано непрерывное точное управление: посредством масштабирования скаляра обеспечивается непрерывное точное управление интенсивностью эмоций с широкой применимостью в семействах моделей
Учитывая предварительно обученную языковую модель M и целевое эмоциональное состояние e∈{joy, anger, disgust, fear, sadness}, цель задачи состоит в управлении эмоциональным тоном генерируемого текста путем изменения внутренних представлений модели во время вывода, сохраняя при этом семантическое содержание и языковую беглость.
Глобальная согласованность: в отличие от предыдущих методов, сосредоточенных в основном на управлении на уровне предложений, данный метод реализует глобальное управление эмоциями
Без необходимости обучения: полностью работает во время вывода, не требует изменения параметров модели
Оценка вероятности эмоций: после применения 2×EV оценка вероятности эмоций большинства моделей значительно повышается, например Llama3.1, Qwen2, MiniCPM достигают 1.000, 0.9825, 0.9950 соответственно
Абсолютная оценка эмоций: после применения 1×EV оценка EAS большинства моделей увеличивается как минимум на 400%, тогда как -1×EV снижает EAS почти на 90%
Результаты показывают, что интенсивность 1× и 2× значительно усиливает выравнивание эмоций, тогда как при интенсивности 4× наблюдается убывающая отдача и даже незначительное ухудшение производительности.
Статья предоставляет строгое теоретическое доказательство, основанное на разложении Тейлора первого порядка:
Монотонное усиление эмоций: если направление линейного дискриминанта Фишера выравнивается с EV в среднем смысле, то малые положительные α монотонно увеличивают оценку целевой эмоции
Сохранение семантики: поскольку EV конструируется из пар подсказок, семантически идентичных, но эмоционально различных, его проекция на семантический градиент приблизительно равна нулю
В смысле линейного дискриминантного анализа Фишера конструирование EV близко к статистически оптимальному: при приближении отбеливания оптимальное направление Фишера параллельно вектору средней разности.
Руководство EV обеспечивает эффективный и интерпретируемый метод: для связи рационального рассуждения и эмоционального понимания в больших языковых моделях
Реализовано точное управление эмоциями: непрерывное, управляемое регулирование эмоций без дополнительного обучения
Сохранена семантическая верность: теория и эксперименты доказывают, что метод усиливает выражение эмоций, сохраняя семантическую согласованность
Эффект насыщения при высокой интенсивности EV: при интенсивности 4× может привести к повторяющимся выходам и снижению производительности
Зависимость амплитуды EV от модели: некоторые модели (например, Llama-3.1) извлекают EV с большей амплитудой, что может влиять на последующее декодирование
Ограничение базовыми эмоциями: в настоящее время сосредоточено на пяти базовых эмоциях, обработка сложных эмоций требует дальнейшего исследования
Высокая инновационность метода: впервые предложен метод глобально согласованного руководства эмоциональными векторами, обеспечивающий точное управление эмоциями без обучения
Прочная теоретическая база: предоставлено строгое математическое доказательство, объясняющее приблизительную оптимальность метода с точки зрения анализа линейного дискриминанта Фишера
Полные и всесторонние эксперименты: проведены широкие эксперименты на 11 различных моделях с разнообразными и обоснованными метриками оценки
Высокая практическая ценность: метод прост в реализации, обладает хорошей кроссмодельной обобщаемостью
Ограниченное количество типов эмоций: рассмотрены только пять базовых эмоций, способность обработки сложных эмоциональных состояний неизвестна
Культурная адаптивность: не учитываются различия в выражении эмоций в различных культурных контекстах
Согласованность в длинных текстах: эффективность сохранения эмоциональной согласованности в длинных диалогах или на уровне документов требует дальнейшей проверки
Анализ вычислительных затрат: отсутствует подробный анализ влияния метода на вычислительную сложность и скорость вывода
Статья цитирует богатый объем связанных исследований, включая в основном:
Теоретические основы эмоций: модель базовых эмоций Экмана
Большие языковые модели: основные модели серий Llama, Qwen и др.
Эмоциональные вычисления: модель MNLI для классификации эмоций
Редактирование векторов: связанные методы вмешательства во время вывода
Общая оценка: Это высококачественная исследовательская статья, предлагающая инновационный метод руководства эмоциональными векторами с прочной теоретической базой и полной экспериментальной верификацией. Данная работа предоставляет эффективный технологический путь для построения более эмоционально интеллектуальных систем ИИ и имеет важное академическое значение и практическую ценность.