2025-11-25T10:34:17.502250

From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models

Dong, Jin, Yang et al.
Purpose: Emotion is a fundamental component of human communication, shaping understanding, trust, and engagement across domains such as education, healthcare, and mental health. While large language models (LLMs) exhibit strong reasoning and knowledge generation capabilities, they still struggle to express emotions in a consistent, controllable, and contextually appropriate manner. This limitation restricts their potential for authentic human-AI interaction. Methods: We propose a controllable emotion generation framework based on Emotion Vectors (EVs) - latent representations derived from internal activation shifts between neutral and emotion-conditioned responses. By injecting these vectors into the hidden states of pretrained LLMs during inference, our method enables fine-grained, continuous modulation of emotional tone without any additional training or architectural modification. We further provide theoretical analysis proving that EV steering enhances emotional expressivity while maintaining semantic fidelity and linguistic fluency. Results: Extensive experiments across multiple LLM families show that the proposed approach achieves consistent emotional alignment, stable topic adherence, and controllable affect intensity. Compared with existing prompt-based and fine-tuning-based baselines, our method demonstrates superior flexibility and generalizability. Conclusion: Emotion Vector (EV) steering provides an efficient and interpretable means of bridging rational reasoning and affective understanding in large language models, offering a promising direction for building emotionally resonant AI systems capable of more natural human-machine interaction.
academic

De Respuestas Racionales a Resonancia Emocional: El Papel de la Generación de Emociones Controlables en Modelos de Lenguaje

Información Básica

  • ID del Artículo: 2502.04075
  • Título: From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models
  • Autores: Yurui Dong, Luozhijie Jin, Yao Yang, Bingjie Lu, Jiaxi Yang, Zhi Liu
  • Clasificación: cs.CL (Computación y Lenguaje)
  • Fecha de Publicación: Febrero de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2502.04075

Resumen

Este artículo aborda las deficiencias en la expresión emocional de los modelos de lenguaje grandes (LLMs) proponiendo un marco de generación de emociones controlables basado en vectores de emoción (Emotion Vectors, EVs). El método extrae diferencias de activación interna entre respuestas neutrales y condicionadas emocionalmente, construye representaciones latentes e inyecta estos vectores en los estados ocultos de LLMs preentrenados durante la inferencia, logrando una modulación continua y precisa del tono emocional sin requerir entrenamiento adicional ni modificaciones arquitectónicas. El análisis teórico demuestra que la guía EV mejora la expresión emocional manteniendo la fidelidad semántica y la fluidez lingüística.

Contexto de Investigación y Motivación

Definición del Problema

Aunque los modelos de lenguaje grandes demuestran un desempeño excepcional en razonamiento y generación de conocimiento, presentan deficiencias significativas en la expresión emocional:

  1. Inconsistencia en la Expresión Emocional: El contenido generado por el modelo es emocionalmente neutral, presenta tonos inconsistentes o la orientación emocional no es controlable
  2. Falta de Inteligencia Emocional: En campos como educación, atención médica y salud mental, las respuestas puramente factuales pero emocionalmente frías a menudo no satisfacen las expectativas del usuario
  3. Limitaciones en Escenarios de Aplicación: La deficiencia en capacidad de expresión emocional limita la aplicación de sistemas de IA en escenarios de interacción humano-máquina que requieren resonancia emocional

Importancia de la Investigación

La emoción es un componente fundamental de la comunicación humana, desempeñando un papel crucial en múltiples campos:

  • Educación: El aliento y la paciencia del docente impactan significativamente la motivación y persistencia del estudiante
  • Atención Médica: La participación emocional y la comunicación empática del médico mejoran la adherencia del paciente, satisfacción e incluso trayectorias de recuperación clínica
  • Salud Mental: La capacidad de resonancia emocional es un requisito previo para proporcionar apoyo significativo

Limitaciones de Métodos Existentes

  1. Métodos de Ajuste por Instrucción: Frecuentemente carecen de flexibilidad y son difíciles de adaptar a aplicaciones y arquitecturas de modelos amplias
  2. Estrategias de Indicaciones: Dependen de plantillas cuidadosamente diseñadas y módulos de evaluación externos
  3. Edición de Vectores en Tiempo de Inferencia: Se enfoca principalmente en la posición del último token, carece de significado global y es difícil de aplicar a tareas como emociones que requieren alta generalización

Contribuciones Principales

  1. Propone un Marco de Generación de Emociones Controlables basado en Vectores de Emoción (EV): Extrae vectores de emoción reutilizables y eficientes comparando respuestas del modelo bajo indicaciones emocionalmente inducidas y neutrales
  2. Implementa Control Emocional No Supervisado y Altamente Robusto: Sin necesidad de entrenamiento o cambios arquitectónicos, con consistencia global
  3. Proporciona Análisis Teórico Riguroso: Demuestra que la guía EV mejora la expresión emocional manteniendo la fidelidad semántica
  4. Construye Conjuntos de Datos de Evaluación Especializados: Conjuntos de datos EmotionQuery y EmotionQuery+ para evaluación de generación emocional
  5. Implementa Control Preciso Continuo: Proporciona control continuo y preciso sobre la intensidad emocional mediante escalado escalar, apoyando amplia aplicabilidad entre familias de modelos

Explicación Detallada del Método

Definición de la Tarea

Dado un modelo de lenguaje preentrenado M y un estado emocional objetivo e∈{joy, anger, disgust, fear, sadness}, el objetivo de la tarea es controlar el tono emocional del texto generado modificando representaciones internas del modelo durante la inferencia, manteniendo simultáneamente el contenido semántico y la fluidez lingüística.

Arquitectura del Modelo

Construcción del Vector de Emoción

  1. Construcción del Conjunto de Datos: Se crea el conjunto de datos EmotionQuery, que contiene 500 consultas, 100 consultas por cada estado emocional
  2. Captura de Salidas Internas: Para cada consulta, el modelo genera representaciones internas bajo configuraciones neutrales y emocionales
    Ōl = (1/T) Σ(t=1 a T) Ol[t]
    
  3. Medición del Desplazamiento Emocional: Se calcula la diferencia de salida bajo configuraciones emocionales y neutrales
    ΔO^(ek)_l = Ō^(emotion(ek))_l - Ō^(neutral)_l
    
  4. Construcción del Vector de Emoción: Se promedian los desplazamientos emocionales en el conjunto de datos
    EV^(ek)_l = (1/N) Σ(i=1 a N) ΔO^(i,ek)_l
    

Guía del Vector de Emoción

Durante la inferencia, se aplica el vector de emoción modificando los estados ocultos de cada capa:

Ĥl = Hl + αEV^(ek)_l

donde α es un factor de escala que controla la intensidad emocional.

Puntos de Innovación Técnica

  1. Consistencia Global: A diferencia de métodos anteriores que se enfocaban principalmente en control a nivel de oración, este método implementa control emocional global
  2. Sin Necesidad de Entrenamiento: Opera completamente durante la inferencia sin necesidad de modificar parámetros del modelo
  3. Control Continuo: Permite ajuste continuo de la intensidad emocional mediante el escalar α
  4. Aditividad: Múltiples emociones pueden combinarse linealmente: Σk αk EV^(ek)_l

Configuración Experimental

Conjuntos de Datos

  1. EmotionQuery: 500 consultas que abarcan 5 emociones básicas, 100 por cada una
  2. EmotionQuery+ (EQ+): Versión extendida de 400 consultas, que incluye 250 consultas emocionales y 150 consultas neutrales

Métricas de Evaluación

  1. Fluidez de Oración: Se calcula la perplejidad (Perplexity) utilizando Llama 3.1
  2. Consistencia Temática: Se evalúa el alineamiento temático entre respuestas generadas y consultas del usuario utilizando GPT-4o-mini
  3. Puntuación de Probabilidad Emocional (EPS): Se mide la probabilidad de expresión emocional utilizando un clasificador bart-large-mnli
  4. Puntuación Absoluta de Emoción (EAS): Se califican las cinco emociones básicas en escala 0-100 utilizando GPT-4o-mini
  5. Confianza de Emoción Objetivo (TEC): Se mide la confianza del clasificador en la emoción objetivo

Métodos de Comparación

  • Modelo original (sin EV)
  • Aplicación de EV con diferentes intensidades (-1×EV, 1×EV, 2×EV, 4×EV)
  • Métodos de línea base basados en indicaciones y ajuste fino

Detalles de Implementación

  • Se probaron 11 modelos de lenguaje grandes representativos, incluyendo series Llama, Qwen, Baichuan2, etc.
  • Se utilizó vector de emoción base EVbase (promedio de todos los vectores de emoción) para ajuste emocional general

Resultados Experimentales

Resultados Principales

Fluidez y Consistencia Temática

  • Resultados de Perplejidad: La aplicación de EV tiene un impacto insignificante en la fluidez de oración, mejorándola incluso en algunos casos
  • Consistencia Temática: La mayoría de los modelos mantienen consistencia temática comparable con respuestas originales después de aplicar EV

Capacidad de Expresión Emocional

  • Puntuación de Probabilidad Emocional: Después de aplicar 2×EV, la mayoría de modelos muestran mejoras significativas en EPS, como Llama3.1, Qwen2, MiniCPM alcanzando 1.000, 0.9825, 0.9950
  • Puntuación Absoluta de Emoción: Después de aplicar 1×EV, la mayoría de modelos aumentan EAS al menos 400%, mientras que -1×EV reduce EAS casi 90%

Experimentos de Ablación

Efectos de Diferentes Intensidades de EV

Modelo
Llama2-7B (anger)21.40%45.93%98.07%90.71%
Qwen2.5-7B (anger)14.01%33.36%94.89%95.68%

Los resultados muestran que intensidades 1× y 2×EV mejoran significativamente la alineación emocional, con rendimientos decrecientes e incluso degradación leve a intensidad 4×.

Análisis de Casos

El artículo proporciona casos ricos que demuestran cambios de salida bajo diferentes condiciones emocionales:

  • Condición de Ira: El modelo transita de respuesta neutral a "I'm so angry and frustrated! I've been busting my butt..."
  • Condición de Alegría: Genera "I was absolutely over the moon! My heart was bursting with love!"

Hallazgos Experimentales

  1. Controlabilidad Lineal: La intensidad emocional mantiene relación aproximadamente lineal con el factor de escala α
  2. Generalización Transmodelo: El método es efectivo en modelos de diferentes arquitecturas y escalas
  3. Especificidad Emocional: Diferentes vectores de emoción pueden guiar confiablemente al modelo para producir expresiones emocionales correspondientes

Análisis Teórico

Fundamentos Matemáticos

El artículo proporciona pruebas teóricas rigurosas basadas en expansión de Taylor de primer orden:

  1. Ganancia Emocional Monótona: Si la dirección del discriminante de Fisher se alinea con EV en sentido promedio, entonces pequeños α positivos aumentan monótonamente la puntuación de emoción objetivo
  2. Preservación Semántica: Dado que EV se construye a partir de pares de indicaciones semánticamente idénticas pero emocionalmente diferentes, su proyección en gradientes semánticos es aproximadamente cero
  3. Controlabilidad Lineal: Dependencia lineal de la intensidad emocional respecto a α, con capacidad de combinación aditiva multiemocional

Optimalidad Aproximada

En el sentido del análisis discriminante lineal de Fisher, la construcción de EV es aproximadamente estadísticamente óptima: bajo aproximación de blanqueamiento, la dirección óptima de Fisher es paralela al vector de diferencia de medias.

Trabajo Relacionado

  • Métodos de clasificación (emociones discretas como joy, sadness, anger)
  • Métodos dimensionales (escala valencia-arousal)
  • Métodos existentes demasiado complejos o requieren entrenamiento adicional

Ajuste por Instrucción y Control Emocional Basado en Indicaciones

  • Métodos de ajuste fino frecuentemente carecen de flexibilidad, difíciles de adaptar a aplicaciones amplias
  • Estrategias de indicaciones dependen de plantillas cuidadosamente diseñadas

Edición de Vectores en Tiempo de Inferencia

  • Métodos existentes se enfocaban principalmente en posición de último token, carecen de significado global
  • La mayoría de trabajos relacionados con vectores de control son control a nivel de oración, requieren entrenamiento

Conclusiones y Discusión

Conclusiones Principales

  1. La Guía EV Proporciona un Método Eficiente e Interpretable: Cierra la brecha entre razonamiento racional y comprensión emocional en modelos de lenguaje grandes
  2. Implementa Control Emocional Preciso: Permite ajuste emocional continuo y controlable sin entrenamiento adicional
  3. Mantiene Fidelidad Semántica: Tanto teoría como experimentos demuestran que el método mejora la expresión emocional manteniendo consistencia semántica

Limitaciones

  1. Efecto de Saturación a Alta Intensidad de EV: A intensidad 4× puede resultar en salidas repetitivas y degradación de desempeño
  2. Dependencia de Modelo en Amplitud de EV: Algunos modelos (como Llama-3.1) extraen EV con amplitudes mayores, potencialmente afectando decodificación posterior
  3. Limitación a Emociones Básicas: Actualmente se enfoca en cinco emociones básicas, el manejo de emociones complejas requiere exploración adicional

Direcciones Futuras

  1. Extensión a Estados Emocionales Más Complejos
  2. Optimización de Estrategias de Extracción y Aplicación de EV
  3. Exploración de Control Emocional Multimodal
  4. Investigación de Combinación de Emoción y Personalización

Evaluación Profunda

Fortalezas

  1. Innovación Metodológica Fuerte: Propone por primera vez un método de guía de vector emocional globalmente consistente, implementando control emocional preciso sin entrenamiento
  2. Fundamentos Teóricos Sólidos: Proporciona pruebas matemáticas rigurosas, explicando la optimalidad aproximada del método desde perspectiva de análisis discriminante de Fisher
  3. Experimentación Completa y Exhaustiva: Realiza experimentos amplios en 11 modelos diferentes, con métricas de evaluación diversas y razonables
  4. Alto Valor Práctico: El método es simple de implementar con buena capacidad de generalización transmodelo

Insuficiencias

  1. Variedad Emocional Limitada: Solo considera cinco emociones básicas, la capacidad de manejo de estados emocionales complejos es desconocida
  2. Adaptabilidad Cultural: No considera diferencias en expresión emocional entre diferentes contextos culturales
  3. Consistencia en Texto Largo: La efectividad en mantener consistencia emocional en diálogos largos o a nivel de documento requiere verificación adicional
  4. Análisis de Costo Computacional: Carece de análisis detallado sobre complejidad computacional e impacto en velocidad de inferencia

Impacto

  1. Contribución Académica: Proporciona nuevo paradigma de investigación para campos de computación emocional y generación de texto controlable
  2. Valor Práctico: Tiene amplias perspectivas de aplicación en educación, atención médica, salud mental y otros campos
  3. Reproducibilidad: Los autores se comprometen a liberar código y conjuntos de datos, facilitando investigación posterior

Escenarios Aplicables

  1. Asistentes de IA Educativa: Proporcionar apoyo de aprendizaje personalizado y emocionalmente apropiado
  2. Sistemas de Diálogo Médico: Mejorar resonancia emocional en comunicación médico-paciente
  3. Apoyo de Salud Mental: Construir consejeros de IA más empáticos
  4. Robots de Servicio al Cliente: Mejorar experiencia y satisfacción del usuario

Referencias

El artículo cita investigación relacionada abundante, incluyendo principalmente:

  • Fundamentos de teoría emocional: Modelo de emociones básicas de Ekman
  • Modelos de lenguaje grandes: Series Llama, Qwen y otros modelos principales
  • Computación emocional: Modelo MNLI para clasificación emocional
  • Edición de vectores: Métodos de intervención en tiempo de inferencia relacionados

Evaluación General: Este es un artículo de investigación de alta calidad que propone un método innovador de guía de vector emocional con fundamentos teóricos sólidos y verificación experimental exhaustiva. Este trabajo proporciona una ruta técnica efectiva para construir sistemas de IA con mayor inteligencia emocional, poseyendo valor académico e importancia práctica significativos.