2025-11-22T07:58:16.571206

BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation

Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
academic

BILLY: Orientación de Modelos de Lenguaje Grande mediante Fusión de Vectores de Personalidad para Generación Creativa

Información Básica

  • ID del Artículo: 2510.10157
  • Título: BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
  • Autores: Tsung-Min Pai, Jui-I Wang, Li-Chun Lu, Shao-Hua Sun, Hung-Yi Lee, Kai-Wei Chang
  • Clasificación: cs.CL cs.AI
  • Fecha de Publicación: 11 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.10157v1

Resumen

Los sistemas multi-LLM mejoran la creatividad de los modelos de lenguaje grande mediante la simulación de la inteligencia colectiva humana, pero presentan deficiencias significativas en costo computacional y latencia de inferencia. Para resolver estas limitaciones, este artículo propone BILLY (BlendIng persona vectors for Large Language model creativitY), un marco sin entrenamiento que captura las ventajas de la colaboración multi-LLM dentro de un único modelo, es decir, la introducción de perspectivas diversificadas y conocimiento especializado. BILLY opera mediante la extracción y fusión de múltiples vectores de personalidad distintos en el espacio de activación del modelo, utilizando este vector fusionado durante la inferencia para guiar el proceso de generación del modelo, logrando salidas multi-perspectiva sin requerir comunicación explícita entre múltiples LLM.

Contexto de Investigación y Motivación

Problemas Centrales

  1. Carga Computacional de Sistemas Multi-LLM: Aunque los marcos tradicionales de colaboración multi-LLM mejoran la creatividad, presentan problemas de alto costo computacional y latencia de inferencia
  2. Limitaciones de Métodos de Indicación Única: Hacer que un modelo adopte múltiples roles y perspectivas simultáneamente únicamente mediante indicaciones presenta dificultades de integración
  3. Equilibrio entre Eficiencia y Creatividad: Cómo reducir significativamente la sobrecarga computacional mientras se mantienen las ventajas de creatividad

Importancia de la Investigación

La creatividad es ampliamente reconocida como la piedra angular del progreso humano, impulsando la innovación en diversos campos. Investigaciones recientes han explorado la creatividad de los LLM, considerándola como una herramienta prometedora para aplicaciones como escritura de historias, ideación de diseño y descubrimiento científico. El paradigma multi-LLM, mediante la simulación de la inteligencia colectiva humana, permite que múltiples LLM participen en discusiones iterativas para obtener soluciones más comprehensivas.

Limitaciones de Métodos Existentes

  1. Marcos Multi-LLM: Alto costo computacional, tiempo de inferencia prolongado, presencia de pérdida de proceso
  2. Métodos de Indicación Única: Dependen de la capacidad del modelo para integrar múltiples roles, pero en la práctica el modelo puede procesar cada personalidad por separado sin lograr una integración coherente

Contribuciones Principales

  1. Propuesta del Marco BILLY: Un marco de fusión de vectores de personalidad sin entrenamiento que logra respuestas creativas multi-perspectiva dentro de un único LLM
  2. Eficiencia y Simplicidad: Completamente sin entrenamiento, sin necesidad de ajuste fino adicional o comunicación multi-LLM, reduciendo significativamente los costos computacionales y de tokens
  3. Mecanismo de Interpretabilidad: Operación directa en el espacio de activación latente, proporcionando un mecanismo interpretable de control de creatividad
  4. Mejora de Rendimiento: Supera los métodos de indicación de modelo único y los enfoques multi-LLM tradicionales en pruebas de referencia orientadas a la creatividad

Explicación Detallada del Método

Definición de Tarea

Dado un entrada de tarea creativa, BILLY tiene como objetivo generar salidas creativas que fusionen múltiples perspectivas especializadas (como ambientalista, profesional creativo, futurista) mientras se evita la sobrecarga computacional de sistemas multi-LLM.

Arquitectura del Modelo

1. Extracción de Vectores de Personalidad (Activación Contrastiva)

Para una personalidad P, se extrae el vector de personalidad mediante un método contrastivo:

v⃗(l)_P = (1/|D+_P|) ∑(x∈D+_P) a⃗(l)(x) - (1/|D-_P|) ∑(x∈D-_P) a⃗(l)(x)

Donde:

  • D+_P: conjunto de respuestas que exhiben características de esa personalidad
  • D-_P: conjunto de respuestas de línea base que carecen de esa característica
  • a⃗(l)(x): activación del flujo residual promediado por token en la capa l

2. Fusión Fuera de Línea (Offline Fusion)

Fusión de N vectores de personalidad en un único vector compuesto:

v⃗(l)_merged = (1/N) ∑(i=1 to N) v⃗(l)_i

3. Orientación en Tiempo de Inferencia (Inference-time Steering)

Modificación de activaciones durante la inferencia:

a⃗(l)_steered = a⃗(l)_original + α · v⃗(l)_merged

Donde α es un coeficiente de escala, y en los experimentos se selecciona la capa 20 para la orientación.

Puntos de Innovación Técnica

  1. Operación en Espacio de Activación: Operación directa a nivel de representación interna del modelo, en lugar de depender de ingeniería de indicaciones externa
  2. Estrategia de Fusión de Vectores: Fusión de múltiples vectores de personalidad mediante promedio simple, logrando combinaciones de personalidades complejas
  3. Diseño Sin Entrenamiento: Solo se añaden vectores durante la inferencia, sin modificar los pesos del modelo
  4. Reutilizabilidad: Los vectores de personalidad se extraen una vez y pueden utilizarse múltiples veces, amortizando costos

Configuración Experimental

Conjuntos de Datos

Basados en pruebas de creatividad Wallach-Kogan extendidas, mejoradas con GPT-4 por Lu et al.:

  1. AUT: Requiere proporcionar usos innovadores y prácticos para objetos cotidianos
  2. INSTANCES: Enumerar objetos según criterios específicos
  3. SIMILARITIES: Identificar conexiones o similitudes entre objetos
  4. SCIENTIFIC: Generar soluciones creativas para problemas científicos

Métricas de Evaluación

Se adoptan dos métricas principales de la Prueba de Pensamiento Creativo de Torrance (TTCT):

  1. Originalidad (Originality): Evalúa la rareza estadística o carácter no convencional de la respuesta
  2. Elaboración (Elaboration): Mide el nivel de detalle y apoyo informativo de la respuesta

Se utiliza GPT-4o-mini como evaluador LLM, con escala de puntuación de 1-5.

Métodos de Comparación

  1. Agente Único (SA): Respuesta creativa de LLM único (temperatura 0.7)
  2. SA (T=1.0): Agente único con decodificación de temperatura alta (temperatura 1.0)
  3. SA-MRP: Agente único con indicación multi-rol
  4. Discusión LLM: Marco multi-LLM con proceso de discusión estructurado de tres etapas

Detalles de Implementación

  • Modelos Base: Qwen-2.5-7B-Instruct, Llama-3.1-8B-Instruct, Gemma-3-4B-it
  • Capa de Orientación: Capa 20
  • Vectores de Personalidad: Ambientalista, profesional creativo, futurista, pensador analítico, etc.
  • Evaluación: 100 consultas por referencia, cálculo de media y desviación estándar

Resultados Experimentales

Resultados Principales

En cuatro pruebas de referencia de creatividad, BILLY supera consistentemente todos los métodos de línea base en la métrica de originalidad:

Puntuaciones de Originalidad en Tarea AUT:

  • Qwen-2.5-7B: BILLY (4.71) > Discusión LLM (4.24) > SA-MRP (4.07) > SA (4.03)
  • Llama-3.1-8B: BILLY (4.38) > Discusión LLM (4.21) > SA-MRP (4.05) > SA (3.73)
  • Gemma-3-4B: BILLY (4.99) > SA-MRP (4.96) > SA (4.79) > Discusión LLM (3.70)

Comparación de Eficiencia:

  • Latencia de Inferencia: BILLY (19s) vs Discusión LLM (513s), aproximadamente 25 veces más rápido
  • Costo de Tokens: BILLY reduce más del 95% del uso de tokens
  • Costo por 10,000 consultas: BILLY (0.30)vsDiscusioˊnLLM(0.30) vs Discusión LLM (25.50)

Experimentos de Ablación

Análisis de Combinación de Vectores de Personalidad:

  • Un único vector de profesional creativo ya muestra un excelente rendimiento creativo
  • El aumento de 1 a 3 vectores produce mejoras significativas
  • El aumento adicional de 4-7 vectores no proporciona beneficios adicionales significativos

Análisis de Casos

Tomando como ejemplo la tarea "Rediseñar un Hospital":

  • Vector Ambientalista: Genera planos prácticos (como jardines comunitarios)
  • Vector Profesional Creativo: Produce terminología artística (como ecosistemas bioluminiscentes)
  • Vector Fusionado: Verdadera fusión conceptual, retiene conceptos sustanciales del ambientalista pero reenmarca con el estilo visual del profesional creativo

Análisis de Proyección de Activación

Mediante análisis de cambios de activación proyectados en vectores de personalidad:

  1. Limitaciones del Método de Indicación: La indicación multi-rol es positiva en vCRE pero negativa en vENV, indicando incapacidad para inducir consistentemente todas las personalidades esperadas
  2. Ventajas de BILLY: Mantiene proyecciones positivas tanto en vCRE como en vENV, activando exitosamente múltiples personalidades
  3. Efectividad de Fusión de Vectores: Vectores únicos controlan precisamente conceptos semánticos correspondientes, vectores fusionados logran interacciones complejas

Trabajo Relacionado

Mejora de Creatividad en LLM

  1. Indicaciones de Juego de Rol: Guiar al modelo para adoptar personalidades creativas específicas
  2. Marcos de Colaboración Multi-Agente: Múltiples agentes simulando sesiones de lluvia de ideas
  3. Revisión Comprehensiva: Revisión completa de direcciones de investigación en creatividad

Colaboración Multi-LLM

  1. Marcos de Diálogo Estructurado: Como aplicaciones de próxima generación de AutoGen
  2. Diálogo de Juego de Rol: Discusión LLM y HOLLMWOOD
  3. Limitaciones: Alto costo computacional, inestabilidad, baja eficiencia

Técnicas de Orientación de Activación

  1. Control de Comportamiento: Influir en el comportamiento del modelo mediante modificación de activaciones internas
  2. Métodos Contrastivos: Cálculo de vectores de orientación usando diferencias de activación
  3. Campos de Aplicación: Mejora de autenticidad, mejora de seguridad, control de personalidad

Conclusiones y Discusión

Conclusiones Principales

  1. BILLY captura exitosamente las ventajas de creatividad de la colaboración multi-LLM dentro de un único modelo
  2. Reduce significativamente el tiempo de inferencia y costo computacional mientras mantiene o supera el rendimiento de creatividad
  3. La orientación de activación proporciona mejor controlabilidad e interpretabilidad que la indicación multi-rol

Limitaciones

  1. Método de Combinación de Vectores: Actualmente utiliza promedio simple, requiere técnicas de combinación más complejas en el futuro
  2. Interacciones No Lineales: El efecto de fusión de vectores de personalidad no es simplemente una superposición lineal
  3. Pesos Específicos de Tarea: Falta de mecanismo para aprender pesos específicos de tarea para cada vector de personalidad

Direcciones Futuras

  1. Desarrollar marcos complejos de combinación de vectores más allá del promedio simple
  2. Aprender pesos de vectores de personalidad específicos de tarea
  3. Diseñar mecanismos que modelen explícitamente roles funcionales para lograr control más preciso

Evaluación Profunda

Fortalezas

  1. Innovación Metodológica: Primera aplicación de fusión de vectores de personalidad para mejora de creatividad, ruta técnica novedosa
  2. Suficiencia Experimental: Evaluación comprehensiva multi-modelo y multi-referencia, incluyendo análisis de eficiencia, calidad e interpretabilidad
  3. Valor Práctico: Las mejoras significativas de eficiencia hacen que el método sea altamente práctico
  4. Perspectivas Teóricas: El análisis de proyección de activación revela las diferencias esenciales entre métodos de indicación y orientación de activación

Insuficiencias

  1. Teoría de Fusión de Vectores: Falta análisis teórico profundo sobre por qué el promedio simple es efectivo
  2. Limitaciones de Evaluación: Depende principalmente de evaluadores LLM, que pueden tener sesgos
  3. Capacidad de Generalización: Validación solo en tareas de creatividad, aplicabilidad en otras tareas desconocida
  4. Calidad de Vectores de Personalidad: La estabilidad y consistencia del proceso de extracción de vectores de personalidad requiere más verificación

Impacto

  1. Contribución al Campo: Proporciona una nueva ruta técnica para mejora de creatividad en LLM
  2. Valor Práctico: Reduce significativamente costos computacionales, promete impulsar el despliegue práctico de sistemas de IA multi-personalidad
  3. Reproducibilidad: El método es relativamente simple, fácil de reproducir y extender

Escenarios Aplicables

  1. Escritura Creativa: Creación de historias que requieren fusión de múltiples perspectivas
  2. Ideación de Diseño: Soluciones de diseño que combinan estética, funcionalidad y sostenibilidad
  3. Innovación Científica: Resolución de problemas de investigación que requieren pensamiento interdisciplinario
  4. Aplicaciones Educativas: Cultivo de capacidades de pensamiento diversificado en estudiantes

Referencias

El artículo cita abundante trabajo relacionado, incluyendo:

  • Investigación clásica en psicología de la creatividad (Torrance, 1966; Wallach & Kogan, 1965)
  • Avances recientes en sistemas multi-agente (Wu et al., 2023; Lu et al., 2024)
  • Desarrollo de técnicas de orientación de activación (Turner et al., 2024; Chen et al., 2025)

Evaluación General: Este es un artículo de alta calidad con contribuciones importantes en el campo de mejora de creatividad en LLM. El método BILLY resuelve ingeniosamente el problema de eficiencia de sistemas multi-LLM mientras mantiene ventajas de creatividad. Aunque hay espacio para mejora en análisis teórico y métodos de evaluación, su valor práctico e innovación técnica lo convierten en un progreso importante en este campo.