BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
academic
BILLY: Orientación de Modelos de Lenguaje Grande mediante Fusión de Vectores de Personalidad para Generación Creativa
Los sistemas multi-LLM mejoran la creatividad de los modelos de lenguaje grande mediante la simulación de la inteligencia colectiva humana, pero presentan deficiencias significativas en costo computacional y latencia de inferencia. Para resolver estas limitaciones, este artículo propone BILLY (BlendIng persona vectors for Large Language model creativitY), un marco sin entrenamiento que captura las ventajas de la colaboración multi-LLM dentro de un único modelo, es decir, la introducción de perspectivas diversificadas y conocimiento especializado. BILLY opera mediante la extracción y fusión de múltiples vectores de personalidad distintos en el espacio de activación del modelo, utilizando este vector fusionado durante la inferencia para guiar el proceso de generación del modelo, logrando salidas multi-perspectiva sin requerir comunicación explícita entre múltiples LLM.
Carga Computacional de Sistemas Multi-LLM: Aunque los marcos tradicionales de colaboración multi-LLM mejoran la creatividad, presentan problemas de alto costo computacional y latencia de inferencia
Limitaciones de Métodos de Indicación Única: Hacer que un modelo adopte múltiples roles y perspectivas simultáneamente únicamente mediante indicaciones presenta dificultades de integración
Equilibrio entre Eficiencia y Creatividad: Cómo reducir significativamente la sobrecarga computacional mientras se mantienen las ventajas de creatividad
La creatividad es ampliamente reconocida como la piedra angular del progreso humano, impulsando la innovación en diversos campos. Investigaciones recientes han explorado la creatividad de los LLM, considerándola como una herramienta prometedora para aplicaciones como escritura de historias, ideación de diseño y descubrimiento científico. El paradigma multi-LLM, mediante la simulación de la inteligencia colectiva humana, permite que múltiples LLM participen en discusiones iterativas para obtener soluciones más comprehensivas.
Marcos Multi-LLM: Alto costo computacional, tiempo de inferencia prolongado, presencia de pérdida de proceso
Métodos de Indicación Única: Dependen de la capacidad del modelo para integrar múltiples roles, pero en la práctica el modelo puede procesar cada personalidad por separado sin lograr una integración coherente
Propuesta del Marco BILLY: Un marco de fusión de vectores de personalidad sin entrenamiento que logra respuestas creativas multi-perspectiva dentro de un único LLM
Eficiencia y Simplicidad: Completamente sin entrenamiento, sin necesidad de ajuste fino adicional o comunicación multi-LLM, reduciendo significativamente los costos computacionales y de tokens
Mecanismo de Interpretabilidad: Operación directa en el espacio de activación latente, proporcionando un mecanismo interpretable de control de creatividad
Mejora de Rendimiento: Supera los métodos de indicación de modelo único y los enfoques multi-LLM tradicionales en pruebas de referencia orientadas a la creatividad
Dado un entrada de tarea creativa, BILLY tiene como objetivo generar salidas creativas que fusionen múltiples perspectivas especializadas (como ambientalista, profesional creativo, futurista) mientras se evita la sobrecarga computacional de sistemas multi-LLM.
Operación en Espacio de Activación: Operación directa a nivel de representación interna del modelo, en lugar de depender de ingeniería de indicaciones externa
Estrategia de Fusión de Vectores: Fusión de múltiples vectores de personalidad mediante promedio simple, logrando combinaciones de personalidades complejas
Diseño Sin Entrenamiento: Solo se añaden vectores durante la inferencia, sin modificar los pesos del modelo
Reutilizabilidad: Los vectores de personalidad se extraen una vez y pueden utilizarse múltiples veces, amortizando costos
Tomando como ejemplo la tarea "Rediseñar un Hospital":
Vector Ambientalista: Genera planos prácticos (como jardines comunitarios)
Vector Profesional Creativo: Produce terminología artística (como ecosistemas bioluminiscentes)
Vector Fusionado: Verdadera fusión conceptual, retiene conceptos sustanciales del ambientalista pero reenmarca con el estilo visual del profesional creativo
Mediante análisis de cambios de activación proyectados en vectores de personalidad:
Limitaciones del Método de Indicación: La indicación multi-rol es positiva en vCRE pero negativa en vENV, indicando incapacidad para inducir consistentemente todas las personalidades esperadas
Ventajas de BILLY: Mantiene proyecciones positivas tanto en vCRE como en vENV, activando exitosamente múltiples personalidades
Efectividad de Fusión de Vectores: Vectores únicos controlan precisamente conceptos semánticos correspondientes, vectores fusionados logran interacciones complejas
Innovación Metodológica: Primera aplicación de fusión de vectores de personalidad para mejora de creatividad, ruta técnica novedosa
Suficiencia Experimental: Evaluación comprehensiva multi-modelo y multi-referencia, incluyendo análisis de eficiencia, calidad e interpretabilidad
Valor Práctico: Las mejoras significativas de eficiencia hacen que el método sea altamente práctico
Perspectivas Teóricas: El análisis de proyección de activación revela las diferencias esenciales entre métodos de indicación y orientación de activación
El artículo cita abundante trabajo relacionado, incluyendo:
Investigación clásica en psicología de la creatividad (Torrance, 1966; Wallach & Kogan, 1965)
Avances recientes en sistemas multi-agente (Wu et al., 2023; Lu et al., 2024)
Desarrollo de técnicas de orientación de activación (Turner et al., 2024; Chen et al., 2025)
Evaluación General: Este es un artículo de alta calidad con contribuciones importantes en el campo de mejora de creatividad en LLM. El método BILLY resuelve ingeniosamente el problema de eficiencia de sistemas multi-LLM mientras mantiene ventajas de creatividad. Aunque hay espacio para mejora en análisis teórico y métodos de evaluación, su valor práctico e innovación técnica lo convierten en un progreso importante en este campo.