BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
academic
BILLY : Diriger les Grands Modèles de Langage via la Fusion de Vecteurs de Persona pour la Génération Créative
Les systèmes multi-LLM améliorent la créativité des grands modèles de langage en simulant la sagesse collective humaine, mais présentent des défauts importants tels que des coûts de calcul élevés et des latences d'inférence importantes. Pour résoudre ces limitations, cet article propose BILLY (BlendIng persona vectors for Large Language model creativitY), un cadre sans entraînement capable de capturer les avantages de la collaboration multi-LLM au sein d'un modèle unique, à savoir l'introduction de perspectives diversifiées et d'expertise. BILLY fonctionne en extrayant et en fusionnant plusieurs vecteurs de persona distincts dans l'espace d'activation du modèle, en utilisant ce vecteur fusionné au moment de l'inférence pour guider le processus de génération du modèle, réalisant ainsi une sortie multi-perspectives sans communication multi-LLM explicite.
Charge de calcul des systèmes multi-LLM : Bien que les cadres de collaboration multi-LLM traditionnels améliorent la créativité, ils présentent des problèmes de coûts de calcul élevés et de latence d'inférence
Limitations des méthodes de simple incitation : Faire adopter simultanément plusieurs rôles et perspectives à un modèle par simple incitation présente des difficultés d'intégration
Compromis entre efficacité et créativité : Comment réduire considérablement les frais généraux de calcul tout en conservant les avantages créatifs
La créativité est largement reconnue comme la pierre angulaire du progrès humain, stimulant l'innovation dans tous les domaines. Les recherches récentes explorent la créativité des LLM, la considérant comme un outil prometteur pour des applications telles que la rédaction d'histoires, l'idéation de conception et la découverte scientifique. Le paradigme multi-LLM, en simulant la sagesse collective humaine, permet à plusieurs LLM de participer à des discussions itératives pour obtenir des solutions plus complètes.
Cadres multi-LLM : Coûts de calcul élevés, temps d'inférence long, présence de pertes de processus
Méthodes de simple incitation : Dépendent de la capacité du modèle à intégrer plusieurs rôles, mais en pratique, le modèle peut traiter chaque persona séparément sans intégration cohérente
Proposition du cadre BILLY : Un cadre de fusion de vecteurs de persona sans entraînement capable de réaliser des réponses créatives multi-perspectives au sein d'un seul LLM
Efficacité et Simplicité : Complètement sans entraînement, ne nécessitant aucun affinage supplémentaire ou communication multi-LLM, réduisant considérablement les coûts de calcul et de tokens
Mécanisme d'Interprétabilité : Opère directement dans l'espace d'activation latente, fournissant un mécanisme de contrôle créatif interprétable
Amélioration des Performances : Surpasse les méthodes de simple incitation monomodèle et les approches multi-LLM traditionnelles sur les benchmarks orientés créativité
Étant donné une entrée de tâche créative, BILLY vise à générer une sortie créative fusionnant plusieurs perspectives professionnelles (telles que l'écologiste, le professionnel créatif, le futuriste) tout en évitant les frais généraux de calcul des systèmes multi-LLM.
Opération dans l'Espace d'Activation : Opère directement au niveau des représentations internes du modèle, plutôt que de dépendre de l'ingénierie d'incitation externe
Stratégie de Fusion de Vecteurs : Fusionne plusieurs vecteurs de persona via une simple moyenne, réalisant des combinaisons de personas complexes
Conception Sans Entraînement : Ajoute uniquement des vecteurs au moment de l'inférence sans modifier les poids du modèle
Réutilisabilité : Les vecteurs de persona sont extraits une fois et peuvent être utilisés plusieurs fois, amortissant les coûts
Vecteur d'écologiste : Génère des plans pratiques (comme des jardins communautaires)
Vecteur de professionnel créatif : Produit une terminologie riche en art (comme les écosystèmes bioluminescents)
Vecteur fusionné : Véritable fusion conceptuelle, conservant les concepts substantiels de l'écologiste mais les recadrant avec le style visuel du professionnel créatif
Par l'analyse de la projection des changements d'activation sur les vecteurs de persona :
Limitations de la Méthode d'Incitation : L'incitation multi-rôles est positive sur vCRE mais négative sur vENV, indiquant l'incapacité à induire de manière cohérente toutes les personas attendues
Avantages de BILLY : Maintient une projection positive sur vCRE et vENV, activant avec succès plusieurs personas
Efficacité de la Fusion de Vecteurs : Un seul vecteur contrôle précisément les concepts sémantiques correspondants, le vecteur fusionné réalisant des interactions complexes
Innovativité de la Méthode : Première application de la fusion de vecteurs de persona à l'amélioration de la créativité, approche technique novatrice
Suffisance Expérimentale : Évaluation complète sur plusieurs modèles et benchmarks, incluant l'analyse de l'efficacité, de la qualité et de l'interprétabilité
Valeur Pratique : Les améliorations d'efficacité significatives confèrent à la méthode une forte valeur pratique
Perspectives Théoriques : L'analyse de projection d'activation révèle les différences essentielles entre la méthode d'incitation et le guidage d'activation
Théorie de la Fusion de Vecteurs : Manque d'analyse théorique approfondie sur les raisons de l'efficacité de la simple moyenne
Limitations d'Évaluation : Dépend principalement d'évaluateurs LLM, pouvant présenter des biais
Capacité de Généralisation : Validée uniquement sur des tâches de créativité, l'applicabilité à d'autres tâches reste inconnue
Qualité des Vecteurs de Persona : La stabilité et la cohérence du processus d'extraction des vecteurs de persona nécessitent une validation supplémentaire
L'article cite des travaux connexes abondants, incluant :
Recherches classiques en psychologie de la créativité (Torrance, 1966 ; Wallach & Kogan, 1965)
Progrès récents en systèmes multi-agents (Wu et al., 2023 ; Lu et al., 2024)
Développement des techniques de guidage d'activation (Turner et al., 2024 ; Chen et al., 2025)
Évaluation Globale : Cet article constitue une contribution importante et de haute qualité dans le domaine de l'amélioration de la créativité des LLM. La méthode BILLY résout intelligemment le problème d'efficacité des systèmes multi-LLM tout en conservant les avantages créatifs. Bien qu'il y ait encore place à l'amélioration dans l'analyse théorique et les méthodes d'évaluation, sa valeur pratique et son innovativité technique en font un progrès important dans ce domaine.