2025-11-22T07:58:16.571206

BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation

Pai, Wang, Lu et al.

Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.

academic

BILLY : Diriger les Grands Modèles de Langage via la Fusion de Vecteurs de Persona pour la Génération Créative

Informations Fondamentales

ID de l'article : 2510.10157
Titre : BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Auteurs : Tsung-Min Pai, Jui-I Wang, Li-Chun Lu, Shao-Hua Sun, Hung-Yi Lee, Kai-Wei Chang
Classification : cs.CL cs.AI
Date de publication : 11 octobre 2025 (prépublication arXiv)
Lien de l'article : https://arxiv.org/abs/2510.10157v1

Résumé

Les systèmes multi-LLM améliorent la créativité des grands modèles de langage en simulant la sagesse collective humaine, mais présentent des défauts importants tels que des coûts de calcul élevés et des latences d'inférence importantes. Pour résoudre ces limitations, cet article propose BILLY (BlendIng persona vectors for Large Language model creativitY), un cadre sans entraînement capable de capturer les avantages de la collaboration multi-LLM au sein d'un modèle unique, à savoir l'introduction de perspectives diversifiées et d'expertise. BILLY fonctionne en extrayant et en fusionnant plusieurs vecteurs de persona distincts dans l'espace d'activation du modèle, en utilisant ce vecteur fusionné au moment de l'inférence pour guider le processus de génération du modèle, réalisant ainsi une sortie multi-perspectives sans communication multi-LLM explicite.

Contexte de la Recherche et Motivation

Problèmes Fondamentaux

Charge de calcul des systèmes multi-LLM : Bien que les cadres de collaboration multi-LLM traditionnels améliorent la créativité, ils présentent des problèmes de coûts de calcul élevés et de latence d'inférence
Limitations des méthodes de simple incitation : Faire adopter simultanément plusieurs rôles et perspectives à un modèle par simple incitation présente des difficultés d'intégration
Compromis entre efficacité et créativité : Comment réduire considérablement les frais généraux de calcul tout en conservant les avantages créatifs

Importance de la Recherche

La créativité est largement reconnue comme la pierre angulaire du progrès humain, stimulant l'innovation dans tous les domaines. Les recherches récentes explorent la créativité des LLM, la considérant comme un outil prometteur pour des applications telles que la rédaction d'histoires, l'idéation de conception et la découverte scientifique. Le paradigme multi-LLM, en simulant la sagesse collective humaine, permet à plusieurs LLM de participer à des discussions itératives pour obtenir des solutions plus complètes.

Limitations des Approches Existantes

Cadres multi-LLM : Coûts de calcul élevés, temps d'inférence long, présence de pertes de processus
Méthodes de simple incitation : Dépendent de la capacité du modèle à intégrer plusieurs rôles, mais en pratique, le modèle peut traiter chaque persona séparément sans intégration cohérente

Contributions Fondamentales

Proposition du cadre BILLY : Un cadre de fusion de vecteurs de persona sans entraînement capable de réaliser des réponses créatives multi-perspectives au sein d'un seul LLM
Efficacité et Simplicité : Complètement sans entraînement, ne nécessitant aucun affinage supplémentaire ou communication multi-LLM, réduisant considérablement les coûts de calcul et de tokens
Mécanisme d'Interprétabilité : Opère directement dans l'espace d'activation latente, fournissant un mécanisme de contrôle créatif interprétable
Amélioration des Performances : Surpasse les méthodes de simple incitation monomodèle et les approches multi-LLM traditionnelles sur les benchmarks orientés créativité

Détails de la Méthode

Définition de la Tâche

Étant donné une entrée de tâche créative, BILLY vise à générer une sortie créative fusionnant plusieurs perspectives professionnelles (telles que l'écologiste, le professionnel créatif, le futuriste) tout en évitant les frais généraux de calcul des systèmes multi-LLM.

Architecture du Modèle

1. Extraction de Vecteurs de Persona (Activation Contrastive)

Pour une persona P, le vecteur de persona est extrait via une méthode contrastive :

v⃗(l)_P = (1/|D+_P|) ∑(x∈D+_P) a⃗(l)(x) - (1/|D-_P|) ∑(x∈D-_P) a⃗(l)(x)

Où :

D+_P : ensemble de réponses présentant les caractéristiques de cette persona
D-_P : ensemble de réponses de base manquant de ces caractéristiques
a⃗(l)(x) : activation du flux résiduel moyen des tokens à la couche l

2. Fusion Hors Ligne (Offline Fusion)

Fusion de N vecteurs de persona en un seul vecteur composite :

v⃗(l)_merged = (1/N) ∑(i=1 to N) v⃗(l)_i

3. Guidage au Moment de l'Inférence (Inference-time Steering)

Modification des activations au moment de l'inférence :

a⃗(l)_steered = a⃗(l)_original + α · v⃗(l)_merged

Où α est un coefficient d'échelle, et la couche 20 est sélectionnée pour le guidage dans les expériences.

Points d'Innovation Technique

Opération dans l'Espace d'Activation : Opère directement au niveau des représentations internes du modèle, plutôt que de dépendre de l'ingénierie d'incitation externe
Stratégie de Fusion de Vecteurs : Fusionne plusieurs vecteurs de persona via une simple moyenne, réalisant des combinaisons de personas complexes
Conception Sans Entraînement : Ajoute uniquement des vecteurs au moment de l'inférence sans modifier les poids du modèle
Réutilisabilité : Les vecteurs de persona sont extraits une fois et peuvent être utilisés plusieurs fois, amortissant les coûts

Configuration Expérimentale

Ensembles de Données

Benchmark étendu basé sur le test de créativité Wallach-Kogan, amélioré par GPT-4 par Lu et al. :

AUT : Demande de fournir des utilisations innovantes et pratiques pour des objets quotidiens
INSTANCES : Énumération d'objets selon des critères spécifiques
SIMILARITIES : Identification des connexions ou similitudes entre objets
SCIENTIFIC : Génération de solutions créatives pour des problèmes scientifiques

Métriques d'Évaluation

Adoption de deux indicateurs fondamentaux du Test de Pensée Créative de Torrance (TTCT) :

Originalité (Originality) : Évalue la rareté statistique ou le caractère non conventionnel de la réponse
Élaboration (Elaboration) : Mesure le niveau de détail et d'information de soutien de la réponse

Utilisation de GPT-4o-mini comme évaluateur LLM, avec une échelle de notation de 1 à 5.

Méthodes de Comparaison

Single Agent (SA) : Réponse créative d'un seul LLM (température 0,7)
SA (T=1.0) : Agent unique avec décodage à haute température (température 1,0)
SA-MRP : Agent unique avec incitation multi-rôles
LLM Discussion : Cadre multi-LLM avec processus de discussion structuré en trois étapes

Détails d'Implémentation

Modèles de base : Qwen-2.5-7B-Instruct, Llama-3.1-8B-Instruct, Gemma-3-4B-it
Couche de guidage : Couche 20
Vecteurs de persona : Écologiste, professionnel créatif, futuriste, penseur analytique, etc.
Évaluation : 100 requêtes par benchmark, calcul de la moyenne et de l'écart-type

Résultats Expérimentaux

Résultats Principaux

Sur quatre benchmarks de créativité, BILLY surpasse constamment toutes les méthodes de base sur la métrique d'originalité :

Scores d'Originalité pour la Tâche AUT :

Qwen-2.5-7B : BILLY (4,71) > LLM Discussion (4,24) > SA-MRP (4,07) > SA (4,03)
Llama-3.1-8B : BILLY (4,38) > LLM Discussion (4,21) > SA-MRP (4,05) > SA (3,73)
Gemma-3-4B : BILLY (4,99) > SA-MRP (4,96) > SA (4,79) > LLM Discussion (3,70)

Comparaison d'Efficacité :

Latence d'inférence : BILLY (19s) vs LLM Discussion (513s), environ 25 fois plus rapide
Coût en tokens : BILLY réduit l'utilisation de tokens de plus de 95%
Coût pour 10 000 requêtes : BILLY ( $0,30) vs LLM Discussion ($ 25,50)

Expériences d'Ablation

Analyse de la Combinaison de Vecteurs de Persona :

Un seul vecteur de professionnel créatif montre déjà une excellente performance créative
L'augmentation de 1 à 3 vecteurs apporte une amélioration significative
L'augmentation supplémentaire de 4 à 7 vecteurs n'apporte pas de bénéfices supplémentaires significatifs

Analyse de Cas

Exemple de tâche « Repenser l'hôpital » :

Vecteur d'écologiste : Génère des plans pratiques (comme des jardins communautaires)
Vecteur de professionnel créatif : Produit une terminologie riche en art (comme les écosystèmes bioluminescents)
Vecteur fusionné : Véritable fusion conceptuelle, conservant les concepts substantiels de l'écologiste mais les recadrant avec le style visuel du professionnel créatif

Analyse de Projection d'Activation

Par l'analyse de la projection des changements d'activation sur les vecteurs de persona :

Limitations de la Méthode d'Incitation : L'incitation multi-rôles est positive sur vCRE mais négative sur vENV, indiquant l'incapacité à induire de manière cohérente toutes les personas attendues
Avantages de BILLY : Maintient une projection positive sur vCRE et vENV, activant avec succès plusieurs personas
Efficacité de la Fusion de Vecteurs : Un seul vecteur contrôle précisément les concepts sémantiques correspondants, le vecteur fusionné réalisant des interactions complexes

Travaux Connexes

Amélioration de la Créativité des LLM

Incitation au Jeu de Rôle : Guide le modèle à adopter des personas créatives spécifiques
Cadres de Collaboration Multi-Agents : Plusieurs agents simulant des séances de remue-méninges
Revue Synthétique : Examen complet des directions de recherche en créativité

Collaboration Multi-LLM

Cadres de Dialogue Structuré : Comme les applications de nouvelle génération d'AutoGen
Dialogue de Jeu de Rôle : LLM Discussion et HOLLMWOOD
Limitations : Coûts de calcul élevés, instabilité, inefficacité

Techniques de Guidage d'Activation

Contrôle Comportemental : Influence le comportement du modèle en modifiant les activations internes
Méthodes Contrastives : Calcule les vecteurs de guidage en utilisant les différences d'activation
Domaines d'Application : Amélioration de l'authenticité, amélioration de la sécurité, contrôle de la persona

Conclusion et Discussion

Conclusions Principales

BILLY capture avec succès les avantages créatifs de la collaboration multi-LLM au sein d'un modèle unique
Réduit considérablement le temps d'inférence et les coûts de calcul tout en maintenant ou en surpassant les performances créatives
Le guidage d'activation offre un meilleur contrôle et une meilleure interprétabilité que l'incitation multi-rôles

Limitations

Méthode de Combinaison de Vecteurs : Utilise actuellement une simple moyenne, nécessitant à l'avenir des techniques de combinaison plus complexes
Interactions Non-Linéaires : L'effet de fusion des vecteurs de persona n'est pas une simple superposition linéaire
Poids Spécifiques à la Tâche : Absence de mécanisme pour apprendre des poids spécifiques à la tâche pour chaque vecteur de persona

Directions Futures

Développer des cadres de combinaison de vecteurs complexes au-delà de la simple moyenne
Apprendre des poids de vecteurs de persona spécifiques à la tâche
Concevoir des mécanismes modélisant explicitement les rôles fonctionnels pour un contrôle plus précis

Évaluation Approfondie

Points Forts

Innovativité de la Méthode : Première application de la fusion de vecteurs de persona à l'amélioration de la créativité, approche technique novatrice
Suffisance Expérimentale : Évaluation complète sur plusieurs modèles et benchmarks, incluant l'analyse de l'efficacité, de la qualité et de l'interprétabilité
Valeur Pratique : Les améliorations d'efficacité significatives confèrent à la méthode une forte valeur pratique
Perspectives Théoriques : L'analyse de projection d'activation révèle les différences essentielles entre la méthode d'incitation et le guidage d'activation

Insuffisances

Théorie de la Fusion de Vecteurs : Manque d'analyse théorique approfondie sur les raisons de l'efficacité de la simple moyenne
Limitations d'Évaluation : Dépend principalement d'évaluateurs LLM, pouvant présenter des biais
Capacité de Généralisation : Validée uniquement sur des tâches de créativité, l'applicabilité à d'autres tâches reste inconnue
Qualité des Vecteurs de Persona : La stabilité et la cohérence du processus d'extraction des vecteurs de persona nécessitent une validation supplémentaire

Impact

Contribution au Domaine : Fournit une nouvelle voie technique pour l'amélioration de la créativité des LLM
Valeur Pratique : Réduit considérablement les coûts de calcul, promettant le déploiement pratique de systèmes d'IA multi-personas
Reproductibilité : La méthode est relativement simple et facile à reproduire et étendre

Scénarios d'Application

Rédaction Créative : Création d'histoires nécessitant la fusion de multiples perspectives
Idéation de Conception : Solutions de conception combinant l'esthétique, la fonctionnalité et la durabilité
Innovation Scientifique : Résolution de problèmes de recherche nécessitant une pensée interdisciplinaire
Applications Éducatives : Cultiver la capacité de pensée diversifiée des étudiants

Références Bibliographiques

L'article cite des travaux connexes abondants, incluant :

Recherches classiques en psychologie de la créativité (Torrance, 1966 ; Wallach & Kogan, 1965)
Progrès récents en systèmes multi-agents (Wu et al., 2023 ; Lu et al., 2024)
Développement des techniques de guidage d'activation (Turner et al., 2024 ; Chen et al., 2025)

Évaluation Globale : Cet article constitue une contribution importante et de haute qualité dans le domaine de l'amélioration de la créativité des LLM. La méthode BILLY résout intelligemment le problème d'efficacité des systèmes multi-LLM tout en conservant les avantages créatifs. Bien qu'il y ait encore place à l'amélioration dans l'analyse théorique et les méthodes d'évaluation, sa valeur pratique et son innovativité technique en font un progrès important dans ce domaine.