BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
academic
BILLY: توجيه نماذج اللغة الكبيرة عبر دمج متجهات الشخصية للإنشاء الإبداعي
تعزز أنظمة النماذج المتعددة الإبداع في نماذج اللغة الكبيرة من خلال محاكاة الحكمة الجماعية البشرية، لكنها تعاني من تكاليف حسابية عالية وتأخير استدلالي كبير. لحل هذه القيود، تقترح هذه الورقة BILLY (دمج متجهات الشخصية لإبداعية نموذج اللغة الكبيرة)، وهو إطار عمل خالٍ من التدريب يمكنه التقاط مزايا التعاون متعدد النماذج داخل نموذج واحد، أي إدخال وجهات نظر متنوعة والخبرة المتخصصة. يعمل BILLY من خلال استخراج ودمج متجهات شخصية متعددة مختلفة في فضاء التنشيط النموذجي، باستخدام المتجه المدمج في وقت الاستدلال لتوجيه عملية الإنشاء، مما يحقق مخرجات متعددة الآفاق دون الحاجة إلى اتصال صريح بين نماذج متعددة.
العبء الحسابي لأنظمة النماذج المتعددة: على الرغم من أن أطر العمل التعاونية متعددة النماذج التقليدية تعزز الإبداع، إلا أنها تعاني من تكاليف حسابية عالية ومشاكل تأخير الاستدلال
قيود طرق الطلب الفردية: محاولة جعل النموذج يتبنى أدوار وجهات نظر متعددة في نفس الوقت من خلال الطلب وحده يواجه صعوبات في التكامل
المقارنة بين الكفاءة والإبداع: كيفية تقليل النفقات الحسابية بشكل كبير مع الحفاظ على مزايا الإبداع
يُعترف على نطاق واسع بأن الإبداع هو حجر الأساس للتقدم البشري، مما يدفع الابتكار في جميع المجالات. تستكشف الأبحاث الحديثة إبداعية نماذج اللغة الكبيرة، معتبرة إياها أداة واعدة لتطبيقات مثل كتابة القصص والتصميم الفكري واكتشاف العلوم. يحاكي نموذج النماذج المتعددة الحكمة الجماعية البشرية، مما يسمح بنقاش تكراري بين نماذج متعددة للحصول على حلول أكثر شمولاً.
بالنظر إلى مدخل مهمة إبداعية، يهدف BILLY إلى إنشاء مخرجات إبداعية تدمج وجهات نظر متخصصة متعددة (مثل البيئيين والمهنيين الإبداعيين والمستقبليين)، مع تجنب النفقات الحسابية لأنظمة النماذج المتعددة.
البحث الكلاسيكي في علم نفس الإبداع (Torrance, 1966; Wallach & Kogan, 1965)
أحدث التطورات في أنظمة الوكلاء المتعددين (Wu et al., 2023; Lu et al., 2024)
تطور تقنيات التوجيه النشط (Turner et al., 2024; Chen et al., 2025)
التقييم الشامل: هذه ورقة عالية الجودة ذات مساهمة مهمة في مجال تعزيز إبداعية نماذج اللغة الكبيرة. تحل طريقة BILLY بذكاء مشكلة الكفاءة في أنظمة النماذج المتعددة، مع الحفاظ على مزايا الإبداع. على الرغم من وجود مجال للتحسين في التحليل النظري وطرق التقييم، فإن قيمتها العملية والابتكار التقني يجعلانها تقدماً مهماً في هذا المجال.