BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
다중 LLM 시스템은 인간의 집단 지성을 모방하여 대규모 언어 모델의 창의성을 향상시키지만, 높은 계산 비용과 큰 추론 지연이라는 심각한 결함이 존재합니다. 이러한 제한을 해결하기 위해 본 논문은 BILLY(BlendIng persona vectors for Large Language model creativitY)를 제안합니다. 이는 학습 없이 단일 모델 내에서 다중 LLM 협업의 이점, 즉 다양한 관점과 전문 지식의 도입을 포착할 수 있는 프레임워크입니다. BILLY는 모델 활성화 공간에서 여러 개의 서로 다른 페르소나 벡터를 추출하고 병합함으로써 작동하며, 추론 시 이 병합된 벡터를 사용하여 모델의 생성 과정을 조종하여 명시적인 다중 LLM 통신 없이 다중 관점 출력을 실현합니다.
창의성은 인간 진보의 기초로 널리 인식되어 있으며, 다양한 분야의 혁신을 주도합니다. 최근 연구는 LLM의 창의성을 탐구하여 이를 스토리 작성, 설계 구상 및 과학 발견 등의 응용 분야에서 유망한 도구로 간주합니다. 다중 LLM 패러다임은 인간의 집단 지성을 모방하여 여러 LLM이 반복적인 토론을 통해 더욱 포괄적인 솔루션을 얻도록 합니다.
창의성 심리학 고전 연구(Torrance, 1966; Wallach & Kogan, 1965)
다중 에이전트 시스템 최신 진전(Wu et al., 2023; Lu et al., 2024)
활성화 조종 기술 발전(Turner et al., 2024; Chen et al., 2025)
종합 평가: 이는 LLM 창의성 향상 분야에서 중요한 기여를 하는 고품질 논문입니다. BILLY 방법은 다중 LLM 시스템의 효율성 문제를 교묘하게 해결하면서 창의성 이점을 유지합니다. 이론 분석 및 평가 방법에서 개선의 여지가 있지만, 실용적 가치와 기술 혁신성으로 인해 해당 분야의 중요한 진전이 됩니다.