BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
academic
BILLY: Управление большими языковыми моделями посредством объединения векторов персоны для творческого поколения
Системы с несколькими БЯМ повышают креативность больших языковых моделей путём моделирования коллективного интеллекта человека, однако имеют значительные недостатки в виде высоких вычислительных затрат и большой задержки при выводе. Для решения этих ограничений в данной работе предлагается BILLY (BlendIng persona vectors for Large Language model creativitY) — беспроцессный фреймворк, позволяющий захватить преимущества сотрудничества нескольких БЯМ в рамках единой модели, включая введение разнообразных перспектив и специализированных знаний. BILLY работает путём извлечения и объединения нескольких различных векторов персоны в пространстве активаций модели, используя объединённый вектор во время вывода для управления процессом генерации, обеспечивая многоперспективный вывод без явной коммуникации между несколькими БЯМ.
Вычислительная нагрузка систем с несколькими БЯМ: Традиционные фреймворки сотрудничества нескольких БЯМ, хотя и повышают креативность, имеют высокие вычислительные затраты и задержку при выводе
Ограничения методов с единственным промптом: Попытка заставить модель одновременно принять несколько ролей и перспектив через промптирование сталкивается с трудностями интеграции
Компромисс между эффективностью и креативностью: Как значительно снизить вычислительные затраты, сохраняя преимущества креативности
Креативность широко признана краеугольным камнем человеческого прогресса, движущей силой инноваций во всех областях. Недавние исследования изучали креативность БЯМ, рассматривая её как перспективный инструмент для приложений, таких как написание рассказов, дизайн-мышление и научные открытия. Парадигма с несколькими БЯМ, моделируя коллективный интеллект человека, позволяет нескольким БЯМ проводить итеративное обсуждение для получения более полных решений.
Фреймворки с несколькими БЯМ: Высокие вычислительные затраты, длительное время вывода, наличие потерь процесса (process loss)
Методы с единственным промптом: Зависят от способности модели интегрировать несколько ролей; на практике модель может обрабатывать каждую персону отдельно, но с трудом интегрировать их согласованно
Предложение фреймворка BILLY: Беспроцессный фреймворк объединения векторов персоны, обеспечивающий многоперспективные творческие ответы в рамках единой БЯМ
Эффективность и простота: Полностью беспроцессный, не требует дополнительной тонкой настройки или коммуникации между несколькими БЯМ, значительно снижает вычислительные и токен-затраты
Механизм интерпретируемости: Прямое управление в пространстве скрытых активаций обеспечивает интерпретируемый механизм управления креативностью
Повышение производительности: Превосходит методы с единственным промптом и традиционные подходы с несколькими БЯМ на бенчмарках, ориентированных на креативность
Учитывая входные данные творческой задачи, BILLY нацелена на генерацию творческого вывода, объединяющего несколько специализированных перспектив (например, экологиста, творческого профессионала, футуролога), избегая при этом вычислительных затрат систем с несколькими БЯМ.
Посредством анализа проекции изменений активаций на векторы персоны:
Ограничения метода с промптом: Многоролевой промпт положителен на vCRE, но отрицателен на vENV, указывая на неспособность последовательно индуцировать все предполагаемые персоны
Преимущества BILLY: Сохраняет положительную проекцию как на vCRE, так и на vENV, успешно совместно активируя несколько персон
Эффективность объединения векторов: Единственный вектор обеспечивает точное управление соответствующей семантической концепцией, объединённый вектор реализует сложные взаимодействия
Статья цитирует богатый объём связанных работ, включая:
Классические исследования психологии креативности (Torrance, 1966; Wallach & Kogan, 1965)
Последние достижения в системах с несколькими агентами (Wu et al., 2023; Lu et al., 2024)
Развитие техник управления активациями (Turner et al., 2024; Chen et al., 2025)
Общая оценка: Это высококачественная статья, вносящая значительный вклад в область повышения креативности БЯМ. Метод BILLY умело решает проблему эффективности систем с несколькими БЯМ, сохраняя при этом преимущества креативности. Хотя существует пространство для улучшения в теоретическом анализе и методах оценки, её практическая ценность и техническая инновационность делают её важным прогрессом в этой области.