BILLY: Steering Large Language Models via Merging Persona Vectors for Creative Generation
Pai, Wang, Lu et al.
Multi-LLM systems enhance the creativity of large language models by simulating human collective intelligence but suffer from significant drawbacks, such as high computational costs and inference latency. To address these limitations, we propose BILLY (BlendIng persona vectors for Large Language model creativitY), a training-free framework that captures the benefits of multi-LLM collaboration, i.e. inducing diverse perspectives and specialized expertise, within a single model. BILLY operates by extracting and blending multiple distinct persona vectors directly in the model's activation space. We steer the model's generation process with this merged vector while inference, enabling multi-perspective output without explicit multi-LLM communication. Our experiments across creativity-oriented benchmarks demonstrate that BILLY surpasses single model prompting and traditional multi-LLM approaches, while substantially reducing inference time and computational costs. Our analyses further reveal that distinct persona vectors can be blended to achieve both effective control over complementary aspects of generation and greater interpretability.
academic
BILLY: Steuerung großer Sprachmodelle durch Zusammenführung von Persona-Vektoren für kreative Generierung
Multi-LLM-Systeme verbessern die Kreativität großer Sprachmodelle durch Simulation kollektiver menschlicher Intelligenz, weisen jedoch erhebliche Mängel wie hohe Rechenkosten und große Inferenzlatenzen auf. Um diese Einschränkungen zu beheben, wird BILLY (BlendIng persona vectors for Large Language model creativitY) vorgestellt – ein trainingsfreies Framework, das die Vorteile der Multi-LLM-Zusammenarbeit in einem einzelnen Modell erfasst, nämlich die Einführung diversifizierter Perspektiven und Fachwissen. BILLY funktioniert durch Extraktion und Zusammenführung mehrerer unterschiedlicher Persona-Vektoren im Aktivierungsraum des Modells und nutzt diesen zusammengeführten Vektor zur Laufzeit, um den Generierungsprozess des Modells zu steuern und so Multi-Perspektiven-Ausgaben ohne explizite Multi-LLM-Kommunikation zu ermöglichen.
Rechenlast von Multi-LLM-Systemen: Obwohl traditionelle Multi-LLM-Kooperationsrahmen die Kreativität verbessern, sind sie mit hohen Rechenkosten und Inferenzlatenzen behaftet
Einschränkungen einzelner Prompt-Methoden: Es ist schwierig, ein Modell durch Prompting dazu zu bringen, mehrere Rollen und Perspektiven gleichzeitig zu übernehmen und zu integrieren
Abwägung zwischen Effizienz und Kreativität: Wie lässt sich die Rechenlast erheblich reduzieren, während die Kreativitätsvorteile erhalten bleiben?
Kreativität wird weithin als Grundstein menschlichen Fortschritts anerkannt und treibt Innovationen in verschiedenen Bereichen voran. Aktuelle Forschungen untersuchen die Kreativität von LLMs als vielversprechendes Werkzeug für Anwendungen wie Geschichtenerzählung, Designkonzeption und wissenschaftliche Entdeckungen. Das Multi-LLM-Paradigma simuliert kollektive menschliche Intelligenz, indem mehrere LLMs iterativ diskutieren, um umfassendere Lösungen zu erhalten.
Multi-LLM-Frameworks: Hohe Rechenkosten, lange Inferenzzeiten, Prozessverluste
Einzelne Prompt-Methoden: Abhängig von der Fähigkeit des Modells, mehrere Rollen zu integrieren; in der Praxis kann das Modell jede Persona separat verarbeiten, aber Schwierigkeiten bei kohärenter Integration haben
Vorstellung des BILLY-Frameworks: Ein trainingsfreier Persona-Vektor-Zusammenführungsrahmen, der Multi-Perspektiven-kreative Antworten in einem einzelnen LLM ermöglicht
Effizienz und Einfachheit: Vollständig trainungsfrei, keine zusätzliche Feinabstimmung oder Multi-LLM-Kommunikation erforderlich, deutlich reduzierte Rechen- und Token-Kosten
Interpretierbare Mechanismen: Direkte Manipulation im latenten Aktivierungsraum bietet interpretierbare Kontrollmechanismen für Kreativität
Leistungsverbesserung: Übertrifft Single-Model-Prompting und traditionelle Multi-LLM-Methoden bei kreativitätsorientierten Benchmarks
Gegeben eine kreative Aufgabeneingabe zielt BILLY darauf ab, kreative Ausgaben zu generieren, die mehrere Fachperspektiven (wie Umweltschützer, kreative Fachleute, Futuristen) zusammenführen, während die Rechenkosten von Multi-LLM-Systemen vermieden werden.
Aktivierungsraum-Manipulation: Direkte Manipulation auf der Ebene der internen Modellrepräsentationen statt Abhängigkeit von externer Prompt-Engineering
Vektor-Zusammenführungsstrategie: Zusammenführung mehrerer Persona-Vektoren durch einfache Mittelwertbildung zur Realisierung komplexer Persona-Kombinationen
Trainingsfreies Design: Nur Vektoraddition zur Laufzeit, keine Änderung der Modellgewichte
Wiederverwendbarkeit: Persona-Vektoren werden einmal extrahiert und können mehrfach verwendet werden, wodurch Kosten amortisiert werden
Zusammengeführter Vektor: Echte Konzeptfusion, behält die substantiellen Konzepte des Umweltschützers bei, rahmt sie aber mit dem visuellen Stil des kreativen Fachmanns neu
Durch Analyse der Aktivierungsänderungen auf Persona-Vektoren:
Einschränkungen der Prompt-Methode: Multi-Rollen-Prompting ist positiv auf vCRE, aber negativ auf vENV, was zeigt, dass nicht alle erwarteten Personas konsistent induziert werden können
BILLY-Vorteile: Behält positive Projektion auf vCRE und vENV bei, aktiviert erfolgreich mehrere Personas
Methodische Innovation: Erstmalige Anwendung von Persona-Vektor-Fusion zur Kreativitätsverbesserung, neuartige technische Richtung
Umfassende Experimente: Vollständige Evaluierung über mehrere Modelle und Benchmarks, einschließlich Effizienz-, Qualitäts- und Interpretierbarkeitsanalyse
Praktischer Wert: Signifikante Effizienzverbesserungen machen die Methode praktisch wertvoll
Theoretische Einsichten: Aktivierungsprojektionsanalyse offenbart wesentliche Unterschiede zwischen Prompt-Methoden und Aktivierungssteuerung
Das Paper zitiert umfangreiche verwandte Arbeiten, einschließlich:
Klassische Forschungen zur Kreativitätspsychologie (Torrance, 1966; Wallach & Kogan, 1965)
Neueste Entwicklungen in Multi-Agent-Systemen (Wu et al., 2023; Lu et al., 2024)
Entwicklung von Aktivierungssteuertechniken (Turner et al., 2024; Chen et al., 2025)
Gesamtbewertung: Dies ist ein hochqualitatives Paper mit wichtigen Beiträgen im Bereich der LLM-Kreativitätsverbesserung. Die BILLY-Methode löst elegant das Effizienzproblem von Multi-LLM-Systemen, während sie die Kreativitätsvorteile bewahrt. Obwohl es Raum für Verbesserungen in theoretischer Analyse und Bewertungsmethoden gibt, machen sein praktischer Wert und seine technische Innovation es zu einem wichtigen Fortschritt in diesem Bereich.