LLM Agents Beyond Utility: An Open-Ended Perspective
Nachkov, Wang, Van Gool
Recent LLM agents have made great use of chain of thought reasoning and function calling. As their capabilities grow, an important question arises: can this software represent not only a smart problem-solving tool, but an entity in its own right, that can plan, design immediate tasks, and reason toward broader, more ambiguous goals? To study this question, we adopt an open-ended experimental setting where we augment a pretrained LLM agent with the ability to generate its own tasks, accumulate knowledge, and interact extensively with its environment. We study the resulting open-ended agent qualitatively. It can reliably follow complex multi-step instructions, store and reuse information across runs, and propose and solve its own tasks, though it remains sensitive to prompt design, prone to repetitive task generation, and unable to form self-representations. These findings illustrate both the promise and current limits of adapting pretrained LLMs toward open-endedness, and point to future directions for training agents to manage memory, explore productively, and pursue abstract long-term goals.
academic
LLM-Agenten Jenseits von Nutzen: Eine offene Perspektive
Aktuelle LLM-Agenten nutzen umfassend Gedankenketten-Reasoning und Funktionsaufrufe. Mit wachsenden Fähigkeiten stellt sich eine wichtige Frage: Können diese Softwaresysteme nicht nur als intelligente Problemlösungswerkzeuge fungieren, sondern als eigenständige Entitäten, die planen, unmittelbare Aufgaben gestalten und auf breitere, mehrdeutigere Ziele hinarbeiten können? Um diese Frage zu untersuchen, verwenden wir eine offene experimentelle Umgebung, in der wir einen vortrainierten LLM-Agenten mit der Fähigkeit ausstatten, eigene Aufgaben zu generieren, Wissen zu akkumulieren und umfassend mit seiner Umgebung zu interagieren. Wir untersuchen den resultierenden offenen Agenten qualitativ. Er kann zuverlässig komplexe mehrstufige Anweisungen befolgen, Informationen über Durchläufe hinweg speichern und wiederverwenden sowie eigene Aufgaben vorschlagen und lösen, bleibt jedoch empfindlich gegenüber Prompt-Design, neigt zu wiederholter Aufgabengenerierung und kann keine Selbstdarstellungen bilden. Diese Erkenntnisse veranschaulichen sowohl das Potenzial als auch die aktuellen Grenzen der Anpassung vortrainierter LLMs für Offenheit und weisen auf zukünftige Richtungen für das Training von Agenten zur Speicherverwaltung, produktiven Erkundung und Verfolgung abstrakter langfristiger Ziele hin.
Diese Forschung untersucht eine grundlegende Frage: Können große Sprachmodell-Agenten ihre traditionelle Werkzeugrolle überschreiten und zu autonomen Entitäten werden, die planen, unmittelbare Aufgaben gestalten und auf breitere, mehrdeutigere Ziele hinarbeiten können?
Kritischer Wendepunkt in der Agenten-Evolution: Aktuelle LLM-Agenten lösen hauptsächlich spezifische Aufgaben durch Gedankenketten-Reasoning und Funktionsaufrufe, sind aber im Wesentlichen immer noch Werkzeuge
Qualitativer Sprung zur Autonomie: Übergang von der Lösung vordefinierter Aufgaben zur autonomen Aufgabenerstellung, kontinuierlichen Existenz und Hinterlassung permanenter Spuren in der Umgebung
Erkundung offener Intelligenz: Untersuchung des Verhaltens von Agenten in Umgebungen ohne feste Endzustände, Aufgabenbereiche oder Terminalziele
Die Autoren argumentieren, dass offene Agenten Eigenschaften benötigen, die sich von aktuellen Agenten unterscheiden, einschließlich autonomer Erkundung, Umgebungsgestaltungsfähigkeit und autoteler (selbstgerichteter) Zielmerkmale.
Vorschlag eines offenen LLM-Agenten-Rahmens: Erweiterung des ReAct-Rahmens mit autonomer Aufgabengenerierungsfähigkeit
Entwurf persistenter Interaktionsmechanismen: Realisierung von Wissensakumulation und Zustandserhaltung über Durchläufe hinweg durch Datei-Lese-/Schreib-Werkzeuge
Implementierung von Kurz- und Langzeitgedächtnis-Systemen: Agenten-Architektur, die Arbeitsgedächtnis und episodisches Gedächtnis unterscheidet
Durchführung qualitativer experimenteller Analyse: Umfassende Bewertung der Fähigkeitsgrenzen und Einschränkungen offener Agenten
Bereitstellung zukünftiger Forschungsrichtungen: Konkrete Wege für das Training echter offener Agenten aufgezeigt
Offener Agent: Ein Agent, der in einer Umgebung ohne feste Endzustände, Aufgabenbereiche oder Terminalziele autonom erkunden, Aufgaben generieren und kontinuierlich interagieren kann. Dieser Agent sollte folgende Fähigkeiten besitzen:
1. Empfang von Benutzereingabe/Rückmeldung
2. Zugriff auf Langzeitgedächtnis
3. Aufgabengenerierung (autonom oder basierend auf Benutzereingabe)
4-6. ReAct-Schleife (Plan-Handlung-Beobachtung)
7. Aktualisierung des Langzeitgedächtnisses
Dateiaufgaben-Verarbeitung: Kann Dateien öffnen, Aufgaben lesen, Probleme lösen und Antworten in andere Dateien schreiben
Selbstüberprüfungsfähigkeit: Kann eigene Prompt-Template-Dateien identifizieren, durch Verzeichnisauflistung und main.py-Lesen die Vorlage lokalisieren
Code-Verständnis: Kann Agenten-Programm finden, Speichermechanismus für Benutzerabfragen verstehen und nächste Abfrage vorhersagen
Erkannte Einschränkungen:
Schlechte Verarbeitung mehrdeutiger Aufgaben: Scheitert häufig bei absichtlich mehrdeutig gestalteten Aufgaben
Fehlende Selbstdarstellung: Kann Quellcode in der Umgebung nicht als sich selbst erkennen, mangelndes Ich-Bewusstsein in der ersten Person
Unzureichende Erkundung: Nicht tiefgreifend genug bei der Umgebungserkundung zum Verständnis mehrdeutiger Eingaben
Dieses Paper zitiert wichtige Arbeiten in den Bereichen offenes Lernen, selbstgesteuerte Agenten und neugier-getriebenes Lernen, einschließlich:
Autotele Agenten: Colas et al. (2022) Übersicht über zielbedingte Verstärkungslernagenten mit intrinsischer Motivation
Neugier-getriebenes Lernen: Burda et al. (2018) Großmaßstab-Neugier-getriebenes Lernforschung
Werkzeugnutzung: Qin et al. (2024) Übersicht über Werkzeuglernfähigkeiten grundlegender Modelle
ReAct-Rahmen: Yao et al. (2023) Sprachmodell-Rahmen für Reasoning und Action-Zusammenspiel
Voyager: Wang et al. (2023) Verwandte Arbeiten zu offenen verkörperten Agenten
Gesamtbewertung: Dies ist eine zukunftsweisende explorative Forschungsarbeit, die zwar in technischer Tiefe und Experimentskala begrenzt ist, aber wichtige vorläufige Erkundungen und tiefe Erkenntnisse für die Entwicklung von LLM-Agenten zu offenen autonomen Entitäten bietet. Der Wert des Papers liegt mehr in der Problemstellung und Richtungsweisung, die Grundlagen für nachfolgende tiefere Forschung legt.