LLM Agents Beyond Utility: An Open-Ended Perspective
Nachkov, Wang, Van Gool
Recent LLM agents have made great use of chain of thought reasoning and function calling. As their capabilities grow, an important question arises: can this software represent not only a smart problem-solving tool, but an entity in its own right, that can plan, design immediate tasks, and reason toward broader, more ambiguous goals? To study this question, we adopt an open-ended experimental setting where we augment a pretrained LLM agent with the ability to generate its own tasks, accumulate knowledge, and interact extensively with its environment. We study the resulting open-ended agent qualitatively. It can reliably follow complex multi-step instructions, store and reuse information across runs, and propose and solve its own tasks, though it remains sensitive to prompt design, prone to repetitive task generation, and unable to form self-representations. These findings illustrate both the promise and current limits of adapting pretrained LLMs toward open-endedness, and point to future directions for training agents to manage memory, explore productively, and pursue abstract long-term goals.
최근 LLM 에이전트는 사고의 연쇄(chain of thought) 추론과 함수 호출을 효과적으로 활용하고 있습니다. 그들의 능력이 증가함에 따라 중요한 질문이 제기됩니다: 이 소프트웨어가 단순한 문제 해결 도구뿐만 아니라 계획을 세우고, 즉각적인 작업을 설계하며, 더 광범위하고 모호한 목표를 향해 추론할 수 있는 독립적인 실체로 표현될 수 있을까요? 이 질문을 연구하기 위해 우리는 사전 학습된 LLM 에이전트에 자신의 작업을 생성하고, 지식을 축적하며, 환경과 광범위하게 상호작용할 수 있는 능력을 부여하는 개방형 실험 설정을 채택합니다. 우리는 결과적인 개방형 에이전트를 정성적으로 연구합니다. 이는 복잡한 다단계 지시를 안정적으로 따를 수 있고, 실행 간에 정보를 저장하고 재사용할 수 있으며, 자신의 작업을 제안하고 해결할 수 있습니다. 그러나 프롬프트 설계에 민감하고, 반복적인 작업 생성 경향이 있으며, 자기 표현을 형성할 수 없습니다. 이러한 발견은 사전 학습된 LLM을 개방형으로 적응시키는 것의 가능성과 현재의 한계를 보여주며, 에이전트를 훈련하여 메모리를 관리하고, 생산적으로 탐색하며, 추상적인 장기 목표를 추구하기 위한 향후 방향을 제시합니다.
본 논문은 개방형 학습, 자율 주도 에이전트, 호기심 주도 학습 등 분야의 중요한 연구를 인용합니다:
자율 주도 에이전트: Colas et al. (2022) 내재적 동기 목표 조건부 강화 학습 종합 검토
호기심 주도 학습: Burda et al. (2018) 대규모 호기심 주도 학습 연구
도구 사용: Qin et al. (2024) 기초 모델의 도구 학습 종합 검토
ReAct 프레임워크: Yao et al. (2023) 추론과 행동 협력의 언어 모델 프레임워크
Voyager: Wang et al. (2023) 개방형 구현 에이전트 관련 연구
종합 평가: 이는 기술적 깊이와 실험 규모에서 제한이 있지만, LLM 에이전트가 개방형 자율 실체로 진화하는 과정에 중요한 초기 탐색과 깊은 통찰을 제공하는 선견지명 있는 탐색 연구입니다. 논문의 가치는 기술적 혁신보다는 문제 제기와 방향 제시에 더 많이 나타나며, 후속 더 깊이 있는 연구의 기초를 마련합니다.