Combining Reinforcement Learning and Behavior Trees for NPCs in Video Games with AMD Schola
Liu, Cann, Colbert et al.
While the rapid advancements in the reinforcement learning (RL) research community have been remarkable, the adoption in commercial video games remains slow. In this paper, we outline common challenges the Game AI community faces when using RL-driven NPCs in practice, and highlight the intersection of RL with traditional behavior trees (BTs) as a crucial juncture to be explored further. Although the BT+RL intersection has been suggested in several research papers, its adoption is rare. We demonstrate the viability of this approach using AMD Schola -- a plugin for training RL agents in Unreal Engine -- by creating multi-task NPCs in a complex 3D environment inspired by the commercial video game ``The Last of Us". We provide detailed methodologies for jointly training RL models with BTs while showcasing various skills.
강화학습(RL) 연구 분야에서 상당한 진전이 있었음에도 불구하고, 상용 비디오 게임에서의 적용은 여전히 느린 속도로 진행되고 있습니다. 본 논문은 게임 AI 커뮤니티가 RL 기반 NPC 사용 시 직면하는 일반적인 과제를 개괄하며, RL과 전통적 행동 트리(BT)의 교집합이 추가 탐구가 필요한 핵심 지점임을 강조합니다. BT+RL 결합이 여러 연구 논문에서 언급되었지만, 실제 적용은 여전히 드뭅니다. 저자들은 언리얼 엔진에서 RL 에이전트를 훈련하는 플러그인인 AMD Schola를 사용하여, 상용 게임 《라스트 오브 어스》에서 영감을 받은 복잡한 3D 환경에서 다중 작업 NPC를 생성함으로써 이 방법의 실현 가능성을 입증합니다.
강화학습 기술이 빠르게 발전하고 있음에도 불구하고, 상용 게임 개발에서 RL 기반 NPC의 채택은 여전히 상당한 도전에 직면해 있습니다. 전통적인 행동 트리 방법은 구조화 정도가 높지만 다중 작업 처리 시 복잡해지고 적응성이 부족합니다. 반면 RL 방법은 동적 적응 능력을 가지고 있지만 보상 형성의 어려움, 부정적 전이 학습, 높은 계산 자원 요구 등의 문제가 있습니다.
본 논문은 게임 AI, 강화학습, 행동 트리 등 여러 연구 분야의 중요한 작업을 포함하는 21개의 관련 문헌을 인용하여 연구에 견고한 이론적 기초와 기술적 지원을 제공합니다.
종합 평가: 이는 상당한 실용적 가치를 가진 응용 지향 연구 논문으로, 이론적 방법을 실제 사용 가능한 도구로 성공적으로 전환하여 게임 AI 분야에 중요한 기여를 했습니다. 이론적 깊이와 평가 범위 측면에서 개선 여지가 있지만, 오픈소스 특성과 완전한 구현이 후속 연구의 견고한 기초를 마련합니다.