2025-11-14T03:58:11.705982

LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots

Wang, Sun, Zhang et al.

We introduce a novel framework for automatic behavior tree (BT) construction in heterogeneous multi-robot systems, designed to address the challenges of adaptability and robustness in dynamic environments. Traditional robots are limited by fixed functional attributes and cannot efficiently reconfigure their strategies in response to task failures or environmental changes. To overcome this limitation, we leverage large language models (LLMs) to generate and extend BTs dynamically, combining the reasoning and generalization power of LLMs with the modularity and recovery capability of BTs. The proposed framework consists of four interconnected modules task initialization, task assignment, BT update, and failure node detection which operate in a closed loop. Robots tick their BTs during execution, and upon encountering a failure node, they can either extend the tree locally or invoke a centralized virtual coordinator (Alex) to reassign subtasks and synchronize BTs across peers. This design enables long-term cooperative execution in heterogeneous teams. We validate the framework on 60 tasks across three simulated scenarios and in a real-world cafe environment with a robotic arm and a wheeled-legged robot. Results show that our method consistently outperforms baseline approaches in task success rate, robustness, and scalability, demonstrating its effectiveness for multi-robot collaboration in complex scenarios.

academic

LLM-HBT: 이질적 로봇의 적응형 조율을 위한 동적 행동 트리 구성

기본 정보

논문 ID: 2510.09963
제목: LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots
저자: Chao-ran Wang, Jingyuan Sun*, Yan-hui Zhang, Mingyu Zhang, Chang-ju Wu*
분류: cs.RO (로봇공학)
발표 시간: 2025년 10월 11일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.09963

초록

본 논문은 이질적 다중 로봇 시스템에서 자동 행동 트리(BT) 구성을 위한 새로운 프레임워크를 제안하며, 동적 환경에서의 적응성과 견고성 문제를 해결하는 것을 목표로 한다. 기존 로봇은 고정된 기능 속성으로 인해 작업 실패나 환경 변화 시 전략을 효율적으로 재구성할 수 없다. 이러한 제한을 극복하기 위해 저자들은 대규모 언어 모델(LLM)을 활용하여 행동 트리를 동적으로 생성 및 확장하며, LLM의 추론 및 일반화 능력과 BT의 모듈화 및 복구 능력을 결합한다. 본 프레임워크는 작업 초기화, 작업 할당, BT 업데이트, 실패 노드 감지의 네 가지 상호 연결된 모듈로 구성되어 폐루프 운영을 형성한다. 로봇은 실행 중 자신의 BT를 실행하며, 실패 노드에 직면할 때 트리를 로컬로 확장하거나 중앙 가상 조율자(Alex)를 호출하여 부작업을 재할당하고 동료 로봇의 BT를 동기화할 수 있다.

연구 배경 및 동기

핵심 문제

적응성 부족: 기존 다중 로봇 시스템은 동적이고 비구조화된 환경에서 일반화하기 어려우며, 사전 정의된 선행 지식과 제한된 훈련 데이터에 심각하게 의존한다.
의사결정 프레임워크의 경직성: 기존 의사결정 프레임워크는 온라인 재구성을 지원하기에는 너무 경직되어 있거나, 장기 견고성을 보장하기에는 너무 취약하다.
이질적 조율의 도전: 이질적 로봇은 서로 다른 능력을 가지고 있으며, 런타임 중 협력적 재구성 및 행동 트리 공유 방법이 충분히 해결되지 않았다.

연구의 중요성

다중 로봇 시스템은 운영 효율성 향상에 막대한 잠재력을 가지고 있지만, 동적 환경에서는 실패, 환경 변화 및 예상치 못한 상황에 적응해야 한다. 이는 수색 및 구조, 창고 자동화, 서비스 로봇 등의 실제 응용 분야에서 매우 중요하다.

기존 방법의 한계

LLM 기반 방법: 강력한 추론 능력을 보여주지만, 일반적으로 일회성 방식으로 작업 계획을 생성하며 실행 시작 후 온라인 수정 메커니즘이 부족하다.
행동 트리 기반 방법: 모듈화 및 복구 메커니즘을 제공하지만, 수동으로 설계된 동작 노드와 사전 정의된 작업 구조에 심각하게 의존한다.
통합 프레임워크 부재: 기존 연구는 LLM의 의미론적 추론 능력과 BT의 구조적 견고성을 충분히 통합하지 못했다.

핵심 기여

동적 프레임워크: 대규모 언어 모델 추론과 행동 트리를 통합하는 동적 프레임워크를 제안하여 이질적 다중 로봇 조율을 실현한다.
하이브리드 메커니즘: 중앙식-분산식 하이브리드 메커니즘을 설계하여 로컬 BT 확장 및 중앙식 작업 재할당을 통한 런타임 적응을 구현한다.
새로운 벤치마크: 다양한 시뮬레이션 작업과 실제 환경을 포함하는 새로운 벤치마크를 구축하여 방법의 견고성과 확장성을 검증한다.
폐루프 실행: 실패 감지, 추론 및 트리 적응의 폐루프를 구현하여 이질적 로봇이 실행 전략을 지속적으로 최적화할 수 있도록 한다.

방법 상세 설명

작업 정의

이질적 다중 로봇 시스템(HMRS) R = {r₁, ..., rₙ}을 고려하며, 각 로봇 rᵢ는 동작 공간을 가진다:

$A_i = \{a_i^1, ..., a_i^{m_i}\}$

이질성은 Aᵢ ≠ Aⱼ (i ≠ j)로 표현되며, 형태 및 능력의 차이를 반영한다. 작업 τ는 필요한 동작 집합 Aτ ⊆ ⋃ᵢ Aᵢ로 표현된다.

모델 아키텍처

1. 전체 프레임워크 설계

프레임워크는 네 가지 상호 연결된 모듈로 구성된다:

작업 초기화(Task Initialization): 인간의 지시를 초기 BT로 변환
작업 할당(Task Assignment): 실패 노드가 중앙 할당자의 작업 재할당을 트리거
BT 업데이트(Behavior Tree Update): 새로운 부트리 삽입 또는 로봇 간 BT 동기화
실패 노드 감지(Failure Node Detection): BT 실행을 지속적으로 모니터링하고 병목 지점 식별

2. 행동 트리 형식화

행동 트리 T = (V, E, r)이며, 여기서 V는 노드 집합, E는 부모-자식 간선을 정의하고, r은 루트 노드이다. 각 노드는 Success, Failure 또는 Running 상태를 반환한다.

순차 노드 실행 논리: $Seq(c_1, ..., c_n) = \begin{cases} Failure, & \exists i: c_i = Failure \\ Running, & \exists i: c_i = Running \\ Success, & \forall i: c_i = Success \end{cases}$

3. 가상 조율자 Alex

Alex는 중앙 할당자로서 로봇 및 환경 상태의 공유 뷰를 유지한다. 실패 노드 fᵢ가 보고될 때, Alex는 컨텍스트 정보를 수집하고 실패를 해결할 적절한 로봇 및 동작을 식별한다.

기술 혁신 포인트

1. 동적 BT 확장

독립적 확장: 로봇이 자신의 동작 집합을 사용하여 실패 조건을 해결
위임 확장: 실패를 로컬로 해결할 수 없을 때, Alex가 적절한 능력을 가진 동료 로봇에 할당

2. 전제 조건 및 후제 조건

각 동작 노드 a는 다음과 연관된다:

전제 조건 Pre(a) = {c₁ᵖʳᵉ, ..., cₘᵖʳᵉ}: 실행 전 만족해야 할 조건
후제 조건 Post(a) = {c₁ᵖᵒˢᵗ, ..., cₘᵖᵒˢᵗ}: 성공적 실행 후의 결과 조건

3. 실패 복구 메커니즘

시스템은 실패 노드를 전용 큐 Fₙₒ𝒹ₑₛ에 저장하며, 단순히 상향 전파하여 실행을 종료하지 않는다. 이는 실행 병목을 체계적으로 식별하고 확장 프로세스를 트리거할 수 있는 능력을 제공한다.

실험 설정

데이터셋

Behavior-1K 데이터셋: 네비게이션, 물체 조작 및 협력 작업의 다양한 작업 설명 포함
샘플링 전략: 각 그룹 20개 작업, 2~20단계의 다양한 동작 시퀀스 포함
세 가지 시나리오:
1. 단일 사족 로봇
2. 사족 로봇 + 무인항공기
3. 사족 로봇 + 무인항공기 + 매니퓰레이터

평가 지표

성공률(SR): $SR = \frac{1}{N}\sum_{i=1}^N s_i$ , 여기서 sᵢ ∈ {0,1}은 작업 i의 성공 여부
평균 단계 수(AS): $AS = \frac{1}{N}\sum_{i=1}^N k_i$ , 여기서 kᵢ는 작업 i 완료에 필요한 BT 실행 단계 수

비교 방법

MCTS: 몬테카를로 트리 탐색만 사용한 동작 계획
LLM-MCTS: LLM이 생성한 세계 모델로 강화된 MCTS

구현 세부사항

MCTS 및 LLM-MCTS는 동일한 500회 시뮬레이션 예산 및 최대 탐색 깊이 20으로 구성
각 시나리오의 20개 작업은 5회 독립 시험 실행, 초기 위치 무작위화
실제 환경 실험은 카페 환경에서 10회 반복 시험 수행

실험 결과

주요 결과

방법	시나리오 1	시나리오 2	시나리오 3
	SR(%) AS	SR(%) AS	SR(%) AS
MCTS	95 3.95	55 4.91	35 8.80
LLM-MCTS	90 4.11	55 5.18	35 9.00
LLM-HBT	100 4.05	100 5.05	100 8.4

주요 발견

완벽한 성공률: LLM-HBT는 모든 시나리오에서 100% 성공률을 달성하는 반면, 기준 방법은 이질성 및 작업 복잡성 증가에 따라 현저히 감소한다.
효율성 향상: 가장 도전적인 시나리오 3에서 LLM-HBT의 평균 단계 수(8.4)는 MCTS(8.80) 및 LLM-MCTS(9.00)보다 낮다.
견고성 검증: 시나리오 3에서 기준 방법은 40%의 작업만 성공적으로 완료한 반면, LLM-HBT는 100% 성공률을 유지한다.

실제 환경 실험

카페 환경에서 매니퓰레이터와 바퀴형 다리 로봇이 협력하여 병을 카운터에 배치:

작업 흐름: 매니퓰레이터가 병이 파지 가능한 작업 공간에 있다는 전제 조건 설정 → 바퀴형 로봇이 병을 획득하기 위해 네비게이션 → 매니퓰레이터가 파지 및 배치 완료
결과: 10회 시험 모두 성공, 실제 환경에서 프레임워크의 유효성 검증

소거 분석

20개 작업 × 3개 방법의 상세 결과는 다음을 나타낸다:

그룹 1: LLM-HBT가 모든 작업 완료, 기준 방법은 T12, T16 등 작업 실패
그룹 2: LLM-HBT가 기준 방법이 실패한 T3, T4, T20 등 작업 성공적 완료
그룹 3: 기준 방법은 대부분 작업 실패("x"로 표시), LLM-HBT는 거의 모든 작업 성공

결론 및 논의

주요 결론

유효성 검증: LLM-HBT는 작업 성공률 및 실행 효율성을 현저히 향상시킨다.
적응성 강화: 폐루프 메커니즘은 로봇이 실행 전략을 지속적으로 최적화할 수 있게 한다.
이질적 조율: 서로 다른 능력의 로봇 간 동적 작업 재할당을 성공적으로 구현한다.

한계

LLM 추론 지연: 실시간 요구사항이 높은 응용 분야에 영향을 미칠 수 있다.
실제 환경 검증 범위: 현재 카페 환경에서만 검증됨
통신 의존성: 신뢰할 수 있는 로봇 간 통신 필요

향후 방향

지연 인식 설계: 추론 지연을 고려한 최적화 메커니즘 개발
통신 효율적 분산화: 중앙 조율자에 대한 의존성 감소
센싱 불확실성 견고성: 노이즈 및 불완전한 관측 하에서의 견고한 복구 메커니즘

심층 평가

장점

방법의 혁신성: LLM 추론과 BT 동적 구성을 처음으로 체계적으로 통합, 기술 경로 참신
실험의 충분성: 시뮬레이션 및 실제 환경 포함, 다중 시나리오 검증 포괄적
결과의 설득력: 100% 성공률 및 효율성 향상이 강력한 설득력 제공
이론적 기초: 형식화 정의 명확, 수학적 표현 엄밀

부족점

완벽한 성공률의 의문: 100% 성공률은 작업이 상대적으로 단순하거나 과적합 가능성 시사
계산 오버헤드 미분석: LLM 추론의 계산 비용 및 시간 오버헤드 상세 분석 부재
확장성 검증 부족: 최대 3개 로봇만 테스트, 대규모 시스템 확장성 미검증
실패 모드 분석 부족: 극단적 상황에서의 실패 모드 충분히 분석되지 않음

영향력

학술적 기여: 다중 로봇 조율에 새로운 기술 패러다임 제공
실용적 가치: 서비스 로봇, 산업 자동화 등 분야에 적용 가능
재현성: 방법 설명 상세하나, 코드 및 데이터셋 가용성 명확하지 않음

적용 시나리오

서비스 로봇: 식당, 호텔 등 다중 로봇 협력이 필요한 서비스 시나리오
산업 자동화: 이질적 로봇의 복잡한 조립 작업 협동 필요
수색 및 구조: 동적 환경에서 다양한 유형 로봇의 조율 작업
창고 물류: 다양한 유형 로봇의 지능형 스케줄링 및 작업 할당

참고문헌

논문은 관련 분야의 중요한 연구를 인용하며, 다음을 포함한다:

로봇공학에서의 행동 트리 응용 6,7,9
LLM 기반 다중 로봇 계획 14,15,16
이질적 다중 로봇 시스템의 작업 할당 2,12,13
행동 트리 자동 설계의 최신 진전 10,11

종합 평가: 본 논문은 기술 혁신성이 강하고 실험 검증이 충분한 이질적 다중 로봇 조율 프레임워크를 제안한다. LLM과 BT의 결합은 해당 분야에 새로운 해결 방안을 제공하며, 중요한 학술적 가치와 실용적 잠재력을 가진다. 일부 한계가 있음에도 불구하고 전반적 품질이 높으며, 향후 관련 연구의 견고한 기초를 마련한다.