LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots
Wang, Sun, Zhang et al.
We introduce a novel framework for automatic behavior tree (BT) construction in heterogeneous multi-robot systems, designed to address the challenges of adaptability and robustness in dynamic environments. Traditional robots are limited by fixed functional attributes and cannot efficiently reconfigure their strategies in response to task failures or environmental changes. To overcome this limitation, we leverage large language models (LLMs) to generate and extend BTs dynamically, combining the reasoning and generalization power of LLMs with the modularity and recovery capability of BTs. The proposed framework consists of four interconnected modules task initialization, task assignment, BT update, and failure node detection which operate in a closed loop. Robots tick their BTs during execution, and upon encountering a failure node, they can either extend the tree locally or invoke a centralized virtual coordinator (Alex) to reassign subtasks and synchronize BTs across peers. This design enables long-term cooperative execution in heterogeneous teams. We validate the framework on 60 tasks across three simulated scenarios and in a real-world cafe environment with a robotic arm and a wheeled-legged robot. Results show that our method consistently outperforms baseline approaches in task success rate, robustness, and scalability, demonstrating its effectiveness for multi-robot collaboration in complex scenarios.
academic
LLM-HBT: Динамическое построение дерева поведения для адаптивной координации гетерогенных роботов
В данной работе предлагается новая структура для автоматического построения деревьев поведения (BT) в системах гетерогенных многороботов, направленная на решение проблем адаптивности и устойчивости в динамических средах. Традиционные роботы ограничены фиксированными функциональными свойствами и не могут эффективно переконфигурировать стратегии при отказах задач или изменениях окружающей среды. Для преодоления этого ограничения авторы используют большие языковые модели (LLM) для динамического создания и расширения деревьев поведения, объединяя способности LLM к рассуждению и обобщению с модульностью и восстанавливаемостью BT. Структура включает четыре взаимосвязанных модуля — инициализацию задачи, распределение задач, обновление BT и обнаружение узлов отказа — образующих замкнутый цикл. Роботы выполняют свои BT во время работы, и при возникновении узлов отказа могут локально расширить дерево или обратиться к центральному виртуальному координатору (Alex) для переназначения подзадач и синхронизации BT товарищей.
Недостаточная адаптивность: Традиционные системы многороботов плохо обобщаются в динамических и неструктурированных средах, сильно зависят от предопределённых приоритетов и ограниченных данных обучения
Жёсткость структуры принятия решений: Существующие структуры либо слишком жёсткие для поддержки переконфигурации в режиме реального времени, либо слишком хрупкие для обеспечения долгосрочной устойчивости
Проблемы координации гетерогенных систем: Гетерогенные роботы имеют различные возможности; вопрос о том, как во время выполнения совместно перестраивать и обмениваться деревьями поведения, остаётся недостаточно решённым
Системы многороботов имеют огромный потенциал для повышения операционной эффективности, но должны адаптироваться к отказам, изменениям окружающей среды и непредвиденным ситуациям в динамических средах. Это критически важно в практических приложениях, таких как поисково-спасательные операции, автоматизация складов, сервисные роботы и другие сценарии.
Методы на основе LLM: Хотя демонстрируют сильные способности к рассуждению, обычно генерируют планы задач однократно, без механизмов онлайн-коррекции после начала выполнения
Методы на основе деревьев поведения: Обеспечивают модульность и восстанавливаемость, но сильно зависят от ручного проектирования узлов действий и предопределённых структур задач
Отсутствие единой структуры: Существующие исследования не полностью интегрируют способности семантического рассуждения LLM и структурную устойчивость BT
Динамическая структура: Предложена динамическая структура, интегрирующая рассуждение LLM и деревья поведения для координации гетерогенных многороботов
Гибридный механизм: Разработан гибридный механизм централизованно-распределённого типа, реализующий адаптацию во время выполнения через локальное расширение BT и централизованное переназначение задач
Новый эталон: Построен новый эталон, охватывающий разнообразные задачи моделирования и реальные окружающие среды, верифицирующий устойчивость и масштабируемость метода
Замкнутое выполнение: Реализован замкнутый цикл обнаружения отказов, рассуждения и адаптации дерева, позволяющий гетерогенным роботам постоянно оптимизировать стратегии выполнения
Рассмотрим систему гетерогенных многороботов (HMRS) R = {r₁, ..., rₙ}, где каждый робот rᵢ имеет пространство действий:
Ai={ai1,...,aimi}
Гетерогенность проявляется в Aᵢ ≠ Aⱼ (i ≠ j), отражая морфологические и функциональные различия. Задача τ представляется требуемым набором действий Aτ ⊆ ⋃ᵢ Aᵢ.
Дерево поведения T = (V, E, r), где V — множество узлов, E определяет рёбра родитель-потомок, r — корневой узел. Каждый узел возвращает состояние Success, Failure или Running.
Alex функционирует как центральный распределитель, поддерживая общее представление состояния роботов и окружающей среды. При поступлении отчёта об узле отказа fᵢ Alex собирает контекстную информацию и определяет подходящих роботов и действия для разрешения отказа.
Система сохраняет узлы отказа в специальной очереди Fₙₒ𝒹ₑₛ вместо простого распространения отказа и прерывания выполнения. Это обеспечивает систематическое выявление узких мест выполнения и запуск процесса расширения.
Идеальный коэффициент успеха: LLM-HBT достигает 100% коэффициента успеха во всех сценариях, тогда как базовые методы значительно снижают производительность с увеличением гетерогенности и сложности задач
Повышение эффективности: В наиболее сложном сценарии 3 среднее количество шагов LLM-HBT (8.4) ниже, чем у MCTS (8.80) и LLM-MCTS (9.00)
Верификация устойчивости: В сценарии 3 базовые методы успешно завершают только 40% задач, тогда как LLM-HBT сохраняет 100% коэффициент успеха
В кафе манипулятор и колёсный четырёхногий робот сотрудничали при размещении бутылки на прилавке:
Ход задачи: Манипулятор устанавливает предусловие нахождения бутылки в захватываемом рабочем пространстве → колёсный робот навигирует для получения бутылки → манипулятор завершает захват и размещение
Результаты: Все 10 испытаний успешны, подтверждая эффективность структуры в реальной среде
Данное исследование впервые интегрирует рассуждение LLM с динамическим построением BT для систем гетерогенных многороботов, заполняя пробел в этой области.
Статья ссылается на важные работы в соответствующих областях, включая:
Применение деревьев поведения в робототехнике 6,7,9
Планирование многороботов на основе LLM 14,15,16
Распределение задач в системах гетерогенных многороботов 2,12,13
Последние достижения в автоматическом проектировании деревьев поведения 10,11
Общая оценка: В данной работе предлагается структура координации гетерогенных многороботов с высокой методологической инновативностью и полной экспериментальной верификацией. Сочетание LLM и BT предоставляет новый подход к решению проблем в этой области, обладая значительной научной ценностью и практическим потенциалом. Несмотря на некоторые ограничения, общее качество работы высокое и создаёт хорошую основу для будущих исследований в этой области.