2025-11-14T03:58:11.705982

LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots

Wang, Sun, Zhang et al.
We introduce a novel framework for automatic behavior tree (BT) construction in heterogeneous multi-robot systems, designed to address the challenges of adaptability and robustness in dynamic environments. Traditional robots are limited by fixed functional attributes and cannot efficiently reconfigure their strategies in response to task failures or environmental changes. To overcome this limitation, we leverage large language models (LLMs) to generate and extend BTs dynamically, combining the reasoning and generalization power of LLMs with the modularity and recovery capability of BTs. The proposed framework consists of four interconnected modules task initialization, task assignment, BT update, and failure node detection which operate in a closed loop. Robots tick their BTs during execution, and upon encountering a failure node, they can either extend the tree locally or invoke a centralized virtual coordinator (Alex) to reassign subtasks and synchronize BTs across peers. This design enables long-term cooperative execution in heterogeneous teams. We validate the framework on 60 tasks across three simulated scenarios and in a real-world cafe environment with a robotic arm and a wheeled-legged robot. Results show that our method consistently outperforms baseline approaches in task success rate, robustness, and scalability, demonstrating its effectiveness for multi-robot collaboration in complex scenarios.
academic

LLM-HBT: Construcción Dinámica de Árboles de Comportamiento para Coordinación Adaptativa en Robots Heterogéneos

Información Básica

  • ID del Artículo: 2510.09963
  • Título: LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots
  • Autores: Chao-ran Wang, Jingyuan Sun*, Yan-hui Zhang, Mingyu Zhang, Chang-ju Wu*
  • Clasificación: cs.RO (Robótica)
  • Fecha de Publicación: 11 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.09963

Resumen

Este artículo propone un nuevo marco para la construcción automática de árboles de comportamiento (BT) en sistemas multi-robot heterogéneos, con el objetivo de abordar los desafíos de adaptabilidad y robustez en entornos dinámicos. Los robots tradicionales están limitados por atributos funcionales fijos, lo que impide la reconfiguración eficiente de estrategias ante fallos de tareas o cambios ambientales. Para superar esta limitación, los autores aprovechan los modelos de lenguaje grande (LLM) para generar y expandir dinámicamente árboles de comportamiento, combinando las capacidades de razonamiento y generalización del LLM con la modularidad y capacidad de recuperación del BT. El marco contiene cuatro módulos interconectados —inicialización de tareas, asignación de tareas, actualización de BT y detección de nodos de fallo— que forman un ciclo cerrado de operación. Los robots ejecutan su BT durante la ejecución, y cuando encuentran nodos de fallo, pueden expandir localmente el árbol o invocar un coordinador virtual central (Alex) para reasignar subtareas y sincronizar los BT de los compañeros.

Antecedentes de Investigación y Motivación

Problemas Centrales

  1. Adaptabilidad Insuficiente: Los sistemas multi-robot tradicionales tienen dificultades para generalizar en entornos dinámicos y no estructurados, dependiendo fuertemente de priors predefinidos y datos de entrenamiento limitados
  2. Rigidez del Marco de Decisión: Los marcos de decisión existentes son demasiado rígidos para soportar reconfiguración en línea, o demasiado frágiles para garantizar robustez a largo plazo
  3. Desafíos de Coordinación Heterogénea: Los robots heterogéneos poseen capacidades diferentes, y cómo reconstruir y compartir colaborativamente árboles de comportamiento en tiempo de ejecución aún no se ha abordado adecuadamente

Importancia de la Investigación

Los sistemas multi-robot tienen un enorme potencial para mejorar la eficiencia operativa, pero deben adaptarse a fallos, cambios ambientales y situaciones inesperadas en entornos dinámicos. Esto es crítico en aplicaciones prácticas como búsqueda y rescate, automatización de almacenes y robots de servicio.

Limitaciones de Métodos Existentes

  1. Métodos Basados en LLM: Aunque demuestran fuertes capacidades de razonamiento, típicamente generan planes de tareas de una sola vez, careciendo de mecanismos de corrección en línea después de que comienza la ejecución
  2. Métodos Basados en Árboles de Comportamiento: Proporcionan modularidad y mecanismos de recuperación, pero dependen fuertemente del diseño manual de nodos de acción y estructuras de tareas predefinidas
  3. Falta de Marco Unificado: La investigación existente no ha integrado adecuadamente las capacidades de razonamiento semántico del LLM con la robustez estructural del BT

Contribuciones Principales

  1. Marco Dinámico: Propone un marco dinámico que integra razonamiento de modelos de lenguaje grande con árboles de comportamiento para coordinación de robots heterogéneos
  2. Mecanismo Híbrido: Diseña un mecanismo híbrido centralizado-distribuido que logra adaptación en tiempo de ejecución mediante expansión local de BT y reasignación centralizada de tareas
  3. Nuevo Punto de Referencia: Construye un nuevo punto de referencia que abarca tareas de simulación diversas y entornos del mundo real, validando la robustez y escalabilidad del método
  4. Ejecución de Ciclo Cerrado: Implementa un ciclo de retroalimentación cerrada de detección de fallos, razonamiento y adaptación de árboles, permitiendo que robots heterogéneos optimicen continuamente estrategias de ejecución

Explicación Detallada del Método

Definición de Tareas

Considere un sistema multi-robot heterogéneo (HMRS) R = {r₁, ..., rₙ}, donde cada robot rᵢ posee un espacio de acciones:

Ai={ai1,...,aimi}A_i = \{a_i^1, ..., a_i^{m_i}\}

La heterogeneidad se refleja en Aᵢ ≠ Aⱼ (i ≠ j), reflejando diferencias morfológicas y de capacidades. Una tarea τ se representa por el conjunto de acciones requeridas Aτ ⊆ ⋃ᵢ Aᵢ.

Arquitectura del Modelo

1. Diseño del Marco General

El marco contiene cuatro módulos interconectados:

  • Inicialización de Tareas (Task Initialization): Convierte instrucciones humanas en un BT inicial
  • Asignación de Tareas (Task Assignment): Los nodos de fallo desencadenan el reasignador central para reasignar tareas
  • Actualización de BT (Behavior Tree Update): Inserta nuevos subárboles o sincroniza BT entre robots
  • Detección de Nodos de Fallo (Failure Node Detection): Monitorea continuamente la ejecución de BT e identifica cuellos de botella

2. Formalización del Árbol de Comportamiento

Árbol de comportamiento T = (V, E, r), donde V es el conjunto de nodos, E define aristas padre-hijo, y r es el nodo raíz. Cada nodo devuelve estados Success, Failure o Running.

Lógica de ejecución del nodo de secuencia:

undefined