2025-11-14T03:58:11.705982

LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots

Wang, Sun, Zhang et al.

We introduce a novel framework for automatic behavior tree (BT) construction in heterogeneous multi-robot systems, designed to address the challenges of adaptability and robustness in dynamic environments. Traditional robots are limited by fixed functional attributes and cannot efficiently reconfigure their strategies in response to task failures or environmental changes. To overcome this limitation, we leverage large language models (LLMs) to generate and extend BTs dynamically, combining the reasoning and generalization power of LLMs with the modularity and recovery capability of BTs. The proposed framework consists of four interconnected modules task initialization, task assignment, BT update, and failure node detection which operate in a closed loop. Robots tick their BTs during execution, and upon encountering a failure node, they can either extend the tree locally or invoke a centralized virtual coordinator (Alex) to reassign subtasks and synchronize BTs across peers. This design enables long-term cooperative execution in heterogeneous teams. We validate the framework on 60 tasks across three simulated scenarios and in a real-world cafe environment with a robotic arm and a wheeled-legged robot. Results show that our method consistently outperforms baseline approaches in task success rate, robustness, and scalability, demonstrating its effectiveness for multi-robot collaboration in complex scenarios.

academic

LLM-HBT: 異種ロボット間の適応的協調のための動的行動木構築

基本情報

論文ID: 2510.09963
タイトル: LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots
著者: Chao-ran Wang, Jingyuan Sun*, Yan-hui Zhang, Mingyu Zhang, Chang-ju Wu*
分類: cs.RO (ロボティクス)
発表日: 2025年10月11日 (arXiv プレプリント)
論文リンク: https://arxiv.org/abs/2510.09963

要約

本論文は、異種多ロボットシステムにおける自動行動木(BT)構築のための新しいフレームワークを提案し、動的環境における適応性と堅牢性の課題に対処することを目的としている。従来のロボットは固定された機能属性に制限されており、タスク失敗や環境変化時に効率的にポリシーを再構成することができない。この制限を克服するため、著者らは大規模言語モデル(LLM)を利用して行動木を動的に生成・拡張し、LLMの推論と汎化能力とBTのモジュール性と回復能力を組み合わせている。本フレームワークは、タスク初期化、タスク割り当て、BT更新、失敗ノード検出という4つの相互接続されたモジュールで構成され、閉ループ動作を形成する。ロボットは実行中にそのBTを実行し、失敗ノードに遭遇した場合、木をローカルに拡張するか、中央仮想コーディネータ(Alex)を呼び出してサブタスクを再割り当てし、同伴ロボットのBTを同期することができる。

研究背景と動機

核心的問題

適応性の不足：従来の多ロボットシステムは動的で非構造化された環境での汎化が困難であり、事前定義されたプライアーと限定的な訓練データに大きく依存している
意思決定フレームワークの硬直性：既存の意思決定フレームワークは、オンライン再構成をサポートするには過度に硬直しているか、長期的な堅牢性を保証するには過度に脆弱である
異種協調の課題：異種ロボットは異なる能力を持つが、実行時の協調的な再構築と行動木の共有方法は十分に解決されていない

研究の重要性

多ロボットシステムは運用効率の向上に大きな可能性を持つが、動的環境では失敗、環境変化、予期しない状況に適応する必要がある。これは捜索救助、倉庫自動化、サービスロボットなどの実際のアプリケーションにおいて極めて重要である。

既存手法の限界

LLMベースの手法：強力な推論能力を示す一方で、通常はタスク計画を単一パスで生成し、実行開始後のオンライン修正メカニズムが不足している
行動木ベースの手法：モジュール性と回復メカニズムを提供するが、手動で設計されたアクションノードと事前定義されたタスク構造に大きく依存している
統一フレームワークの欠如：既存研究はLLMのセマンティック推論能力とBTの構造的堅牢性を十分に統合していない

核心的貢献

動的フレームワーク：大規模言語モデルの推論と行動木を統合した動的フレームワークを提案し、異種多ロボット協調に対応
ハイブリッドメカニズム：集中型-分散型ハイブリッドメカニズムを設計し、ローカルBT拡張と集中型タスク再割り当てを通じた実行時適応を実現
新しいベンチマーク：多様なシミュレーションタスクと実世界環境を含む新しいベンチマークを構築し、手法の堅牢性とスケーラビリティを検証
閉ループ実行：失敗検出、推論、木適応の閉ループサイクルを実装し、異種ロボットが実行戦略を継続的に最適化できるようにする

手法の詳細

タスク定義

異種多ロボットシステム(HMRS) R = {r₁, ..., rₙ}を考える。ここで各ロボットrᵢはアクション空間を持つ：

$A_i = \{a_i^1, ..., a_i^{m_i}\}$

異種性はAᵢ ≠ Aⱼ (i ≠ j)に現れ、形態と能力の違いを反映している。タスクτは必要なアクション集合Aτ ⊆ ⋃ᵢ Aᵢで表現される。

モデルアーキテクチャ

1. 全体的フレームワーク設計

フレームワークは4つの相互接続されたモジュールで構成される：

タスク初期化(Task Initialization)：人間の指示を初期BTに変換
タスク割り当て(Task Assignment)：失敗ノードが中央割り当て器のタスク再割り当てをトリガー
BT更新(Behavior Tree Update)：新しい部分木を挿入またはロボット間のBTを同期
失敗ノード検出(Failure Node Detection)：BT実行を継続的に監視し、ボトルネックを識別

2. 行動木の形式化

行動木T = (V, E, r)。ここでVはノード集合、Eは親子エッジを定義、rはルートノード。各ノードはSuccess、Failure、またはRunning状態を返す。

シーケンスノード実行ロジック： $Seq(c_1, ..., c_n) = \begin{cases} Failure, & \exists i: c_i = Failure \\ Running, & \exists i: c_i = Running \\ Success, & \forall i: c_i = Success \end{cases}$

3. 仮想コーディネータAlex

Alexは中央割り当て器として機能し、ロボットと環境状態の共有ビューを維持する。失敗ノードfᵢが報告されると、Alexはコンテキスト情報を収集し、失敗を解決するための適切なロボットとアクションを識別する。

技術的革新点

1. 動的BT拡張

独立拡張：ロボットは自身のアクション集合を使用して失敗条件を解決
委任拡張：失敗をローカルで解決できない場合、Alexは適切な能力を持つ同伴ロボットに割り当てる

2. 前提条件と後提条件

各アクションノードaは以下に関連付けられる：

前提条件Pre(a) = {c₁ᵖʳᵉ, ..., cₘᵖʳᵉ}：実行前に満たす必要がある条件
後提条件Post(a) = {c₁ᵖᵒˢᵗ, ..., cₘᵖᵒˢᵗ}：成功実行後の結果条件

3. 失敗回復メカニズム

システムは失敗ノードを専用キューFₙₒ𝒹ₑₛに格納し、単純に上方に伝播して実行を終了するのではなく、実行ボトルネックを体系的に識別し、拡張プロセスをトリガーする能力を提供する。

実験設定

データセット

Behavior-1Kデータセット：ナビゲーション、物体操作、協調タスクを含む多様なタスク記述
サンプリング戦略：各グループ20タスク、2～20ステップの異なるアクション列をカバー
3つのシナリオ：
1. 単一の四足ロボット
2. 四足ロボット + ドローン
3. 四足ロボット + ドローン + マニピュレータ

評価指標

成功率(SR)： $SR = \frac{1}{N}\sum_{i=1}^N s_i$ 。ここでsᵢ ∈ {0,1}はタスクiが正常に完了したかを示す
平均ステップ数(AS)： $AS = \frac{1}{N}\sum_{i=1}^N k_i$ 。ここでkᵢはタスクiを完了するのに必要なBT実行ステップ数