We introduce a novel framework for automatic behavior tree (BT) construction in heterogeneous multi-robot systems, designed to address the challenges of adaptability and robustness in dynamic environments. Traditional robots are limited by fixed functional attributes and cannot efficiently reconfigure their strategies in response to task failures or environmental changes. To overcome this limitation, we leverage large language models (LLMs) to generate and extend BTs dynamically, combining the reasoning and generalization power of LLMs with the modularity and recovery capability of BTs. The proposed framework consists of four interconnected modules task initialization, task assignment, BT update, and failure node detection which operate in a closed loop. Robots tick their BTs during execution, and upon encountering a failure node, they can either extend the tree locally or invoke a centralized virtual coordinator (Alex) to reassign subtasks and synchronize BTs across peers. This design enables long-term cooperative execution in heterogeneous teams. We validate the framework on 60 tasks across three simulated scenarios and in a real-world cafe environment with a robotic arm and a wheeled-legged robot. Results show that our method consistently outperforms baseline approaches in task success rate, robustness, and scalability, demonstrating its effectiveness for multi-robot collaboration in complex scenarios.
論文ID : 2510.09963タイトル : LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots著者 : Chao-ran Wang, Jingyuan Sun*, Yan-hui Zhang, Mingyu Zhang, Chang-ju Wu*分類 : cs.RO (ロボティクス)発表日 : 2025年10月11日 (arXiv プレプリント)論文リンク : https://arxiv.org/abs/2510.09963 本論文は、異種多ロボットシステムにおける自動行動木(BT)構築のための新しいフレームワークを提案し、動的環境における適応性と堅牢性の課題に対処することを目的としている。従来のロボットは固定された機能属性に制限されており、タスク失敗や環境変化時に効率的にポリシーを再構成することができない。この制限を克服するため、著者らは大規模言語モデル(LLM)を利用して行動木を動的に生成・拡張し、LLMの推論と汎化能力とBTのモジュール性と回復能力を組み合わせている。本フレームワークは、タスク初期化、タスク割り当て、BT更新、失敗ノード検出という4つの相互接続されたモジュールで構成され、閉ループ動作を形成する。ロボットは実行中にそのBTを実行し、失敗ノードに遭遇した場合、木をローカルに拡張するか、中央仮想コーディネータ(Alex)を呼び出してサブタスクを再割り当てし、同伴ロボットのBTを同期することができる。
適応性の不足 :従来の多ロボットシステムは動的で非構造化された環境での汎化が困難であり、事前定義されたプライアーと限定的な訓練データに大きく依存している意思決定フレームワークの硬直性 :既存の意思決定フレームワークは、オンライン再構成をサポートするには過度に硬直しているか、長期的な堅牢性を保証するには過度に脆弱である異種協調の課題 :異種ロボットは異なる能力を持つが、実行時の協調的な再構築と行動木の共有方法は十分に解決されていない多ロボットシステムは運用効率の向上に大きな可能性を持つが、動的環境では失敗、環境変化、予期しない状況に適応する必要がある。これは捜索救助、倉庫自動化、サービスロボットなどの実際のアプリケーションにおいて極めて重要である。
LLMベースの手法 :強力な推論能力を示す一方で、通常はタスク計画を単一パスで生成し、実行開始後のオンライン修正メカニズムが不足している行動木ベースの手法 :モジュール性と回復メカニズムを提供するが、手動で設計されたアクションノードと事前定義されたタスク構造に大きく依存している統一フレームワークの欠如 :既存研究はLLMのセマンティック推論能力とBTの構造的堅牢性を十分に統合していない動的フレームワーク :大規模言語モデルの推論と行動木を統合した動的フレームワークを提案し、異種多ロボット協調に対応ハイブリッドメカニズム :集中型-分散型ハイブリッドメカニズムを設計し、ローカルBT拡張と集中型タスク再割り当てを通じた実行時適応を実現新しいベンチマーク :多様なシミュレーションタスクと実世界環境を含む新しいベンチマークを構築し、手法の堅牢性とスケーラビリティを検証閉ループ実行 :失敗検出、推論、木適応の閉ループサイクルを実装し、異種ロボットが実行戦略を継続的に最適化できるようにする異種多ロボットシステム(HMRS) R = {r₁, ..., rₙ}を考える。ここで各ロボットrᵢはアクション空間を持つ:
A i = { a i 1 , . . . , a i m i } A_i = \{a_i^1, ..., a_i^{m_i}\} A i = { a i 1 , ... , a i m i }
異種性はAᵢ ≠ Aⱼ (i ≠ j)に現れ、形態と能力の違いを反映している。タスクτは必要なアクション集合Aτ ⊆ ⋃ᵢ Aᵢで表現される。
フレームワークは4つの相互接続されたモジュールで構成される:
タスク初期化(Task Initialization) :人間の指示を初期BTに変換タスク割り当て(Task Assignment) :失敗ノードが中央割り当て器のタスク再割り当てをトリガーBT更新(Behavior Tree Update) :新しい部分木を挿入またはロボット間のBTを同期失敗ノード検出(Failure Node Detection) :BT実行を継続的に監視し、ボトルネックを識別行動木T = (V, E, r)。ここでVはノード集合、Eは親子エッジを定義、rはルートノード。各ノードはSuccess、Failure、またはRunning状態を返す。
シーケンスノード実行ロジック:
S e q ( c 1 , . . . , c n ) = { F a i l u r e , ∃ i : c i = F a i l u r e R u n n i n g , ∃ i : c i = R u n n i n g S u c c e s s , ∀ i : c i = S u c c e s s Seq(c_1, ..., c_n) = \begin{cases}
Failure, & \exists i: c_i = Failure \\
Running, & \exists i: c_i = Running \\
Success, & \forall i: c_i = Success
\end{cases} S e q ( c 1 , ... , c n ) = ⎩ ⎨ ⎧ F ai l u re , R u nnin g , S u ccess , ∃ i : c i = F ai l u re ∃ i : c i = R u nnin g ∀ i : c i = S u ccess
Alexは中央割り当て器として機能し、ロボットと環境状態の共有ビューを維持する。失敗ノードfᵢが報告されると、Alexはコンテキスト情報を収集し、失敗を解決するための適切なロボットとアクションを識別する。
独立拡張 :ロボットは自身のアクション集合を使用して失敗条件を解決委任拡張 :失敗をローカルで解決できない場合、Alexは適切な能力を持つ同伴ロボットに割り当てる各アクションノードaは以下に関連付けられる:
前提条件Pre(a) = {c₁ᵖʳᵉ, ..., cₘᵖʳᵉ}:実行前に満たす必要がある条件 後提条件Post(a) = {c₁ᵖᵒˢᵗ, ..., cₘᵖᵒˢᵗ}:成功実行後の結果条件 システムは失敗ノードを専用キューFₙₒ𝒹ₑₛに格納し、単純に上方に伝播して実行を終了するのではなく、実行ボトルネックを体系的に識別し、拡張プロセスをトリガーする能力を提供する。
Behavior-1Kデータセット :ナビゲーション、物体操作、協調タスクを含む多様なタスク記述サンプリング戦略 :各グループ20タスク、2~20ステップの異なるアクション列をカバー3つのシナリオ :
単一の四足ロボット 四足ロボット + ドローン 四足ロボット + ドローン + マニピュレータ 成功率(SR) :S R = 1 N ∑ i = 1 N s i SR = \frac{1}{N}\sum_{i=1}^N s_i SR = N 1 ∑ i = 1 N s i 。ここでsᵢ ∈ {0,1}はタスクiが正常に完了したかを示す平均ステップ数(AS) :A S = 1 N ∑ i = 1 N k i AS = \frac{1}{N}\sum_{i=1}^N k_i A S = N 1 ∑ i = 1 N k i 。ここでkᵢはタスクiを完了するのに必要なBT実行ステップ数MCTS :モンテカルロ木探索のみを使用したアクション計画LLM-MCTS :LLMが生成した世界モデルで強化されたMCTSMCTSとLLM-MCTSは同じ500シミュレーション予算と最大探索深度20で構成 各シナリオの20タスクは5回の独立試験で実行され、初期位置はランダム化 実世界実験はカフェ環境で10回の反復試験を実施 手法 シナリオ1 シナリオ2 シナリオ3 SR(%) AS SR(%) AS SR(%) AS MCTS 95 3.95 55 4.91 35 8.80 LLM-MCTS 90 4.11 55 5.18 35 9.00 LLM-HBT 100 4.05100 5.05100 8.4
完全な成功率 :LLM-HBTはすべてのシナリオで100%の成功率を達成し、ベースライン手法は異種性とタスク複雑性の増加に伴い大幅に低下効率の向上 :最も困難なシナリオ3では、LLM-HBTの平均ステップ数(8.4)はMCTS(8.80)とLLM-MCTS(9.00)より低い堅牢性の検証 :シナリオ3では、ベースライン手法はタスクの40%のみを成功させたが、LLM-HBTは100%の成功率を維持カフェ環境において、マニピュレータと車輪付き脚式ロボットが協力してボトルをカウンターに配置:
タスクフロー :マニピュレータがボトルを把握可能な作業空間に配置する前提条件を確立→車輪付きロボットがナビゲートしてボトルを取得→マニピュレータが把握と配置を完了結果 :10回の試験すべてが成功し、実世界環境でのフレームワークの有効性を検証20タスク×3手法の詳細な結果は以下を示す:
グループ1 :LLM-HBTはすべてのタスクを完了し、ベースラインはT12、T16などのタスクで失敗グループ2 :LLM-HBTはベースラインが失敗したT3、T4、T20などのタスクを成功させるグループ3 :ベースラインはほとんどのタスクで失敗(「x」でマーク)し、LLM-HBTはほぼすべてのタスクで成功既存手法は通常、手動のコスト関数設計または簡略化された仮定の下での実行が必要 本論文はLLM推論によって手工のコスト関数の必要性を排除し、BT構造を動的に拡張 既存研究は主に同種ロボットシステムに焦点を当てており、構造化された実行フレームワークが不足している 異種ロボット協調はまだ十分に探索されていない 本研究は、異種多ロボットシステムのLLM推論と動的BT構築を初めて統合し、この分野のギャップを埋める。
有効性の検証 :LLM-HBTはタスク成功率と実行効率を大幅に向上させる適応性の強化 :閉ループメカニズムにより、ロボットは実行戦略を継続的に最適化できる異種協調 :異なる能力を持つロボット間の動的なタスク再割り当てを成功させるLLM推論遅延 :リアルタイム性が高いアプリケーションに影響する可能性がある実世界検証の範囲 :現在、カフェ環境でのみ検証されている通信依存性 :ロボット間の信頼できる通信が必要遅延認識設計 :推論遅延を考慮した最適化メカニズムの開発通信効率的な分散化 :中央コーディネータへの依存性を減らす知覚不確実性への堅牢性 :ノイズと不完全な観測下での堅牢な回復メカニズム手法の革新性 :LLM推論とBT動的構築を初めて体系的に統合し、技術ルートが新規実験の充実性 :シミュレーションと実世界環境を含む多シナリオ検証が包括的結果の説得力 :100%の成功率と効率向上は強い説得力を持つ理論的基礎 :形式的定義が明確で、数学的表現が厳密完全な成功率への疑問 :100%の成功率はタスクが比較的単純であるか過学習の存在を示唆する可能性がある計算オーバーヘッドの分析不足 :LLM推論の計算コストと時間オーバーヘッドが詳細に分析されていないスケーラビリティ検証の不足 :最大3ロボットのみテストされており、大規模システムのスケーラビリティが未検証失敗モード分析の欠如 :極端な状況での失敗モードが十分に分析されていない学術的貢献 :多ロボット協調に新しい技術パラダイムを提供実用的価値 :サービスロボット、工業自動化などの分野に応用可能再現性 :手法の説明は詳細だが、コードとデータセットの利用可能性が明確でないサービスロボット :レストラン、ホテルなど多ロボット協作が必要なサービスシーン工業自動化 :異種ロボットの協調が必要な複雑な組立タスク捜索救助タスク :動的環境における異なるタイプのロボットの協調作業倉庫物流 :複数タイプロボットのインテリジェント調度とタスク割り当て論文は関連分野の重要な研究を引用している。以下を含む:
ロボティクスにおける行動木の応用 6,7,9 LLMベースの多ロボット計画 14,15,16 異種多ロボットシステムのタスク割り当て 2,12,13 行動木自動設計の最新進展 10,11 総合評価 :本論文は、技術的革新性が強く、実験検証が充分な異種多ロボット協調フレームワークを提案している。LLMとBTの組み合わせは当該分野に新しい解決思路を提供し、重要な学術的価値と実用的可能性を持つ。いくつかの制限事項があるが、全体的な質は高く、今後の関連研究の基礎を築いている。