LLM-HBT: Dynamic Behavior Tree Construction for Adaptive Coordination in Heterogeneous Robots
Wang, Sun, Zhang et al.
We introduce a novel framework for automatic behavior tree (BT) construction in heterogeneous multi-robot systems, designed to address the challenges of adaptability and robustness in dynamic environments. Traditional robots are limited by fixed functional attributes and cannot efficiently reconfigure their strategies in response to task failures or environmental changes. To overcome this limitation, we leverage large language models (LLMs) to generate and extend BTs dynamically, combining the reasoning and generalization power of LLMs with the modularity and recovery capability of BTs. The proposed framework consists of four interconnected modules task initialization, task assignment, BT update, and failure node detection which operate in a closed loop. Robots tick their BTs during execution, and upon encountering a failure node, they can either extend the tree locally or invoke a centralized virtual coordinator (Alex) to reassign subtasks and synchronize BTs across peers. This design enables long-term cooperative execution in heterogeneous teams. We validate the framework on 60 tasks across three simulated scenarios and in a real-world cafe environment with a robotic arm and a wheeled-legged robot. Results show that our method consistently outperforms baseline approaches in task success rate, robustness, and scalability, demonstrating its effectiveness for multi-robot collaboration in complex scenarios.
academic
LLM-HBT: विषमांगी रोबोट में अनुकूली समन्वय के लिए गतिशील व्यवहार वृक्ष निर्माण
यह पेपर विषमांगी बहु-रोबोट प्रणालियों में स्वचालित व्यवहार वृक्ष (BT) निर्माण के लिए एक नई रूपरेखा प्रस्तावित करता है, जिसका उद्देश्य गतिशील वातावरण में अनुकूलनशीलता और मजबूती की चुनौतियों को हल करना है। पारंपरिक रोबोट निश्चित कार्यात्मक गुणों तक सीमित हैं और कार्य विफलता या पर्यावरणीय परिवर्तन के समय नीति को कुशलतापूर्वक पुनः कॉन्फ़िगर नहीं कर सकते। इस सीमा को दूर करने के लिए, लेखक बड़े भाषा मॉडल (LLM) का उपयोग करके गतिशील रूप से व्यवहार वृक्ष उत्पन्न और विस्तारित करते हैं, LLM की तर्क और सामान्यीकरण क्षमता को BT की मॉड्यूलरिटी और पुनर्प्राप्ति क्षमता के साथ जोड़ते हैं। यह रूपरेखा चार परस्पर जुड़े मॉड्यूल - कार्य आरंभीकरण, कार्य आवंटन, BT अपडेट और विफलता नोड पहचान - को शामिल करती है जो एक बंद लूप संचालन बनाते हैं। रोबोट निष्पादन के दौरान अपने BT को चलाते हैं, विफलता नोड का सामना करने पर स्थानीय रूप से वृक्ष को विस्तारित कर सकते हैं या केंद्रीय आभासी समन्वयक (Alex) को कॉल कर सकते हैं जो उप-कार्यों को पुनः आवंटित करता है और साथियों के BT को सिंक्रोनाइज़ करता है।
अपर्याप्त अनुकूलनशीलता: पारंपरिक बहु-रोबोट प्रणालियां गतिशील और असंरचित वातावरण में सामान्यीकरण करने में कठिनाई का सामना करती हैं, पूर्वनिर्धारित पूर्वधारणाओं और सीमित प्रशिक्षण डेटा पर गंभीर रूप से निर्भर हैं
निर्णय ढांचे की कठोरता: मौजूदा निर्णय ढांचे या तो ऑनलाइन पुनः कॉन्फ़िगरेशन का समर्थन करने के लिए बहुत कठोर हैं, या दीर्घकालिक मजबूती सुनिश्चित करने के लिए बहुत नाजुक हैं
विषमांगी समन्वय चुनौती: विषमांगी रोबोट में विभिन्न क्षमताएं होती हैं, रनटाइम पर सहयोगी पुनर्निर्माण और व्यवहार वृक्ष साझा करना अभी तक पूरी तरह से समाधान नहीं हुआ है
बहु-रोबोट प्रणालियां परिचालन दक्षता बढ़ाने में विशाल संभावना रखती हैं, लेकिन गतिशील वातावरण में विफलताओं, पर्यावरणीय परिवर्तनों और अप्रत्याशित परिस्थितियों के अनुकूल होना चाहिए। यह खोज और बचाव, गोदाम स्वचालन, सेवा रोबोट आदि जैसे व्यावहारिक अनुप्रयोगों में महत्वपूर्ण है।
LLM-आधारित विधियां: हालांकि मजबूत तर्क क्षमता प्रदर्शित करती हैं, लेकिन आमतौर पर एकल-पास तरीके से कार्य योजना उत्पन्न करती हैं, निष्पादन शुरू होने के बाद ऑनलाइन सुधार तंत्र की कमी है
व्यवहार वृक्ष-आधारित विधियां: मॉड्यूलरिटी और पुनर्प्राप्ति तंत्र प्रदान करती हैं, लेकिन मैन्युअल रूप से डिज़ाइन किए गए क्रिया नोड्स और पूर्वनिर्धारित कार्य संरचना पर गंभीर रूप से निर्भर हैं
एकीकृत रूपरेखा की कमी: मौजूदा अनुसंधान LLM की शब्दार्थ तर्क क्षमता और BT की संरचनात्मक मजबूती को पूरी तरह से एकीकृत करने में विफल रहा है
गतिशील रूपरेखा: बड़े भाषा मॉडल तर्क और व्यवहार वृक्ष को एकीकृत करने वाली गतिशील रूपरेखा प्रस्तावित करता है, विषमांगी बहु-रोबोट समन्वय के लिए
हाइब्रिड तंत्र: केंद्रीकृत-वितरित हाइब्रिड तंत्र डिज़ाइन करता है, स्थानीय BT विस्तार और केंद्रीकृत कार्य पुनः आवंटन के माध्यम से रनटाइम अनुकूलन प्राप्त करता है
नया बेंचमार्क: विविध सिमुलेशन कार्यों और वास्तविक-विश्व वातावरण को शामिल करने वाला नया बेंचमार्क बनाता है, विधि की मजबूती और स्केलेबिलिटी को सत्यापित करता है
बंद लूप निष्पादन: विफलता पहचान, तर्क और वृक्ष अनुकूलन का बंद लूप चक्र लागू करता है, विषमांगी रोबोट को निष्पादन रणनीति को निरंतर अनुकूलित करने में सक्षम बनाता है
विषमांगी बहु-रोबोट प्रणाली (HMRS) R = {r₁, ..., rₙ} पर विचार करें, जहां प्रत्येक रोबोट rᵢ में क्रिया स्थान है:
Ai={ai1,...,aimi}
विषमांगीता Aᵢ ≠ Aⱼ (i ≠ j) में परिलक्षित होती है, जो आकृति विज्ञान और क्षमता अंतर को दर्शाती है। कार्य τ आवश्यक क्रियाओं के समुच्चय Aτ ⊆ ⋃ᵢ Aᵢ द्वारा प्रतिनिधित्व किया जाता है।
व्यवहार वृक्ष T = (V, E, r), जहां V नोड्स का समुच्चय है, E माता-पिता-बच्चे के किनारों को परिभाषित करता है, r मूल नोड है। प्रत्येक नोड Success, Failure या Running स्थिति लौटाता है।
Alex केंद्रीय आवंटक के रूप में कार्य करता है, रोबोट और पर्यावरणीय स्थिति का साझा दृश्य बनाए रखता है। जब विफलता नोड fᵢ की रिपोर्ट की जाती है, तो Alex संदर्भ जानकारी एकत्र करता है और विफलता को हल करने के लिए उपयुक्त रोबोट और क्रियाओं की पहचान करता है।
प्रणाली विफलता नोड्स को समर्पित कतार Fₙₒ𝒹ₑₛ में संग्रहीत करती है, बजाय सरल ऊपर की ओर प्रसार के। यह निष्पादन बाधाओं की व्यवस्थित पहचान और विस्तार प्रक्रिया को ट्रिगर करने की क्षमता प्रदान करता है।
पूर्ण सफलता दर: LLM-HBT सभी परिदृश्यों में 100% सफलता दर प्राप्त करता है, जबकि आधारभूत विधियां विषमांगीता और कार्य जटिलता के साथ महत्वपूर्ण रूप से गिरती हैं
दक्षता में सुधार: सबसे चुनौतीपूर्ण परिदृश्य 3 में, LLM-HBT की औसत चरण (8.4) MCTS (8.80) और LLM-MCTS (9.00) से कम है
मजबूती सत्यापन: परिदृश्य 3 में, आधारभूत विधियां केवल 40% कार्य सफलतापूर्वक पूरा करती हैं, जबकि LLM-HBT 100% सफलता दर बनाए रखता है
कैफे वातावरण में, रोबोटिक आर्म और पहिएदार पैरों वाला रोबोट बोतल को काउंटर पर रखने के लिए सहयोग करते हैं:
कार्य प्रवाह: रोबोटिक आर्म बोतल के लिए पकड़ने योग्य कार्य स्थान में पूर्व शर्त स्थापित करता है → पहिएदार रोबोट बोतल प्राप्त करने के लिए नेविगेट करता है → रोबोटिक आर्म पकड़ना और रखना पूरा करता है
परिणाम: सभी 10 परीक्षण सफल, वास्तविक वातावरण में रूपरेखा की प्रभावशीलता को सत्यापित करता है
पेपर संबंधित क्षेत्र के महत्वपूर्ण कार्यों का हवाला देता है, जिसमें शामिल हैं:
रोबोटिक्स में व्यवहार वृक्ष का अनुप्रयोग 6,7,9
LLM-आधारित बहु-रोबोट योजना 14,15,16
विषमांगी बहु-रोबोट प्रणालियों का कार्य आवंटन 2,12,13
व्यवहार वृक्ष स्वचालित डिजाइन की नवीनतम प्रगति 10,11
समग्र मूल्यांकन: यह पेपर एक तकनीकी रूप से नवीन और प्रायोगिक रूप से सत्यापित विषमांगी बहु-रोबोट समन्वय रूपरेखा प्रस्तावित करता है। LLM और BT का संयोजन इस क्षेत्र के लिए नई समस्या-समाधान सोच प्रदान करता है, महत्वपूर्ण शैक्षणिक मूल्य और व्यावहारिक संभावना रखता है। कुछ सीमाओं के बावजूद, समग्र गुणवत्ता उच्च है और भविष्य के संबंधित अनुसंधान के लिए एक अच्छा आधार प्रदान करता है।