यह पेपर स्वायत्त वाहनों की सुरक्षा प्रमाणीकरण के लिए एक जोखिम-बजटीय निगरानी और नियंत्रण ढांचा प्रस्तावित करता है। यह ढांचा स्लाइडिंग विंडो निगरानी का उपयोग करके अपर्याप्त बाधा अवशेष या गैर-शून्य पूंछ जोखिम को सुनिश्चित करता है। जब सुरक्षा मार्जिन बिगड़ता है, तो यह प्रदर्शन-आधारित शिथिल नियंत्रण बाधा फलन (R-CBF) से रूढ़िवादी सशर्त मूल्य-पर-जोखिम (CVaR-CBF) बाधा में स्विच करता है। स्विचिंग दो वास्तविक समय ट्रिगर द्वारा नियंत्रित होती है: व्यवहार्यता ट्रिगर (FT) और गुणवत्ता ट्रिगर (QT) शर्तें। सबसे चुनौतीपूर्ण पैदल यात्री पहचान अनिश्चितता (5 मीटर) सेटिंग में, यह ढांचा 300 परीक्षणों में 94-96% पैदल यात्री टकराव से बचने की सफलता दर प्राप्त करता है, जबकि न्यूनतम औसत पार्श्व ट्रैकिंग त्रुटि (CTE=3.2-3.6 मीटर) बनाए रखता है।
अनिश्चितता वाले वातावरण में स्वायत्त वाहनों का सुरक्षित नियंत्रण एक महत्वपूर्ण चुनौती है। पारंपरिक नियंत्रण बाधा फलन (CBF) सुरक्षा की गारंटी दे सकते हैं, लेकिन केवल तभी प्रभावी होते हैं जब द्विघात प्रोग्रामिंग (QP) व्यवहार्य और इष्टतम हो। निम्नलिखित समस्याओं का सामना करते समय, मौजूदा तरीकों में सीमाएं हैं:
मौजूदा तरीके पैरामीटर ट्यूनिंग, स्तरीय अनुकूलन, या सीखने-वर्धित व्यवहार्य सेट के माध्यम से व्यवहार्यता समस्याओं को हल करते हैं, लेकिन अक्सर बड़े डेटा संग्रह की आवश्यकता होती है या निरंतर अव्यवहार्यता के समय सुरक्षा को सीधे परिमाणित नहीं कर सकते। यह पेपर व्यावहारिक दृष्टिकोण से मानता है कि अव्यवहार्यता का अर्थ आवश्यक रूप से सुरक्षा का नुकसान नहीं है, और एक जोखिम-बजटीय निगरानी ढांचा प्रस्तावित करता है।
गैर-रैखिक निरंतर समय नियंत्रण-सजातीय प्रणाली पर विचार करें:
जहां और क्रमशः प्रणाली स्थिति और इनपुट का प्रतिनिधित्व करते हैं। सुरक्षा सेट को के रूप में परिभाषित किया गया है।
पारंपरिक CBF का शिथिल संस्करण, गैर-नकारात्मक शिथिल चर को शुरू करके एक्चुएटर सीमाओं के कारण अव्यवहार्यता को संभालता है:
बाधा स्थिति और वाहन स्थानीयकरण की अनिश्चितता पर विचार करते हुए, सुरक्षा मूल्यांकन को संभाव्य जोखिम रूप में परिवर्तित करता है। हानि फलन को परिभाषित करें:
जहां सुरक्षा अवशेष है।
CVaR बाधा:
शिथिल CVaR-CBF अनुकूलन:
खराब चरण पहचान: खराब चरण संकेतक को परिभाषित करें
जहां एक पूर्वनिर्धारित सुरक्षा मार्जिन है।
स्लाइडिंग विंडो निगरानी: लंबाई की स्लाइडिंग विंडो में, अधिकतम खराब चरणों की अनुमति है:
विंडो-स्तर सुरक्षा प्रमाणीकरण प्रमेय:
जहां ।
व्यवहार्यता ट्रिगर (FT-C-CBF):
1, & \text{यदि } (a_k = 0) \wedge (m_k \geq M) \\ 0, & \text{यदि } (a_k = 1) \wedge (m_k < M) \end{cases}$$ **गुणवत्ता ट्रिगर (QT-C-CBF)**: $$\eta_k = \begin{cases} 1, & \text{यदि } m_k \geq M \\ 0, & \text{यदि } m_k < M \end{cases}$$ ### तकनीकी नवाचार बिंदु 1. **जोखिम-बजट अवधारणा**: पहली बार जोखिम-बजट विचार को CBF ढांचे में शुरू किया, अल्पकालीन सुरक्षा मार्जिन में कमी की अनुमति दी 2. **विंडो-स्तर सुरक्षा गारंटी**: चरण-दर-चरण सुरक्षा गारंटी के बजाय सीमित समय क्षेत्र में सुरक्षा प्रमाणीकरण प्रदान करता है 3. **अनुकूली स्विचिंग तंत्र**: वास्तविक समय जोखिम मूल्यांकन के आधार पर बुद्धिमान स्विचिंग रणनीति ## प्रायोगिक सेटअप ### डेटासेट - GPS पथ-आधारित संदर्भ प्रक्षेपवक्र, प्रायोगिक स्वायत्त वाहन से - तीन प्रकार के पैदल यात्री इंटरैक्शन परिदृश्य: एकल पैदल यात्री, दोहरी पैदल यात्री, तीन पैदल यात्री क्रॉसिंग परिदृश्य - कुल 1500 मोंटे कार्लो रन ### मूल्यांकन मेट्रिक्स 1. **सफलता दर (SR)**: न्यूनतम वाहन-पैदल यात्री दूरी हमेशा 2.8 मीटर से अधिक रहने वाले परीक्षणों का प्रतिशत 2. **न्यूनतम पैदल यात्री दूरी (MDP)**: बाधा से बचने की प्रक्रिया में निकटतम पैदल यात्री की औसत न्यूनतम दूरी 3. **अव्यवहार्यता दर (IR)**: अनुकूलन चरणों में व्यवहार्य समाधान उत्पन्न न कर सकने का प्रतिशत 4. **कम्प्यूटेशनल समय (CT)**: प्रति चरण औसत कम्प्यूटेशनल समय 5. **पार्श्व ट्रैकिंग त्रुटि (CTE)**: वांछित पथ के सापेक्ष विचलन ### तुलना विधियां 1. **R-CBF**: शुद्ध शिथिल CBF 2. **C-CBF**: कठोर पूंछ बाधा के साथ CVaR-CBF 3. **AC-CBF**: अनुकूली CVaR-CBF 4. **RC-CBF**: शिथिल CVaR-CBF ### कार्यान्वयन विवरण - न्यूनतम सुरक्षा दूरी: $D_s = 3$ मीटर - स्लाइडिंग विंडो: $W = 5$, अधिकतम खराब चरण: $M = 1$ - सुरक्षा मार्जिन: $\delta = 1$ मीटर - CVaR आत्मविश्वास स्तर: $\epsilon = 95\%$ - वाहन स्थिति अनिश्चितता: $\sigma_v = 0.1$ मीटर - बाधा स्थिति अनिश्चितता: $\sigma_o \in \{1,2,3,4,5\}$ मीटर ## प्रायोगिक परिणाम ### मुख्य परिणाम सबसे चुनौतीपूर्ण सेटिंग में ($\sigma_v = 0.1$, $\sigma_o = 5$ मीटर, तीन पैदल यात्री परिदृश्य): | विधि | सफलता दर(%) | MDP(मीटर) | अव्यवहार्यता दर(%) | कम्प्यूटेशनल समय(ms) | CTE(मीटर) | |------|-----------|---------|-------------|--------------|---------| | R-CBF | 67% | 6.3 | 11.9% | 22.4 | 3.9 | | C-CBF | 98% | 11.3 | 15.2% | 56.2 | 4.2 | | AC-CBF | 84% | 7.33 | 17.8% | 76.9 | 5.0 | | RC-CBF | 97% | 12 | 15.3% | 75.3 | 4.3 | | **FT-C-CBF** | **94%** | **7.1** | **15.8%** | **24.2** | **3.2** | | **QT-C-CBF** | **96%** | **8.3** | **16.1%** | **25.7** | **3.6** | ### मुख्य निष्कर्ष 1. **संतुलित प्रदर्शन**: प्रस्तावित विधि C-CBF के करीब सुरक्षा (94-96% बनाम 98%) प्राप्त करती है, जबकि R-CBF के करीब प्रदर्शन बनाए रखती है (CTE 3.2-3.6 मीटर बनाम 3.9 मीटर) 2. **कम्प्यूटेशनल दक्षता**: कम्प्यूटेशनल समय रूढ़िवादी आधारभूत विधियों की तुलना में काफी कम है (24-26ms बनाम 56-75ms) 3. **QT FT से बेहतर है**: QT ट्रिगर तंत्र सभी δ मानों पर उच्च सफलता दर दिखाता है ### विलोपन प्रयोग विभिन्न सुरक्षा मार्जिन पैरामीटर δ∈{0.1, 1, 2} के लिए प्रयोग दिखाते हैं: - CVaR सक्रियण दर δ के साथ एकरस रूप से बढ़ता है - QT हमेशा FT की तुलना में उच्च सफलता दर और CVaR सक्रियण दर रखता है - बड़ा δ रूढ़िवादी नियंत्रक के पहले और अधिक बार सक्रियण की ओर ले जाता है ## संबंधित कार्य ### मुख्य अनुसंधान दिशाएं 1. **CBF सुधार विधियां**: शिथिल CBF, उच्च-क्रम CBF, सीखने-संचालित पैरामीटर ट्यूनिंग 2. **अनिश्चितता प्रबंधन**: स्टोकेस्टिक CBF, CVaR-CBF 3. **व्यवहार्यता समस्याएं**: स्तरीय अनुकूलन, सीखने-वर्धित व्यवहार्य सेट ### इस पेपर के लाभ मौजूदा कार्य की तुलना में, इस पेपर द्वारा प्रस्तावित जोखिम-बजटीय निगरानी ढांचा: 1. बड़े डेटा संग्रह की आवश्यकता नहीं है 2. स्पष्ट सुरक्षा प्रमाणीकरण प्रदान करता है 3. प्रदर्शन और सुरक्षा का प्रभावी संतुलन प्राप्त करता है 4. कम्प्यूटेशनल रूप से कुशल है, वास्तविक समय अनुप्रयोगों के लिए उपयुक्त है ## निष्कर्ष और चर्चा ### मुख्य निष्कर्ष 1. जोखिम-बजटीय निगरानीकर्ता स्वायत्त वाहनों में प्रदर्शन और सुरक्षा आवश्यकताओं को प्रभावी ढंग से संतुलित कर सकता है 2. विंडो-स्तर सुरक्षा प्रमाणीकरण चरण-दर-चरण सुरक्षा गारंटी की तुलना में अधिक व्यावहारिक है 3. QT ट्रिगर तंत्र FT ट्रिगर तंत्र से बेहतर है 4. यह ढांचा कम्प्यूटेशनल दक्षता और सुरक्षा प्रदर्शन दोनों में महत्वपूर्ण लाभ प्रदान करता है ### सीमाएं 1. **पैरामीटर ट्यूनिंग**: विंडो आकार W, अधिकतम खराब चरण M आदि पैरामीटर को विशिष्ट अनुप्रयोग के अनुसार ट्यून करने की आवश्यकता है 2. **सैद्धांतिक मान्यताएं**: पर्याप्त छोटे नमूना समय की मान्यता पर आधारित है 3. **परिदृश्य सीमाएं**: मुख्य रूप से पैदल यात्री बाधा परिदृश्यों में सत्यापित, अन्य जटिल परिदृश्यों में सत्यापन की आवश्यकता है 4. **हार्डवेयर सत्यापन**: अभी तक वास्तविक वाहन प्लेटफॉर्म पर सत्यापित नहीं किया गया है ### भविष्य की दिशाएं 1. वास्तविक स्वायत्त वाहन प्लेटफॉर्म पर हार्डवेयर-इन-द-लूप और सड़क सत्यापन 2. अधिक जटिल बहु-एजेंट इंटरैक्शन परिदृश्यों तक विस्तार 3. पैरामीटर के अनुकूली ट्यूनिंग विधियों का अनुसंधान 4. अन्य सुरक्षा प्रमाणीकरण विधियों के साथ एकीकरण की खोज ## गहन मूल्यांकन ### शक्तियां 1. **सैद्धांतिक योगदान**: नई जोखिम-बजट अवधारणा प्रस्तावित करता है, CBF ढांचे के लिए नई सैद्धांतिक नींव प्रदान करता है 2. **व्यावहारिक मूल्य**: CBF के व्यावहारिक अनुप्रयोग में व्यवहार्यता समस्या को हल करता है, बहुत मजबूत इंजीनियरिंग मूल्य है 3. **पर्याप्त प्रयोग**: 1500 मोंटे कार्लो प्रयोग, कई तुलना विधियां, परिणाम सत्यापन योग्य हैं 4. **गणितीय कठोरता**: पूर्ण सैद्धांतिक प्रमाण और सुरक्षा प्रमाणीकरण प्रदान करता है ### कमियां 1. **जटिलता**: कई पैरामीटर (W, M, δ, ν) शुरू किए गए हैं, पैरामीटर ट्यूनिंग जटिल हो सकती है 2. **रूढ़िवाद**: कुछ मामलों में अभी भी बहुत रूढ़िवादी हो सकता है 3. **प्रयोज्यता सीमा**: मुख्य रूप से विशिष्ट प्रकार की बाधा समस्याओं के लिए, सामान्यीकरण क्षमता सत्यापन की आवश्यकता है 4. **वास्तविक समय**: हालांकि कम्प्यूटेशनल समय में सुधार हुआ है, चरम परिस्थितियों में अभी भी वास्तविक समय चुनौतियों का सामना कर सकता है ### प्रभाव 1. **शैक्षणिक प्रभाव**: CBF क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है, अधिक संबंधित कार्य को प्रेरित कर सकता है 2. **औद्योगिक मूल्य**: स्वायत्त वाहन सुरक्षा नियंत्रण के लिए व्यावहारिक समाधान प्रदान करता है 3. **पुनरुत्पादनीयता**: विधि विवरण स्पष्ट है, पैरामीटर सेटिंग स्पष्ट है, अच्छी पुनरुत्पादनीयता है ### प्रयोज्य परिदृश्य 1. **स्वायत्त वाहन**: विशेष रूप से शहरी वातावरण में पैदल यात्री बाधा के लिए उपयुक्त 2. **रोबोट नेविगेशन**: मोबाइल रोबोट के सुरक्षित नेविगेशन तक विस्तारित किया जा सकता है 3. **औद्योगिक नियंत्रण**: सुरक्षा गारंटी की आवश्यकता वाली औद्योगिक नियंत्रण प्रणालियों के लिए उपयुक्त ## संदर्भ पेपर CBF सिद्धांत, स्टोकेस्टिक नियंत्रण, जोखिम प्रबंधन और अन्य क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हुए 21 संबंधित संदर्भों का हवाला देता है, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है। --- **समग्र मूल्यांकन**: यह नियंत्रण सिद्धांत का एक उच्च-गुणवत्ता वाला पेपर है, जो सैद्धांतिक नवाचार और व्यावहारिक अनुप्रयोग के बीच एक अच्छा संतुलन पाता है। जोखिम-बजटीय निगरानी की अवधारणा नई और व्यावहारिक है, प्रायोगिक सत्यापन पर्याप्त है, और स्वायत्त वाहन सुरक्षा नियंत्रण क्षेत्र में महत्वपूर्ण योगदान है।