2025-11-25T18:04:25.210324

Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles

Chang, Renganathan, Ahmed
This paper presents a risk-budgeted monitor with a control framework that certifies safety for autonomous driving. In this process, a sliding window is proposed to monitor for insufficient barrier residuals or nonzero tail risk, ensuring system safety. When the safety margin deteriorates, it triggers switching the safety constraint from a performance-based relaxed-control barrier function (R-CBF) to a conservative conditional value at risk (CVaR-CBF) to address the safety concern. This switching is governed by two real-time triggers: Feasibility-Triggered (FT) and Quality-Triggered (QT) conditions. In the FT condition, if the R-CBF constraint becomes infeasible or yields a suboptimal solution, the risk monitor triggers the use of the CVaR constraints for the controller. In the QT condition, the risk monitor observes the safety margin of the R-CBF solution at every step, regardless of feasibility. If it falls below the safety margin, the safety filter switches to the CVaR-CBF constraints. The proposed framework is evaluated using a model predictive controller (MPC) for autonomous driving in the presence of autonomous vehicle (AV) localization noise and obstacle position uncertainties. Multiple AV-pedestrian interaction scenarios are considered, with 1,500 Monte Carlo runs conducted for all scenarios. In the most challenging setting with pedestrian detection uncertainty of 5 m, the proposed framework achieves a 94-96% success rate of not colliding with the pedestrians over 300 trials while maintaining the lowest mean cross-track error (CTE = 3.2-3.6 m) to the reference path. The reduced CTE indicates faster trajectory recovery after obstacle avoidance, demonstrating a balance between safety and performance.
academic

स्वायत्त वाहनों में संतुलित प्रदर्शन और सुरक्षा के लिए जोखिम-बजटीय नियंत्रण ढांचा

मूल जानकारी

  • पेपर ID: 2510.10442
  • शीर्षक: Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles
  • लेखक: Pei Yu Chang, Vishnu Renganathan, Qadeer Ahmed (ओहियो स्टेट विश्वविद्यालय)
  • वर्गीकरण: eess.SY (प्रणाली और नियंत्रण), cs.SY (प्रणाली और नियंत्रण)
  • प्रकाशन समय: 25 अक्टूबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.10442

सारांश

यह पेपर स्वायत्त वाहनों की सुरक्षा प्रमाणीकरण के लिए एक जोखिम-बजटीय निगरानी और नियंत्रण ढांचा प्रस्तावित करता है। यह ढांचा स्लाइडिंग विंडो निगरानी का उपयोग करके अपर्याप्त बाधा अवशेष या गैर-शून्य पूंछ जोखिम को सुनिश्चित करता है। जब सुरक्षा मार्जिन बिगड़ता है, तो यह प्रदर्शन-आधारित शिथिल नियंत्रण बाधा फलन (R-CBF) से रूढ़िवादी सशर्त मूल्य-पर-जोखिम (CVaR-CBF) बाधा में स्विच करता है। स्विचिंग दो वास्तविक समय ट्रिगर द्वारा नियंत्रित होती है: व्यवहार्यता ट्रिगर (FT) और गुणवत्ता ट्रिगर (QT) शर्तें। सबसे चुनौतीपूर्ण पैदल यात्री पहचान अनिश्चितता (5 मीटर) सेटिंग में, यह ढांचा 300 परीक्षणों में 94-96% पैदल यात्री टकराव से बचने की सफलता दर प्राप्त करता है, जबकि न्यूनतम औसत पार्श्व ट्रैकिंग त्रुटि (CTE=3.2-3.6 मीटर) बनाए रखता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

अनिश्चितता वाले वातावरण में स्वायत्त वाहनों का सुरक्षित नियंत्रण एक महत्वपूर्ण चुनौती है। पारंपरिक नियंत्रण बाधा फलन (CBF) सुरक्षा की गारंटी दे सकते हैं, लेकिन केवल तभी प्रभावी होते हैं जब द्विघात प्रोग्रामिंग (QP) व्यवहार्य और इष्टतम हो। निम्नलिखित समस्याओं का सामना करते समय, मौजूदा तरीकों में सीमाएं हैं:

  1. कम्प्यूटेशनल जटिलता: अनिश्चितता कम्प्यूटेशनल आवश्यकताओं को बहुत बढ़ाती है, जबकि नियंत्रक को 20-50Hz आवृत्ति पर चलना चाहिए
  2. व्यवहार्यता समस्याएं: इनपुट बाधाएं और सुरक्षा बाधाएं आंतरिक QP को अव्यवहार्य बना सकती हैं
  3. प्रदर्शन और सुरक्षा का व्यापार: रूढ़िवादी सुरक्षा रणनीति प्रदर्शन को बलिदान करती है, जबकि आक्रामक प्रदर्शन रणनीति सुरक्षा आवश्यकताओं का उल्लंघन कर सकती है

अनुसंधान प्रेरणा

मौजूदा तरीके पैरामीटर ट्यूनिंग, स्तरीय अनुकूलन, या सीखने-वर्धित व्यवहार्य सेट के माध्यम से व्यवहार्यता समस्याओं को हल करते हैं, लेकिन अक्सर बड़े डेटा संग्रह की आवश्यकता होती है या निरंतर अव्यवहार्यता के समय सुरक्षा को सीधे परिमाणित नहीं कर सकते। यह पेपर व्यावहारिक दृष्टिकोण से मानता है कि अव्यवहार्यता का अर्थ आवश्यक रूप से सुरक्षा का नुकसान नहीं है, और एक जोखिम-बजटीय निगरानी ढांचा प्रस्तावित करता है।

मुख्य योगदान

  1. औपचारिक जोखिम-बजटीय निगरानीकर्ता: सीमित समय क्षेत्र में विंडोकृत सुरक्षा गारंटी प्रदान करता है
  2. निगरानी-संचालित स्विचिंग तंत्र: प्रदर्शन-केंद्रित CBF-QP और रूढ़िवादी CVaR-CBF के बीच वास्तविक समय नेविगेशन, पूंछ जोखिम को सीमित करता है
  3. सैद्धांतिक और प्रायोगिक सत्यापन: साबित करता है कि जोखिम-बजट नियंत्रित क्षणिक अव्यवहार्यता की अनुमति देता है, जबकि प्रमाणित सीमित समय क्षेत्र सुरक्षा बनाए रखता है

विधि विवरण

कार्य परिभाषा

गैर-रैखिक निरंतर समय नियंत्रण-सजातीय प्रणाली पर विचार करें: x˙=f(x)+g(x)u\dot{x} = f(x) + g(x)u

जहां xDRnx \in D \subset \mathbb{R}^n और uURmu \in U \subset \mathbb{R}^m क्रमशः प्रणाली स्थिति और इनपुट का प्रतिनिधित्व करते हैं। सुरक्षा सेट को S={x:h(x)0}S = \{x : h(x) \geq 0\} के रूप में परिभाषित किया गया है।

मॉडल आर्किटेक्चर

1. शिथिल CBF (R-CBF)

पारंपरिक CBF का शिथिल संस्करण, गैर-नकारात्मक शिथिल चर νk\nu_k को शुरू करके एक्चुएटर सीमाओं के कारण अव्यवहार्यता को संभालता है:

minukU,νk012ukuknom2+ρννk2\min_{u_k \in U, \nu_k \geq 0} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2s.t. Lfh(xk)+Lgh(xk)uk+κh(xk)νk\text{s.t. } L_f h(x_k) + L_g h(x_k)u_k + \kappa h(x_k) \geq -\nu_k

2. स्टोकेस्टिक सुरक्षा सेट और CVaR-CBF

बाधा स्थिति और वाहन स्थानीयकरण की अनिश्चितता पर विचार करते हुए, सुरक्षा मूल्यांकन को संभाव्य जोखिम रूप में परिवर्तित करता है। हानि फलन को परिभाषित करें: Zki(uk):=rki(uk)Z_k^i(u_k) := -r_k^i(u_k)

जहां rki(uk)r_k^i(u_k) सुरक्षा अवशेष है।

CVaR बाधा: CVaRϵ(Zk+1i)=infγR{γ+11ϵE[(Zk+1iγ)+]}\text{CVaR}_\epsilon(Z_{k+1}^i) = \inf_{\gamma \in \mathbb{R}} \left\{\gamma + \frac{1}{1-\epsilon}\mathbb{E}[(Z_{k+1}^i - \gamma)^+]\right\}

शिथिल CVaR-CBF अनुकूलन: minukU,νkR12ukuknom2+ρννk2\min_{u_k \in U, \nu_k \in \mathbb{R}} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2s.t. CVaRϵ(Zk+1i)νk,0νkνˉ\text{s.t. } \text{CVaR}_\epsilon(Z_{k+1}^i) \leq \nu_k, \quad 0 \leq \nu_k \leq \bar{\nu}

3. जोखिम-बजटीय निगरानीकर्ता

खराब चरण पहचान: खराब चरण संकेतक को परिभाषित करें bk=1{νk>νˉ}1{rmin,k<δ}b_k = \mathbf{1}\{\nu_k > \bar{\nu}\} \vee \mathbf{1}\{r_{\min,k} < \delta\}

जहां δ>0\delta > 0 एक पूर्वनिर्धारित सुरक्षा मार्जिन है।

स्लाइडिंग विंडो निगरानी: लंबाई WW की स्लाइडिंग विंडो में, अधिकतम MM खराब चरणों की अनुमति है: mk=mk1+bkbkWm_k = m_{k-1} + b_k - b_{k-W}

विंडो-स्तर सुरक्षा प्रमाणीकरण प्रमेय: μM(1μWM)δ(1μM)ν\mu^M(1-\mu^{W-M})\delta \geq (1-\mu^M)\nu

जहां μ=eκTs\mu = e^{-\kappa T_s}

4. स्विचिंग ट्रिगर तंत्र

व्यवहार्यता ट्रिगर (FT-C-CBF):

1, & \text{यदि } (a_k = 0) \wedge (m_k \geq M) \\ 0, & \text{यदि } (a_k = 1) \wedge (m_k < M) \end{cases}$$ **गुणवत्ता ट्रिगर (QT-C-CBF)**: $$\eta_k = \begin{cases} 1, & \text{यदि } m_k \geq M \\ 0, & \text{यदि } m_k < M \end{cases}$$ ### तकनीकी नवाचार बिंदु 1. **जोखिम-बजट अवधारणा**: पहली बार जोखिम-बजट विचार को CBF ढांचे में शुरू किया, अल्पकालीन सुरक्षा मार्जिन में कमी की अनुमति दी 2. **विंडो-स्तर सुरक्षा गारंटी**: चरण-दर-चरण सुरक्षा गारंटी के बजाय सीमित समय क्षेत्र में सुरक्षा प्रमाणीकरण प्रदान करता है 3. **अनुकूली स्विचिंग तंत्र**: वास्तविक समय जोखिम मूल्यांकन के आधार पर बुद्धिमान स्विचिंग रणनीति ## प्रायोगिक सेटअप ### डेटासेट - GPS पथ-आधारित संदर्भ प्रक्षेपवक्र, प्रायोगिक स्वायत्त वाहन से - तीन प्रकार के पैदल यात्री इंटरैक्शन परिदृश्य: एकल पैदल यात्री, दोहरी पैदल यात्री, तीन पैदल यात्री क्रॉसिंग परिदृश्य - कुल 1500 मोंटे कार्लो रन ### मूल्यांकन मेट्रिक्स 1. **सफलता दर (SR)**: न्यूनतम वाहन-पैदल यात्री दूरी हमेशा 2.8 मीटर से अधिक रहने वाले परीक्षणों का प्रतिशत 2. **न्यूनतम पैदल यात्री दूरी (MDP)**: बाधा से बचने की प्रक्रिया में निकटतम पैदल यात्री की औसत न्यूनतम दूरी 3. **अव्यवहार्यता दर (IR)**: अनुकूलन चरणों में व्यवहार्य समाधान उत्पन्न न कर सकने का प्रतिशत 4. **कम्प्यूटेशनल समय (CT)**: प्रति चरण औसत कम्प्यूटेशनल समय 5. **पार्श्व ट्रैकिंग त्रुटि (CTE)**: वांछित पथ के सापेक्ष विचलन ### तुलना विधियां 1. **R-CBF**: शुद्ध शिथिल CBF 2. **C-CBF**: कठोर पूंछ बाधा के साथ CVaR-CBF 3. **AC-CBF**: अनुकूली CVaR-CBF 4. **RC-CBF**: शिथिल CVaR-CBF ### कार्यान्वयन विवरण - न्यूनतम सुरक्षा दूरी: $D_s = 3$ मीटर - स्लाइडिंग विंडो: $W = 5$, अधिकतम खराब चरण: $M = 1$ - सुरक्षा मार्जिन: $\delta = 1$ मीटर - CVaR आत्मविश्वास स्तर: $\epsilon = 95\%$ - वाहन स्थिति अनिश्चितता: $\sigma_v = 0.1$ मीटर - बाधा स्थिति अनिश्चितता: $\sigma_o \in \{1,2,3,4,5\}$ मीटर ## प्रायोगिक परिणाम ### मुख्य परिणाम सबसे चुनौतीपूर्ण सेटिंग में ($\sigma_v = 0.1$, $\sigma_o = 5$ मीटर, तीन पैदल यात्री परिदृश्य): | विधि | सफलता दर(%) | MDP(मीटर) | अव्यवहार्यता दर(%) | कम्प्यूटेशनल समय(ms) | CTE(मीटर) | |------|-----------|---------|-------------|--------------|---------| | R-CBF | 67% | 6.3 | 11.9% | 22.4 | 3.9 | | C-CBF | 98% | 11.3 | 15.2% | 56.2 | 4.2 | | AC-CBF | 84% | 7.33 | 17.8% | 76.9 | 5.0 | | RC-CBF | 97% | 12 | 15.3% | 75.3 | 4.3 | | **FT-C-CBF** | **94%** | **7.1** | **15.8%** | **24.2** | **3.2** | | **QT-C-CBF** | **96%** | **8.3** | **16.1%** | **25.7** | **3.6** | ### मुख्य निष्कर्ष 1. **संतुलित प्रदर्शन**: प्रस्तावित विधि C-CBF के करीब सुरक्षा (94-96% बनाम 98%) प्राप्त करती है, जबकि R-CBF के करीब प्रदर्शन बनाए रखती है (CTE 3.2-3.6 मीटर बनाम 3.9 मीटर) 2. **कम्प्यूटेशनल दक्षता**: कम्प्यूटेशनल समय रूढ़िवादी आधारभूत विधियों की तुलना में काफी कम है (24-26ms बनाम 56-75ms) 3. **QT FT से बेहतर है**: QT ट्रिगर तंत्र सभी δ मानों पर उच्च सफलता दर दिखाता है ### विलोपन प्रयोग विभिन्न सुरक्षा मार्जिन पैरामीटर δ∈{0.1, 1, 2} के लिए प्रयोग दिखाते हैं: - CVaR सक्रियण दर δ के साथ एकरस रूप से बढ़ता है - QT हमेशा FT की तुलना में उच्च सफलता दर और CVaR सक्रियण दर रखता है - बड़ा δ रूढ़िवादी नियंत्रक के पहले और अधिक बार सक्रियण की ओर ले जाता है ## संबंधित कार्य ### मुख्य अनुसंधान दिशाएं 1. **CBF सुधार विधियां**: शिथिल CBF, उच्च-क्रम CBF, सीखने-संचालित पैरामीटर ट्यूनिंग 2. **अनिश्चितता प्रबंधन**: स्टोकेस्टिक CBF, CVaR-CBF 3. **व्यवहार्यता समस्याएं**: स्तरीय अनुकूलन, सीखने-वर्धित व्यवहार्य सेट ### इस पेपर के लाभ मौजूदा कार्य की तुलना में, इस पेपर द्वारा प्रस्तावित जोखिम-बजटीय निगरानी ढांचा: 1. बड़े डेटा संग्रह की आवश्यकता नहीं है 2. स्पष्ट सुरक्षा प्रमाणीकरण प्रदान करता है 3. प्रदर्शन और सुरक्षा का प्रभावी संतुलन प्राप्त करता है 4. कम्प्यूटेशनल रूप से कुशल है, वास्तविक समय अनुप्रयोगों के लिए उपयुक्त है ## निष्कर्ष और चर्चा ### मुख्य निष्कर्ष 1. जोखिम-बजटीय निगरानीकर्ता स्वायत्त वाहनों में प्रदर्शन और सुरक्षा आवश्यकताओं को प्रभावी ढंग से संतुलित कर सकता है 2. विंडो-स्तर सुरक्षा प्रमाणीकरण चरण-दर-चरण सुरक्षा गारंटी की तुलना में अधिक व्यावहारिक है 3. QT ट्रिगर तंत्र FT ट्रिगर तंत्र से बेहतर है 4. यह ढांचा कम्प्यूटेशनल दक्षता और सुरक्षा प्रदर्शन दोनों में महत्वपूर्ण लाभ प्रदान करता है ### सीमाएं 1. **पैरामीटर ट्यूनिंग**: विंडो आकार W, अधिकतम खराब चरण M आदि पैरामीटर को विशिष्ट अनुप्रयोग के अनुसार ट्यून करने की आवश्यकता है 2. **सैद्धांतिक मान्यताएं**: पर्याप्त छोटे नमूना समय की मान्यता पर आधारित है 3. **परिदृश्य सीमाएं**: मुख्य रूप से पैदल यात्री बाधा परिदृश्यों में सत्यापित, अन्य जटिल परिदृश्यों में सत्यापन की आवश्यकता है 4. **हार्डवेयर सत्यापन**: अभी तक वास्तविक वाहन प्लेटफॉर्म पर सत्यापित नहीं किया गया है ### भविष्य की दिशाएं 1. वास्तविक स्वायत्त वाहन प्लेटफॉर्म पर हार्डवेयर-इन-द-लूप और सड़क सत्यापन 2. अधिक जटिल बहु-एजेंट इंटरैक्शन परिदृश्यों तक विस्तार 3. पैरामीटर के अनुकूली ट्यूनिंग विधियों का अनुसंधान 4. अन्य सुरक्षा प्रमाणीकरण विधियों के साथ एकीकरण की खोज ## गहन मूल्यांकन ### शक्तियां 1. **सैद्धांतिक योगदान**: नई जोखिम-बजट अवधारणा प्रस्तावित करता है, CBF ढांचे के लिए नई सैद्धांतिक नींव प्रदान करता है 2. **व्यावहारिक मूल्य**: CBF के व्यावहारिक अनुप्रयोग में व्यवहार्यता समस्या को हल करता है, बहुत मजबूत इंजीनियरिंग मूल्य है 3. **पर्याप्त प्रयोग**: 1500 मोंटे कार्लो प्रयोग, कई तुलना विधियां, परिणाम सत्यापन योग्य हैं 4. **गणितीय कठोरता**: पूर्ण सैद्धांतिक प्रमाण और सुरक्षा प्रमाणीकरण प्रदान करता है ### कमियां 1. **जटिलता**: कई पैरामीटर (W, M, δ, ν) शुरू किए गए हैं, पैरामीटर ट्यूनिंग जटिल हो सकती है 2. **रूढ़िवाद**: कुछ मामलों में अभी भी बहुत रूढ़िवादी हो सकता है 3. **प्रयोज्यता सीमा**: मुख्य रूप से विशिष्ट प्रकार की बाधा समस्याओं के लिए, सामान्यीकरण क्षमता सत्यापन की आवश्यकता है 4. **वास्तविक समय**: हालांकि कम्प्यूटेशनल समय में सुधार हुआ है, चरम परिस्थितियों में अभी भी वास्तविक समय चुनौतियों का सामना कर सकता है ### प्रभाव 1. **शैक्षणिक प्रभाव**: CBF क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है, अधिक संबंधित कार्य को प्रेरित कर सकता है 2. **औद्योगिक मूल्य**: स्वायत्त वाहन सुरक्षा नियंत्रण के लिए व्यावहारिक समाधान प्रदान करता है 3. **पुनरुत्पादनीयता**: विधि विवरण स्पष्ट है, पैरामीटर सेटिंग स्पष्ट है, अच्छी पुनरुत्पादनीयता है ### प्रयोज्य परिदृश्य 1. **स्वायत्त वाहन**: विशेष रूप से शहरी वातावरण में पैदल यात्री बाधा के लिए उपयुक्त 2. **रोबोट नेविगेशन**: मोबाइल रोबोट के सुरक्षित नेविगेशन तक विस्तारित किया जा सकता है 3. **औद्योगिक नियंत्रण**: सुरक्षा गारंटी की आवश्यकता वाली औद्योगिक नियंत्रण प्रणालियों के लिए उपयुक्त ## संदर्भ पेपर CBF सिद्धांत, स्टोकेस्टिक नियंत्रण, जोखिम प्रबंधन और अन्य क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हुए 21 संबंधित संदर्भों का हवाला देता है, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करता है। --- **समग्र मूल्यांकन**: यह नियंत्रण सिद्धांत का एक उच्च-गुणवत्ता वाला पेपर है, जो सैद्धांतिक नवाचार और व्यावहारिक अनुप्रयोग के बीच एक अच्छा संतुलन पाता है। जोखिम-बजटीय निगरानी की अवधारणा नई और व्यावहारिक है, प्रायोगिक सत्यापन पर्याप्त है, और स्वायत्त वाहन सुरक्षा नियंत्रण क्षेत्र में महत्वपूर्ण योगदान है।