2025-11-25T18:04:25.210324

Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles

Chang, Renganathan, Ahmed

This paper presents a risk-budgeted monitor with a control framework that certifies safety for autonomous driving. In this process, a sliding window is proposed to monitor for insufficient barrier residuals or nonzero tail risk, ensuring system safety. When the safety margin deteriorates, it triggers switching the safety constraint from a performance-based relaxed-control barrier function (R-CBF) to a conservative conditional value at risk (CVaR-CBF) to address the safety concern. This switching is governed by two real-time triggers: Feasibility-Triggered (FT) and Quality-Triggered (QT) conditions. In the FT condition, if the R-CBF constraint becomes infeasible or yields a suboptimal solution, the risk monitor triggers the use of the CVaR constraints for the controller. In the QT condition, the risk monitor observes the safety margin of the R-CBF solution at every step, regardless of feasibility. If it falls below the safety margin, the safety filter switches to the CVaR-CBF constraints. The proposed framework is evaluated using a model predictive controller (MPC) for autonomous driving in the presence of autonomous vehicle (AV) localization noise and obstacle position uncertainties. Multiple AV-pedestrian interaction scenarios are considered, with 1,500 Monte Carlo runs conducted for all scenarios. In the most challenging setting with pedestrian detection uncertainty of 5 m, the proposed framework achieves a 94-96% success rate of not colliding with the pedestrians over 300 trials while maintaining the lowest mean cross-track error (CTE = 3.2-3.6 m) to the reference path. The reduced CTE indicates faster trajectory recovery after obstacle avoidance, demonstrating a balance between safety and performance.

academic

स्वायत्त वाहनों में संतुलित प्रदर्शन और सुरक्षा के लिए जोखिम-बजटीय नियंत्रण ढांचा

मूल जानकारी

पेपर ID: 2510.10442
शीर्षक: Risk-Budgeted Control Framework for Balanced Performance and Safety in Autonomous Vehicles
लेखक: Pei Yu Chang, Vishnu Renganathan, Qadeer Ahmed (ओहियो स्टेट विश्वविद्यालय)
वर्गीकरण: eess.SY (प्रणाली और नियंत्रण), cs.SY (प्रणाली और नियंत्रण)
प्रकाशन समय: 25 अक्टूबर 2025 (arXiv प्रीप्रिंट)
पेपर लिंक: https://arxiv.org/abs/2510.10442

सारांश

यह पेपर स्वायत्त वाहनों की सुरक्षा प्रमाणीकरण के लिए एक जोखिम-बजटीय निगरानी और नियंत्रण ढांचा प्रस्तावित करता है। यह ढांचा स्लाइडिंग विंडो निगरानी का उपयोग करके अपर्याप्त बाधा अवशेष या गैर-शून्य पूंछ जोखिम को सुनिश्चित करता है। जब सुरक्षा मार्जिन बिगड़ता है, तो यह प्रदर्शन-आधारित शिथिल नियंत्रण बाधा फलन (R-CBF) से रूढ़िवादी सशर्त मूल्य-पर-जोखिम (CVaR-CBF) बाधा में स्विच करता है। स्विचिंग दो वास्तविक समय ट्रिगर द्वारा नियंत्रित होती है: व्यवहार्यता ट्रिगर (FT) और गुणवत्ता ट्रिगर (QT) शर्तें। सबसे चुनौतीपूर्ण पैदल यात्री पहचान अनिश्चितता (5 मीटर) सेटिंग में, यह ढांचा 300 परीक्षणों में 94-96% पैदल यात्री टकराव से बचने की सफलता दर प्राप्त करता है, जबकि न्यूनतम औसत पार्श्व ट्रैकिंग त्रुटि (CTE=3.2-3.6 मीटर) बनाए रखता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

अनिश्चितता वाले वातावरण में स्वायत्त वाहनों का सुरक्षित नियंत्रण एक महत्वपूर्ण चुनौती है। पारंपरिक नियंत्रण बाधा फलन (CBF) सुरक्षा की गारंटी दे सकते हैं, लेकिन केवल तभी प्रभावी होते हैं जब द्विघात प्रोग्रामिंग (QP) व्यवहार्य और इष्टतम हो। निम्नलिखित समस्याओं का सामना करते समय, मौजूदा तरीकों में सीमाएं हैं:

कम्प्यूटेशनल जटिलता: अनिश्चितता कम्प्यूटेशनल आवश्यकताओं को बहुत बढ़ाती है, जबकि नियंत्रक को 20-50Hz आवृत्ति पर चलना चाहिए
व्यवहार्यता समस्याएं: इनपुट बाधाएं और सुरक्षा बाधाएं आंतरिक QP को अव्यवहार्य बना सकती हैं
प्रदर्शन और सुरक्षा का व्यापार: रूढ़िवादी सुरक्षा रणनीति प्रदर्शन को बलिदान करती है, जबकि आक्रामक प्रदर्शन रणनीति सुरक्षा आवश्यकताओं का उल्लंघन कर सकती है

अनुसंधान प्रेरणा

मौजूदा तरीके पैरामीटर ट्यूनिंग, स्तरीय अनुकूलन, या सीखने-वर्धित व्यवहार्य सेट के माध्यम से व्यवहार्यता समस्याओं को हल करते हैं, लेकिन अक्सर बड़े डेटा संग्रह की आवश्यकता होती है या निरंतर अव्यवहार्यता के समय सुरक्षा को सीधे परिमाणित नहीं कर सकते। यह पेपर व्यावहारिक दृष्टिकोण से मानता है कि अव्यवहार्यता का अर्थ आवश्यक रूप से सुरक्षा का नुकसान नहीं है, और एक जोखिम-बजटीय निगरानी ढांचा प्रस्तावित करता है।

मुख्य योगदान

औपचारिक जोखिम-बजटीय निगरानीकर्ता: सीमित समय क्षेत्र में विंडोकृत सुरक्षा गारंटी प्रदान करता है
निगरानी-संचालित स्विचिंग तंत्र: प्रदर्शन-केंद्रित CBF-QP और रूढ़िवादी CVaR-CBF के बीच वास्तविक समय नेविगेशन, पूंछ जोखिम को सीमित करता है
सैद्धांतिक और प्रायोगिक सत्यापन: साबित करता है कि जोखिम-बजट नियंत्रित क्षणिक अव्यवहार्यता की अनुमति देता है, जबकि प्रमाणित सीमित समय क्षेत्र सुरक्षा बनाए रखता है

विधि विवरण

कार्य परिभाषा

गैर-रैखिक निरंतर समय नियंत्रण-सजातीय प्रणाली पर विचार करें: $\dot{x} = f(x) + g(x)u$

जहां $x \in D \subset \mathbb{R}^n$ और $u \in U \subset \mathbb{R}^m$ क्रमशः प्रणाली स्थिति और इनपुट का प्रतिनिधित्व करते हैं। सुरक्षा सेट को $S = \{x : h(x) \geq 0\}$ के रूप में परिभाषित किया गया है।

मॉडल आर्किटेक्चर

1. शिथिल CBF (R-CBF)

पारंपरिक CBF का शिथिल संस्करण, गैर-नकारात्मक शिथिल चर $\nu_k$ को शुरू करके एक्चुएटर सीमाओं के कारण अव्यवहार्यता को संभालता है:

$\min_{u_k \in U, \nu_k \geq 0} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2$ $\text{s.t. } L_f h(x_k) + L_g h(x_k)u_k + \kappa h(x_k) \geq -\nu_k$

2. स्टोकेस्टिक सुरक्षा सेट और CVaR-CBF

बाधा स्थिति और वाहन स्थानीयकरण की अनिश्चितता पर विचार करते हुए, सुरक्षा मूल्यांकन को संभाव्य जोखिम रूप में परिवर्तित करता है। हानि फलन को परिभाषित करें: $Z_k^i(u_k) := -r_k^i(u_k)$

जहां $r_k^i(u_k)$ सुरक्षा अवशेष है।

CVaR बाधा: $\text{CVaR}_\epsilon(Z_{k+1}^i) = \inf_{\gamma \in \mathbb{R}} \left\{\gamma + \frac{1}{1-\epsilon}\mathbb{E}[(Z_{k+1}^i - \gamma)^+]\right\}$

शिथिल CVaR-CBF अनुकूलन: $\min_{u_k \in U, \nu_k \in \mathbb{R}} \frac{1}{2}\|u_k - u_k^{nom}\|^2 + \rho_\nu \nu_k^2$ $\text{s.t. } \text{CVaR}_\epsilon(Z_{k+1}^i) \leq \nu_k, \quad 0 \leq \nu_k \leq \bar{\nu}$

3. जोखिम-बजटीय निगरानीकर्ता

खराब चरण पहचान: खराब चरण संकेतक को परिभाषित करें $b_k = \mathbf{1}\{\nu_k > \bar{\nu}\} \vee \mathbf{1}\{r_{\min,k} < \delta\}$

जहां $\delta > 0$ एक पूर्वनिर्धारित सुरक्षा मार्जिन है।

स्लाइडिंग विंडो निगरानी: लंबाई $W$ की स्लाइडिंग विंडो में, अधिकतम $M$ खराब चरणों की अनुमति है: $m_k = m_{k-1} + b_k - b_{k-W}$

विंडो-स्तर सुरक्षा प्रमाणीकरण प्रमेय: $\mu^M(1-\mu^{W-M})\delta \geq (1-\mu^M)\nu$

जहां $\mu = e^{-\kappa T_s}$ ।

4. स्विचिंग ट्रिगर तंत्र

व्यवहार्यता ट्रिगर (FT-C-CBF):