2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

गतिशील बैकअप नीति का उपयोग करके नियंत्रण अवरोध कार्यों का डिजाइन

मूल जानकारी

  • पेपर ID: 2510.09810
  • शीर्षक: Designing Control Barrier Functions Using a Dynamic Backup Policy
  • लेखक: Victor Freire, Marco M. Nicotra (University of Colorado, Boulder)
  • वर्गीकरण: eess.SY cs.SY
  • प्रकाशन समय: arXiv preprint, अक्टूबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.09810

सारांश

यह पेपर अनियंत्रित अवस्था और इनपुट बाधाओं के तहत अरैखिक नियंत्रण-सजातीय प्रणालियों के लिए नियंत्रण अवरोध कार्यों (CBF) के निर्माण के लिए एक व्यवस्थित विधि प्रस्तावित करता है। संदर्भ नियामक साहित्य से प्रेरित होकर, यह विधि प्रणाली संतुलन मैनिफोल्ड द्वारा पैरामीटरकृत बैकअप नीति परिवार को परिभाषित करती है। नियंत्रण अवरोध कार्य संवर्धित अवस्था-संदर्भ स्थान पर परिभाषित किया जाता है: दिए गए अवस्था-संदर्भ जोड़ी के लिए, यह विधि बैकअप नीति संदर्भ स्थिर रहने की स्थिति में भविष्य के किसी भी समय बाधा उल्लंघन तक की दूरी को मापती है। फिर संवेदनशीलता विश्लेषण का उपयोग संवर्धित अवस्था वेक्टर के संबंध में (संभवतः गैर-चिकना) जैकोबियन मैट्रिक्स की गणना करने के लिए किया जाता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

मूल समस्या

नियंत्रण अवरोध कार्य (CBF) सुरक्षा-महत्वपूर्ण प्रणालियों के नियंत्रकों को डिजाइन करने के लिए शक्तिशाली उपकरण हैं, लेकिन सामान्य प्रणालियों के लिए अनियंत्रित अवस्था और इनपुट बाधाओं के तहत व्यवस्थित रूप से संश्लेषण करना कठिन है। हालांकि CBF की आधुनिक परिभाषा 2017 में स्थापित की गई थी, इसका व्यवस्थित डिजाइन अभी भी एक खुली समस्या है।

समस्या की महत्ता

कई अनुप्रयोगों में, व्यावहारिकर्ताओं को उम्मीदवार CBF को अपनाना पड़ता है क्योंकि वे डिजाइन करने में आसान होते हैं, पैरामीटर ट्यूनिंग और शिथिलता चर के माध्यम से अच्छा प्रदर्शन प्राप्त कर सकते हैं, लेकिन प्रभावी CBF के कठोर सुरक्षा गारंटी की कमी होती है।

मौजूदा विधियों की सीमाएं

  1. मशीन लर्निंग विधियां: सैद्धांतिक गारंटी की कमी
  2. वर्ग योग विधियां: केवल बहुपद प्रणालियों के लिए उपयुक्त
  3. विशेषज्ञ प्रदर्शन विधियां: उच्च गुणवत्ता प्रशिक्षण डेटा पर निर्भर
  4. बैकअप CBF विधियां: बैकअप नीति डिजाइन के लिए व्यवस्थित विधि की कमी

अनुसंधान प्रेरणा

लेखकों के पूर्व कार्य ने साबित किया कि गतिशील सुरक्षा सीमाएं (DSM) संवर्धित अवस्था-संदर्भ स्थान में CBF हैं। यह पेपर CBF के निर्माण के लिए प्रक्षेपवक्र-आधारित DSM को विस्तारित करता है, जो अधिक व्यवस्थित और सामान्य विधि प्रदान करता है।

मुख्य योगदान

  1. व्यवस्थित CBF डिजाइन विधि: प्रक्षेपवक्र पूर्वानुमान पर आधारित DSM-CBF निर्माण विधि प्रस्तावित करता है, जो अनियंत्रित अवस्था और इनपुट बाधाओं वाली अरैखिक नियंत्रण-सजातीय प्रणालियों के लिए उपयुक्त है।
  2. गतिशील बैकअप नीति: बैकअप नीति प्रणाली संतुलन मैनिफोल्ड द्वारा पैरामीटरकृत होती है, और पैरामीटरकरण समय-परिवर्तनशील है, जो निश्चित बैकअप नीति की तुलना में अधिक लचीलापन प्रदान करता है।
  3. सैद्धांतिक गारंटियां: हल्के अनुमानों के तहत अंतर्निहित संवेदनशीलता मैट्रिक्स की स्पर्शोन्मुख स्थिरता साबित करता है, और CBF की संभावित गैर-चिकनाई के कारण होने वाली समस्याओं को कठोरता से संभालता है।
  4. व्यावहारिक विचार: सीमित समय क्षेत्र और चिकनाई समस्याओं को हल करता है, अधिक कार्यान्वयन-सुविधाजनक रणनीति प्रस्तावित करता है और उनकी पर्याप्तता और व्यवहार्यता साबित करता है।

विधि विवरण

कार्य परिभाषा

नियंत्रण-सजातीय प्रणाली पर विचार करें:

ẋ = f(x) + g(x)u

अवस्था बाधा x ∈ X और इनपुट बाधा u ∈ U के अधीन, लक्ष्य बाधा संतुष्टि को लागू करने के लिए CBF डिजाइन करना है।

मुख्य अनुमान

अनुमान 3: प्रणाली v ∈ ℝˡ द्वारा पैरामीटरकृत संतुलन मैनिफोल्ड को स्वीकार करती है, निरंतर कार्य x̄(v) और ū(v) मौजूद हैं जैसे:

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

और पूर्व-स्थिर नियंत्रण नीति π(x,v) मौजूद है जो x̄(v) को स्पर्शोन्मुख रूप से स्थिर संतुलन बिंदु बनाती है।

प्रक्षेपवक्र-आधारित DSM-CBF निर्माण

1. गतिशील सुरक्षा सीमा परिभाषा

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

जहां:

  • c(x,v) संदर्भ-निर्भर अवस्था बाधा का वर्णन करता है
  • Φ(τ,x,v) पूर्व-स्थिर गतिविज्ञान का समाधान है

2. संवेदनशीलता विश्लेषण

प्रवाह संवेदनशीलता जैकोबियन मैट्रिक्स की गणना करें:

अवस्था संवेदनशीलता:

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

संदर्भ संवेदनशीलता:

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. सीमित समय क्षेत्र कार्यान्वयन

अनंत समय क्षेत्र संख्यात्मक रूप से अव्यावहारिक होने के कारण, सीमित समय क्षेत्र T का उपयोग करें और टर्मिनल DSM प्रस्तुत करें:

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

तकनीकी नवाचार बिंदु

  1. पैरामीटरकृत बैकअप नीति परिवार: निश्चित बैकअप नीति के विपरीत, संतुलन मैनिफोल्ड पैरामीटरकरण के माध्यम से संपूर्ण नीति परिवार प्रदान करता है।
  2. संवर्धित स्थान CBF: अवस्था-संदर्भ संवर्धित स्थान में CBF परिभाषित करता है, संदर्भ गतिविज्ञान को स्वाभाविक रूप से संभालता है।
  3. गैर-चिकनाई हैंडलिंग: Clarke सामान्यीकृत जैकोबियन मैट्रिक्स का उपयोग करके CBF की संभावित गैर-चिकनाई को कठोरता से संभालता है।
  4. व्यवहार्यता गारंटी: सुरक्षा फ़िल्टर की व्यवहार्यता साबित करता है, u = π(x,v), w = 0 हमेशा व्यवहार्य समाधान है।

प्रायोगिक सेटअप

प्रणाली मॉडल

उलटा पेंडुलम कार्ट प्रणाली:

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

पैरामीटर:

  • कार्ट द्रव्यमान m_c = 1kg
  • पेंडुलम द्रव्यमान m_p = 0.5kg
  • पेंडुलम लंबाई L = 0.7m

बाधा शर्तें

  • अवस्था बाधा: |x| ≤ 4.5m, |θ-π| ≤ π/9
  • इनपुट बाधा: |u| ≤ 20N

नियंत्रक डिजाइन

  • पूर्व-स्थिर नियंत्रक: LQR डिजाइन, K_π = -0.44, 35.3, -1.4, 8.0
  • नाममात्र नियंत्रक: K_κ = -35, 150, -20, 50
  • पूर्वानुमान समय क्षेत्र: T = 10 सेकंड
  • वर्ग K∞ कार्य: α(c) = 100c (बाधा), α(c) = 400c (टर्मिनल DSM)

तुलना विधियां

  1. नाममात्र नियंत्रण: केवल नाममात्र नियंत्रक का उपयोग (असुरक्षित)
  2. Lyapunov-आधारित DSM-CBF: Lyapunov कार्य पर आधारित DSM विधि
  3. ERG: स्पष्ट संदर्भ नियामक
  4. बैकअप CBF: पारंपरिक बैकअप CBF विधि

प्रायोगिक परिणाम

मुख्य परिणाम

सिमुलेशन परिणामों से निम्नलिखित देखा जा सकता है:

  1. सुरक्षा: प्रस्तावित विधि सभी बाधाओं को सफलतापूर्वक बनाए रखती है, कार्ट की स्थिति ±4.5m सीमा के भीतर रहती है, पेंडुलम कोण विचलन ±20° सीमा के भीतर रहता है।
  2. प्रदर्शन लाभ:
    • Lyapunov-आधारित DSM-CBF की तुलना में: तेजी से अभिसरण, चिकना प्रक्षेपवक्र
    • ERG की तुलना में: प्रतिक्रिया गति में उल्लेखनीय सुधार
    • पारंपरिक बैकअप CBF की तुलना में: बेहतर प्रदर्शन, जो पैरामीटरकृत बैकअप नीति परिवार द्वारा प्रदान की गई अतिरिक्त स्वतंत्रता के कारण है।
  3. नियंत्रण इनपुट: इनपुट हमेशा ±20N बाधा को संतुष्ट करता है, और अन्य विधियों की तुलना में अधिक चिकना है।

प्रदर्शन विश्लेषण

  • प्रक्षेपवक्र गुणवत्ता: प्रस्तावित विधि प्रारंभिक स्थिति से लक्ष्य स्थिति तक चिकना संक्रमण प्राप्त करती है।
  • बाधा संतुष्टि: सभी अवस्था और इनपुट बाधाओं को कठोरता से संतुष्ट करता है।
  • अभिसरण: तुलना विधियों की तुलना में बेहतर अभिसरण विशेषताएं प्रदर्शित करता है।

विधि लाभ सत्यापन

प्रयोग निम्नलिखित सैद्धांतिक अपेक्षाओं को सत्यापित करता है:

  1. पैरामीटरकृत बैकअप नीति परिवार निश्चित बैकअप नीति की तुलना में बेहतर प्रदर्शन प्रदान करता है।
  2. प्रक्षेपवक्र पूर्वानुमान विधि उच्च सापेक्ष डिग्री, गैर-न्यूनतम चरण प्रणालियों को संभालने में प्रभावी है।
  3. संवर्धित स्थान CBF विधि की व्यावहारिकता।

संबंधित कार्य

CBF डिजाइन विधियां

  1. मशीन लर्निंग विधियां (Harms et al. 2024): CBF डिजाइन के लिए मशीन लर्निंग का उपयोग
  2. वर्ग योग विधियां (Dai et al. 2024): बहुपद CBF डिजाइन
  3. विशेषज्ञ प्रदर्शन विधियां (Lindemann et al. 2024): सुरक्षित प्रदर्शन से CBF सीखना

बैकअप CBF संबंधित कार्य

  1. Chen et al. (2021): बैकअप CBF अवधारणा प्रस्तावित करता है
  2. Van Wijk et al. (2024): विक्षोभ-मजबूत बैकअप CBF
  3. Choi et al. (2021): मजबूत नियंत्रण अवरोध मूल्य कार्य

संदर्भ नियामक साहित्य

यह पेपर संदर्भ नियामक साहित्य से गहराई से प्रेरित है, विशेष रूप से गतिशील सुरक्षा सीमा अवधारणा, लेकिन इसे CBF ढांचे में विस्तारित करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. व्यवस्थित डिजाइन: प्रभावी CBF के निर्माण के लिए व्यवस्थित विधि प्रदान करता है, जो अनियंत्रित बाधाओं वाली अरैखिक प्रणालियों के लिए उपयुक्त है।
  2. सैद्धांतिक गारंटियां: हल्के अनुमानों के तहत कठोर सैद्धांतिक विश्लेषण और व्यवहार्यता गारंटी प्रदान करता है।
  3. व्यावहारिकता: विधि सरल और कार्यान्वयन में आसान है, गणनात्मक जटिलता अपेक्षाकृत कम है।

सीमाएं

  1. अनुमान निर्भरता: प्रणाली को संतुलन मैनिफोल्ड स्वीकार करने और पूर्व-स्थिर नियंत्रक डिजाइन करने की आवश्यकता है।
  2. गणनात्मक जटिलता: हालांकि MPC से कम है, फिर भी प्रक्षेपवक्र पूर्वानुमान और संवेदनशीलता गणना की आवश्यकता है।
  3. पैरामीटर ट्यूनिंग: वर्ग K∞ कार्य और पूर्वानुमान समय क्षेत्र जैसे पैरामीटर को उचित रूप से चुनने की आवश्यकता है।

भविष्य की दिशाएं

  1. मजबूती अनुसंधान: सीमित विक्षोभ के तहत मजबूती गुणों का अनुसंधान
  2. विभिन्न पूर्वानुमान तकनीकें: अन्य प्रक्षेपवक्र पूर्वानुमान तकनीकों की खोज
  3. गणनात्मक अनुकूलन: गणनात्मक जटिलता को और कम करने के तरीके

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक कठोरता: अस्तित्व, व्यवहार्यता और अभिसरण प्रमाण सहित पूर्ण सैद्धांतिक विश्लेषण प्रदान करता है।
  2. विधि सामान्यता: व्यापक अरैखिक नियंत्रण-सजातीय प्रणालियों के लिए उपयुक्त है।
  3. कार्यान्वयन सरलता: MPC जैसी विधियों की तुलना में गणनात्मक बोझ अपेक्षाकृत हल्का है।
  4. जटिलता हैंडलिंग: इनपुट संतृप्ति, बहु-बाधाएं, मजबूत अरैखिकता आदि जटिल स्थितियों को संभाल सकता है।

कमजोरियां

  1. अनुमान सीमाएं: संतुलन मैनिफोल्ड अनुमान विधि की प्रयोज्यता सीमा को सीमित कर सकता है।
  2. पैरामीटर संवेदनशीलता: विधि प्रदर्शन पैरामीटर चयन के प्रति संवेदनशील हो सकता है।
  3. प्रायोगिक सीमा: केवल एक प्रणाली पर सत्यापन किया गया है, व्यापक प्रायोगिक सत्यापन की कमी है।

प्रभाव

  1. शैक्षणिक योगदान: CBF डिजाइन के लिए नई सैद्धांतिक ढांचा और व्यावहारिक विधि प्रदान करता है।
  2. व्यावहारिक मूल्य: विधि अपेक्षाकृत सरल है, वास्तविक प्रणालियों में अनुप्रयोग की संभावना है।
  3. पुनरुत्पादनीयता: लेखक ने ओपन-सोर्स कोड प्रदान किया है, पुनरुत्पादनीयता को बढ़ाता है।

प्रयोज्य परिदृश्य

  1. सुरक्षा-महत्वपूर्ण प्रणालियां: रोबोट, स्वचालित वाहन आदि जहां कठोर बाधा संतुष्टि आवश्यक है।
  2. अरैखिक प्रणालियां: विशेष रूप से जटिल बाधाओं वाली अरैखिक नियंत्रण प्रणालियों के लिए उपयुक्त।
  3. वास्तविक समय नियंत्रण: MPC की तुलना में कम गणनात्मक जटिलता, वास्तविक समय अनुप्रयोगों के लिए उपयुक्त।

संदर्भ

पेपर इस क्षेत्र के मुख्य कार्यों का हवाला देता है, जिसमें शामिल हैं:

  • Ames et al. (2017): CBF की आधुनिक परिभाषा
  • Chen et al. (2021): बैकअप CBF अवधारणा
  • Nicotra and Garone (2018): स्पष्ट संदर्भ नियामक
  • लेखकों का पूर्व कार्य: DSM-CBF सैद्धांतिक आधार

समग्र मूल्यांकन: यह एक सैद्धांतिक रूप से कठोर, विधि में नवीन, उच्च गुणवत्ता वाला पेपर है जो CBF डिजाइन के लिए व्यवस्थित विधि प्रदान करता है। सैद्धांतिक कठोरता को बनाए रखते हुए अच्छी व्यावहारिकता प्रदान करता है। विधि की सामान्यता और अपेक्षाकृत सरल कार्यान्वयन इसे उच्च व्यावहारिक मूल्य प्रदान करते हैं।