2025-11-20T05:43:14.076539

Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems

Lu, Lyu, Yu
This work studies the inverse optimality of input-to-state stabilizing controllers with input-output stability guarantees for nonlinear homogeneous systems. We formulate a new inverse optimal control problem, where the cost functional incorporates penalties on the output, in addition to the state, control and disturbance as in current related works. One benefit of penalizing the output is that the resulting inverse optimal controllers can ensure both input-to-state stability and input-output stability. We propose a technique for constructing the corresponding meaningful cost functional by using homogeneity properties, and provide sufficient conditions on solving the inverse optimal gain assignment problem. We show that homogeneous stabilizability of homogeneous systems in the case without disturbance is sufficient for the solvability of inverse optimal gain assignment problem for homogeneous systems.
academic

अरैखिक समांगी प्रणालियों के लिए इनपुट-टू-स्टेट स्थिरीकरण समांगी नियंत्रकों का व्युत्क्रम इष्टतम डिजाइन

मूल जानकारी

  • पेपर ID: 2511.15034
  • शीर्षक: अरैखिक समांगी प्रणालियों के लिए इनपुट-टू-स्टेट स्थिरीकरण समांगी नियंत्रकों का व्युत्क्रम इष्टतम डिजाइन
  • लेखक: Kaixin Lu (राष्ट्रीय सिंगापुर विश्वविद्यालय), Ziliang Lyu (नानयांग प्रौद्योगिकी विश्वविद्यालय और टोंगजी विश्वविद्यालय), Haoyong Yu (राष्ट्रीय सिंगापुर विश्वविद्यालय)
  • वर्गीकरण: eess.SY (सिस्टम और नियंत्रण), cs.SY
  • प्रस्तुति समय: 19 नवंबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2511.15034

सारांश

यह पेपर अरैखिक समांगी प्रणालियों के लिए इनपुट-स्टेट स्थिरता (ISS) नियंत्रकों की व्युत्क्रम इष्टतमता समस्या का अध्ययन करता है और इनपुट-आउटपुट स्थिरता (IOS) की गारंटी प्रदान करता है। पेपर एक नई व्युत्क्रम इष्टतम नियंत्रण समस्या प्रस्तावित करता है, जिसमें लागत कार्यात्मक पारंपरिक स्थिति, नियंत्रण और व्यतिक्रमण दंड के आधार पर आउटपुट दंड जोड़ता है। इस डिजाइन का लाभ यह है कि परिणामी व्युत्क्रम इष्टतम नियंत्रक ISS और IOS दोनों की गारंटी देता है। लेखक समांगी गुणों का उपयोग करके सार्थक लागत कार्यात्मक के निर्माण के लिए तकनीकें प्रस्तावित करते हैं और व्युत्क्रम इष्टतम लाभ आवंटन समस्या को हल करने के लिए पर्याप्त शर्तें प्रदान करते हैं। अनुसंधान से पता चलता है कि व्यतिक्रमण-मुक्त स्थिति में समांगी प्रणालियों की समांगी स्थिरीकरणीयता समांगी प्रणालियों की व्युत्क्रम इष्टतम लाभ आवंटन समस्या की सॉल्वेबिलिटी के लिए एक पर्याप्त शर्त है।

अनुसंधान पृष्ठभूमि और प्रेरणा

1. समाधान की जाने वाली मूल समस्या

इस पेपर की मूल समस्या यह है: ऐसे व्युत्क्रम इष्टतम नियंत्रक कैसे डिजाइन करें जो इनपुट-स्टेट स्थिरता (ISS) और इनपुट-आउटपुट स्थिरता (IOS) दोनों की गारंटी दें, और इसके लिए सार्थक लागत कार्यात्मक कैसे बनाएं।

2. समस्या की महत्ता

  • इष्टतमता के लाभ: इष्टतम नियंत्रक कई आदर्श गुण रखते हैं, जैसे लाभ मार्जिन, मजबूतता आदि। व्युत्क्रम इष्टतम नियंत्रण Hamilton-Jacobi-Isaacs (HJI) समीकरण को हल करने की कठिनाई से बचता है।
  • ISS की सीमाएं: ISS L∞ दृष्टिकोण से स्थिति और व्यतिक्रमण के संबंध का वर्णन करता है, लेकिन कुछ नियंत्रण प्रणालियों में (जैसे निष्क्रिय पहचान के आधार पर मॉड्यूलर अनुकूली नियंत्रण), "रुचि के आउटपुट" के L∞ स्पेस में होने की गारंटी देना मुश्किल है।
  • IOS की आवश्यकता: व्यावहारिक नियंत्रण समस्याओं में, ISS की गारंटी के बाद व्यतिक्रमण इनपुट विशिष्ट बंद-लूप संकेतों को कैसे प्रभावित करता है, यह समझना आवश्यक है। उदाहरण के लिए अरैखिक H∞ नियंत्रण में, परिमित लाभ L2 स्थिरता की आवश्यकता है।

3. मौजूदा विधियों की सीमाएं

  • Krstic और Li 11 का अग्रणी कार्य: व्युत्क्रम इष्टतम ISS नियंत्रण ढांचा प्रस्तावित किया, लेकिन इसका लागत कार्यात्मक केवल स्थिति, नियंत्रण और व्यतिक्रमण दंड रखता है, आउटपुट दंड नहीं।
  • IOS गारंटी की कमी: जैसा कि उदाहरण 1 में दिखाया गया है, आउटपुट को दंडित न करने वाले व्युत्क्रम इष्टतम नियंत्रक IOS (जैसे L2 स्थिरता) की गारंटी नहीं दे सकते।
  • निर्माण कठिनाई: जब आउटपुट को दंडित किया जाता है, तो सार्थक लागत कार्यात्मक खोजना मुश्किल है, क्योंकि दंड पद को पूरे स्थिति स्पेस पर गैर-नकारात्मक होना चाहिए।

4. अनुसंधान प्रेरणा

  • समांगीता के लाभ: समांगीता उपयुक्त स्केलिंग के माध्यम से प्रणाली के स्थानीय गुणों को वैश्विक गुणों में बदल सकती है, जो उपरोक्त कठिनाइयों को हल करने के लिए उपकरण प्रदान करती है।
  • सैद्धांतिक आवश्यकता: यह अनुसंधान करना आवश्यक है कि ISS नियंत्रक IOS गारंटी के साथ किस इष्टतम मानदंड के संबंध में व्युत्क्रम इष्टतम हैं।

मुख्य योगदान

  1. नई व्युत्क्रम इष्टतम नियंत्रण समस्या: पहली बार लागत कार्यात्मक में आउटपुट दंड के साथ व्युत्क्रम इष्टतम नियंत्रण समस्या प्रस्तावित की (परिभाषा 7), जिससे व्युत्क्रम इष्टतम नियंत्रक ISS और IOS दोनों की गारंटी दे सकते हैं।
  2. निर्माण तकनीकें: समांगी गुणों का उपयोग करके सार्थक लागत कार्यात्मक के निर्माण के लिए तकनीकें प्रस्तावित की (लेम्मा 3 और लेम्मा 4), विशेष रूप से यह समस्या हल की कि स्थिति दंड l(x) को सकारात्मक निश्चित रखने के लिए पैरामीटर κ और फ़ंक्शन γ(s) को कैसे चुनें।
  3. पर्याप्त शर्तें: प्रमेय 1 में व्युत्क्रम इष्टतम लाभ आवंटन समस्या को हल करने के लिए पर्याप्त शर्तें दी गई हैं, जो साबित करती हैं कि डिजाइन किए गए नियंत्रक ISS और परिमित लाभ L2 स्थिरता दोनों की गारंटी दे सकते हैं।
  4. सॉल्वेबिलिटी परिणाम: प्रमेय 2 में साबित किया गया है कि व्यतिक्रमण-मुक्त स्थिति में समांगी प्रणालियों की समांगी स्थिरीकरणीयता समांगी प्रणालियों की व्युत्क्रम इष्टतम लाभ आवंटन समस्या की सॉल्वेबिलिटी के लिए एक पर्याप्त शर्त है, और स्पष्ट नियंत्रक डिजाइन विधि दी गई है।
  5. सैद्धांतिक सफलता: संदर्भ 11 की विधि की सीमा को दूर किया गया है जो आउटपुट दंड के मामले में सीधे लागू नहीं हो सकती, एक पूर्ण सैद्धांतिक ढांचा और डिजाइन प्रक्रिया प्रदान की गई है।

विधि विवरण

कार्य परिभाषा

膨胀 ऑपरेटर ∆rε के संबंध में समांगी अरैखिक प्रणाली पर विचार करें: x˙=f(x)+G1(x)u+G2(x)w,y=h(x)+du\dot{x} = f(x) + G_1(x)u + G_2(x)w, \quad y = h(x) + du

जहां:

  • x ∈ ℝⁿ: स्थिति
  • u ∈ ℝ: नियंत्रण इनपुट
  • w ∈ ℝξ: व्यतिक्रमण इनपुट
  • y ∈ ℝˡ: आउटपुट
  • f(x) डिग्री k > -r₀ का समांगी वेक्टर क्षेत्र है
  • G₁(x), G₂(x) डिग्री ς = -r₀ के समांगी वेक्टर क्षेत्र हैं
  • h(x) डिग्री k + r₀ का समांगी फ़ंक्शन है

मुख्य धारणा: hᵀd = 0, dᵀd = ϑ²I (ऑर्थोगोनैलिटी और नियंत्रण वजन शर्त)

उद्देश्य: नियंत्रण कानून u = α*(x) खोजें जो लागत कार्यात्मक को न्यूनतम करें: J(u)=supwΩw{limt[E(x(t))+0t(l(x)+uTR1(x)u+yTR2(x)yγ0(w))dτ]}J(u) = \sup_{w \in \Omega_w}\left\{\lim_{t\to\infty}\left[E(x(t)) + \int_0^t \left(l(x) + u^T R_1(x)u + y^T R_2(x)y - \gamma_0(|w|)\right)d\tau\right]\right\}

मॉडल आर्किटेक्चर

1. सहायक प्रणाली निर्माण

व्यतिक्रमण दंड γ₀(|w|) निर्धारित करने के लिए, सहायक प्रणाली बनाएं: x˙=f~(x)+G1(x)u\dot{x} = \tilde{f}(x) + G_1(x)u

जहां: f~(x)=f(x)+G2(x)γ(2LG2V)LG2VTLG2V2\tilde{f}(x) = f(x) + G_2(x)\ell_\gamma(2|L_{G_2}V|)\frac{L_{G_2}V^T}{|L_{G_2}V|^2}

यहां ℓγ γ का Legendre-Fenchel रूपांतरण है, γ एक K∞ फ़ंक्शन है।

मुख्य डिजाइन: γ(s) को चुनें जिससे ℓγ(2εs) = ε²ℓγ(2s), सहायक प्रणाली की समांगीता सुनिश्चित करने के लिए (लेम्मा 3)।

2. नियंत्रण कानून डिजाइन

आधार नियंत्रण कानून (सहायक प्रणाली को स्थिर करने के लिए): u=α(x)=κ2ϑ2R(x)1(LG1V)Tu = \alpha(x) = -\frac{\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T

जहां R(x) डिग्री 0 का समांगी फ़ंक्शन है, जो |R(x)| की सकारात्मक निचली सीमा को संतुष्ट करता है।

व्युत्क्रम इष्टतम नियंत्रण कानून: u=α(x)=βκ2ϑ2R(x)1(LG1V)T,β2u = \alpha^*(x) = -\frac{\beta\kappa}{2\vartheta^2}R(x)^{-1}(L_{G_1}V)^T, \quad \beta \geq 2

3. वजन मैट्रिक्स चयन

R1(x)=ϑ2κR(x),R2(x)=1κR(x)R_1(x) = \frac{\vartheta^2}{\kappa}R(x), \quad R_2(x) = \frac{1}{\kappa}R(x)

4. स्थिति दंड निर्माण

l(x)=lˉ(x)h(x)TR(x)h(x)κl(x) = \bar{l}(x) - \frac{h(x)^T R(x)h(x)}{\kappa}

जहां: lˉ(x)=2β(Lf~V+LG1Vα(x))+β(2λ)γ(2LG2V)β(β2)LG1Vα(x)\bar{l}(x) = -2\beta(L_{\tilde{f}}V + L_{G_1}V\alpha(x)) + \beta(2-\lambda)\ell_\gamma(2|L_{G_2}V|) - \beta(\beta-2)L_{G_1}V\alpha(x)

तकनीकी नवाचार बिंदु

1. समांगीता-संरक्षण सहायक प्रणाली

नवाचार: विशेष रूप से γ(s) = (1/μ)s² चुनकर, जिससे ℓγ(2εs) = ε²ℓγ(2s), सहायक प्रणाली की समांगीता को संरक्षित रखें।

महत्व: यह स्थिति दंड l(x) की सकारात्मकता को साबित करने की कुंजी है, क्योंकि समांगीता का उपयोग करके स्थानीय गुणों को वैश्विक स्तर तक विस्तारित करना आवश्यक है।

2. पैरामीटर κ चयन रणनीति (लेम्मा 4)

चुनौती: चूंकि l(x) = l̄(x) - h(x)ᵀR(x)h(x)/κ, और l̄(x) और h(x)ᵀR(x)h(x) दोनों सकारात्मक अरैखिक फ़ंक्शन हैं, सभी x ∈ ℝⁿ{0} के लिए l(x) > 0 सुनिश्चित करना मुश्किल है।

समाधान:

  • फ़ंक्शन Hκ(x) = -κLf̃V(x) + LG₁V(x)α(x) - h(x)ᵀR(x)h(x) परिभाषित करें
  • समांगी गोलाकार S = {x : Γ(x) = 1} का उपयोग करें
  • दो मामलों (P+ और P-) में S पर Hκ(x) > 0 साबित करें
  • समांगीता का उपयोग करके परिणाम को पूरे ℝⁿ{0} तक विस्तारित करें

मुख्य असमानता: κ > κ₀ ≥ max{κc, κ₁} लें, जहां:

  • κc = ρ₂/ρ₁ (LG₁V = 0 के क्षेत्र को संभालने के लिए)
  • κ₁ द्विघात समीकरण द्वारा निर्धारित (LG₁V ≠ 0 के क्षेत्र को संभालने के लिए)

3. वजन मैट्रिक्स R(x) की निरंतरता

समस्या: संदर्भ 11 की R(x) निर्माण केवल LG₁VR₁(x)⁻¹(LG₁V)ᵀ की निरंतरता सुनिश्चित करता है, h(x)ᵀR₂(x)h(x) की निरंतरता नहीं।

समाधान: Sontag-प्रकार नियंत्रक के वजन मैट्रिक्स डिजाइन का उपयोग करें (39 से प्रेरित):

\frac{1}{\vartheta^2}\left[c_{10} + \frac{\phi + \sqrt{\phi^2 + [L_{G_1}V(L_{G_1}V)^T]^2}}{L_{G_1}V(L_{G_1}V)^T}\right]^{-1}, & L_{G_1}V^T \neq 0\\ \frac{1}{\vartheta^2 c_{10}}, & L_{G_1}V^T = 0 \end{cases}$$ यह R(x) को ℝⁿ\{0} पर निरंतर रखता है, जिससे h(x)ᵀR(x)h(x) पूरे ℝⁿ पर निरंतर है। #### 4. समायोज्य लाभ मार्जिन नियंत्रक में लाभ मार्जिन (1/β, ∞) है: - लाभ बढ़ाएं → "स्थिरीकरण प्रयास" बढ़ाएं → अनंत लाभ वृद्धि सहन कर सकते हैं - नियंत्रक में स्थिरीकरण के लिए आवश्यक नियंत्रण प्रयास का β गुना है → 1/β लाभ कमी सहन कर सकते हैं ## प्रायोगिक सेटअप ### संख्यात्मक उदाहरण यह पेपर सैद्धांतिक परिणामों को सत्यापित करने के लिए 4 उदाहरण प्रदान करता है: #### उदाहरण 1: आउटपुट दंड के बिना विफलता का मामला **प्रणाली**: ẋ = x³ + u + w, y = x **संदर्भ [11] का नियंत्रक**: u = -6x³ - ISS सुनिश्चित करता है: V̇(x) ≤ -4x⁶ + w² - **L2 स्थिरता सुनिश्चित नहीं करता**: ∫₀ᵗ y²dτ = (1/10)ln(1 + 10x₀²t) → ∞ #### उदाहरण 2: आउटपुट दंड के साथ सफलता का मामला **समान प्रणाली**: ẋ = x³ + u + w, y = x **इस पेपर का नियंत्रक**: u = -4x³ - 2.5x - ISS सुनिश्चित करता है: V̇(x) ≤ -3x⁴ - 1.5x² + w² - **L2 स्थिरता सुनिश्चित करता है**: ||y||₂ ≤ ||w||₂ + |x₀| लागत कार्यात्मक पैरामीटर: E(x) = 2x², l(x) = 4x⁴, R₂(x) = 1, R₁(x) = (2x² + 5/4)⁻¹, γ₀(s) = s² #### उदाहरण 3: संदर्भ [11] विधि की सीमा **प्रणाली**: ẋ₁ = -x₁³ + x₂³, ẋ₂ = u + w, y = x₂³ **अवलोकन**: संदर्भ [11] का नियंत्रक अपने लागत कार्यात्मक को न्यूनतम करता है, लेकिन स्थिति दंड l̃(x) = l̄(x) - x₂⁶ नकारात्मक हो सकता है, इस पेपर के लागत कार्यात्मक की आवश्यकता को पूरा नहीं करता। #### उदाहरण 4: पूर्ण डिजाइन प्रक्रिया प्रदर्शन **प्रणाली**: ẋ₁ = -x₁ + x₂³, ẋ₂ = u + w, y = [x₂, u]ᵀ **समांगीता**: डिग्री k = 0,膨胀 (3,1) के संबंध में समांगी **डिजाइन चरण**: 1. Lyapunov फ़ंक्शन चुनें: V(x) = (x₁^(4/3) + x₂⁴)^(1/2) 2. Lie डेरिवेटिव की गणना करें: Lf V, LG₁V, LG₂V 3. φ(x) = Lf V + 2|x₂|³(x₁^(4/3) + x₂⁴)^(-1/4) बनाएं 4. निहितार्थ संबंध सत्यापित करें: LG₁V = 0 ⇒ φ < 0 5. γ(s) = (1/c₇)s², c₇ = 1/2 चुनें 6. पैरामीटर की गणना करें: ρ₁ = 0.66, ρ₂ = 0.24, κc = 0.36, κ₁ = 10.55 7. κ = 11, β = λ = 2 चुनें 8. व्युत्क्रम इष्टतम नियंत्रक u = α*(x) = 2α(x) प्राप्त करें ### सैद्धांतिक सत्यापन कठोर गणितीय प्रमाण के माध्यम से सत्यापित: - सहायक प्रणाली की स्पर्शोन्मुख स्थिरता (समीकरण 67) - लागत कार्यात्मक की सार्थकता (l(x) सकारात्मक निश्चित) - ISS गुण (समीकरण 35) - L2 स्थिरता (समीकरण 36) ## प्रायोगिक परिणाम ### मुख्य सैद्धांतिक परिणाम #### प्रमेय 1: पर्याप्त शर्तें **शर्त**: यदि नियंत्रण कानून u = α(x) = -(κ/2ϑ²)R(x)⁻¹(LG₁V)ᵀ सहायक प्रणाली को स्पर्शोन्मुख रूप से स्थिर करता है **निष्कर्ष**: नियंत्रण कानून u = α*(x) = -(βκ/2ϑ²)R(x)⁻¹(LG₁V)ᵀ (β ≥ 2) निम्नलिखित गुण रखता है: 1. **व्युत्क्रम इष्टतमता**: लागत कार्यात्मक (10) को न्यूनतम करता है, न्यूनतम मान Jmin = 2βV(x(0)) 2. **ISS**: बंद-लूप प्रणाली V̇(x) ≤ -c₁Γ(x)^(2(k+r₀)) + γ(|w|/2) को संतुष्ट करता है 3. **L2 स्थिरता**: जब γ(s) = (1/μ)s² हो, तो ||y||₂ ≤ κL||w||₂ + c₀, जहां κL = √(κβ/(4ρmμ)) #### प्रमेय 2: सॉल्वेबिलिटी शर्त **मुख्य परिणाम**: यदि प्रणाली ẋ = f(x) + G₁(x)u (व्यतिक्रमण-मुक्त स्थिति) समांगी रूप से स्थिरीकरणीय है, तो व्युत्क्रम इष्टतम लाभ आवंटन समस्या सॉल्वेबल है। **निर्माणात्मक प्रमाण**: 1. समांगी स्थिरीकरणीयता से, समांगी Lyapunov फ़ंक्शन V(x) मौजूद है जो Lf V + LG₁Vαh(x) < 0 को संतुष्ट करता है 2. Sontag-प्रकार नियंत्रक αs(x) डिजाइन करें 3. साबित करें कि |R(x)| की सकारात्मक निचली सीमा है 4. विशेष γ चुनें जिससे ℓγ(2εs) = ε²ℓγ(2s) 5. नियंत्रक सहायक प्रणाली को स्थिर करता है यह सत्यापित करें 6. प्रमेय 1 लागू करके व्युत्क्रम इष्टतम नियंत्रक प्राप्त करें ### मुख्य असमानताएं सत्यापन #### 1. ISS सत्यापन (समीकरण 35) $$V̇(x) \leq -c_1\Gamma(x)^{2(k+r_0)} - \ell_\gamma(2|L_{G_2}V|) + L_{G_2}Vw + (1-\beta)\frac{\kappa}{2\vartheta^2}L_{G_1}VR^{-1}(L_{G_1}V)^T$$ Young असमानता का उपयोग करें: 2LG₂Vw ≤ λℓγ(2|LG₂V|) + λγ(|w|/λ), प्राप्त करें: $$V̇(x) \leq -c_1\Gamma(x)^{2(k+r_0)} + \gamma(|w|/2)$$ #### 2. L2 स्थिरता सत्यापन (समीकरण 36) $$\kappa V̇(x) + \frac{y^T Ry}{\beta} \leq -H_\kappa(x) + \kappa\gamma(|w|/2)$$ चूंकि Hκ(x) ≥ 0 और γ(s) = (1/μ)s², समाकलन से: $$\int_0^T y^T y dt \leq \frac{\rho_m^{-1}\kappa\beta}{4\mu}\int_0^T w^T w dt + \rho_m^{-1}\kappa\beta V(x(0))$$ ### मामला विश्लेषण #### उदाहरण 4 की विस्तृत गणना **चरण 1: Lyapunov फ़ंक्शन चयन** V(x) = (x₁^(4/3) + x₂⁴)^(1/2) डिग्री 2 का समांगी फ़ंक्शन है **चरण 2: Lie डेरिवेटिव की गणना** - Lf V = (2/3)x₁^(1/3)(x₁^(4/3) + x₂⁴)^(-1/2)(-x₁ + x₂³) - LG₁V = 2x₂³(x₁^(4/3) + x₂⁴)^(-1/2) - LG₂V = 2x₂³(x₁^(4/3) + x₂⁴)^(-1/2) **चरण 3: निहितार्थ संबंध सत्यापन** जब LG₁V = 0 हो, तो x₂ = 0, इसलिए: $$\phi = \frac{2}{3}x_1^{1/3}(x_1^{4/3})^{-1/2}(-x_1) = -\frac{2}{3}x_1^{2/3} < 0$$ **चरण 4: पैरामीटर गणना** समांगी गोलाकार S = {x : (|x₁|^(4/3) + |x₂|⁴)^(1/4) = 1} पर: - क्षेत्र Q₀ = cl{x : LG₁V = 0} में: ρ₁ = 0.66, ρ₂ = 0.24 → κc = 0.36 - क्षेत्र S\Q₀ में: ρ₃ = 0.42, ρ₄ = 0.37, ρ = 2.18 → κ₁ = 10.55 **चरण 5: अंतिम नियंत्रक** κ = 11, β = 2 चुनें, व्युत्क्रम इष्टतम नियंत्रक u = 2α(x) प्राप्त करें, ISS और L2 स्थिरता सुनिश्चित करें। ## संबंधित कार्य ### 1. व्युत्क्रम इष्टतम नियंत्रण आधार - **Kalman [9]**: अग्रणी कार्य, व्युत्क्रम इष्टतम नियंत्रण अवधारणा प्रस्तावित - **Freeman & Kokotovic [10]**: मजबूत स्थिरीकरण में व्युत्क्रम इष्टतमता - **Krstic & Li [11]**: व्युत्क्रम इष्टतम ISS नियंत्रण ढांचा, इस पेपर का मुख्य संदर्भ ### 2. ISS सिद्धांत - **Sontag & Yuan [16]**: ISS गुणों की विशेषता - **Sontag [20]**: Sontag-प्रकार सार्वभौमिक नियंत्रक निर्माण - **Krstic आदि [35]**: अरैखिक अनुकूली नियंत्रण डिजाइन ### 3. समांगी प्रणाली सिद्धांत - **Kawski [1]**, **Hermes [3]**, **Rosier [4]**: समांगी प्रणाली आधार सिद्धांत - **Hong आदि [2,6]**: समांगी परिमित-समय नियंत्रण और H∞ नियंत्रण - **Bhat & Bernstein [19]**: ज्यामितीय समांगीता और परिमित-समय स्थिरता - **Andrieu आदि [25]**, **Bernuau आदि [26,27]**: समांगी प्रणालियों का ISS विश्लेषण ### 4. व्युत्क्रम इष्टतम नियंत्रण विस्तार - **Deng & Krstic [12]**: यादृच्छिक अरैखिक स्थिरीकरण - **Li & Krstic [13]**: अनुकूली ट्रैकिंग नियंत्रण - **Lu आदि [14]**: अनमॉडल्ड गतिशीलता के साथ व्युत्क्रम इष्टतम अनुकूली नियंत्रण - **Krstic [23]**: व्युत्क्रम इष्टतम सुरक्षा फ़िल्टर ### 5. समांगी व्युत्क्रम इष्टतम नियंत्रण - **Nakamura आदि [7]**: इनपुट-अफाइन समांगी प्रणालियों की समांगी स्थिरीकरण, लाभ मार्जिन का अध्ययन - **इस पेपर का अंतर**: - [7] केवल व्यतिक्रमण-मुक्त स्थिति पर विचार करता है - [7] का लागत कार्यात्मक आउटपुट दंड नहीं रखता - यह पेपर ISS और IOS दोनों सुनिश्चित करता है ### 6. H∞ नियंत्रण सिद्धांत - **Isidori & Astolfi [21]**, **van der Schaft [33]**: अरैखिक H∞ नियंत्रण - **Isidori & Lin [15]**: वैश्विक L2 लाभ डिजाइन - **इस पेपर का संबंध**: IOS गारंटी H∞ जैसी व्यतिक्रमण क्षीणन कार्यक्षमता प्रदान करती है ## निष्कर्ष और चर्चा ### मुख्य निष्कर्ष 1. **सैद्धांतिक योगदान**: पहली बार ISS और IOS दोनों को सुनिश्चित करने वाले व्युत्क्रम इष्टतम नियंत्रण सैद्धांतिक ढांचा स्थापित किया, आउटपुट दंड लागत कार्यात्मक के निर्माण की समस्या हल की। 2. **पर्याप्तता परिणाम**: साबित किया कि व्यतिक्रमण-मुक्त स्थिति में समांगी स्थिरीकरणीयता समांगी प्रणालियों की व्युत्क्रम इष्टतम लाभ आवंटन समस्या की सॉल्वेबिलिटी के लिए पर्याप्त शर्त है (प्रमेय 2)। 3. **निर्माण विधि**: पूर्ण डिजाइन प्रक्रिया प्रदान की: - समांगीता-संरक्षण γ(s) चयन - समांगी गोलाकार तकनीक द्वारा पैरामीटर κ निर्धारण - वजन मैट्रिक्स निरंतरता सुनिश्चित करने के लिए Sontag-प्रकार नियंत्रक 4. **कार्यक्षमता गारंटी**: डिजाइन किए गए नियंत्रक निम्नलिखित गुण रखते हैं: - इनपुट-स्टेट स्थिरता (ISS) - परिमित लाभ L2 स्थिरता (IOS) - समायोज्य लाभ मार्जिन (1/β, ∞) - व्युत्क्रम इष्टतमता ### सीमाएं 1. **समांगीता आवश्यकता**: विधि केवल समांगी प्रणालियों या समांगी प्रणालियों द्वारा अनुमानित प्रणालियों पर लागू होती है (टिप्पणी 7 स्थानीय समाधान प्रदान करती है)। 2. **एकल इनपुट सीमा**: सैद्धांतिक ढांचा वर्तमान में केवल अदिश नियंत्रण इनपुट u ∈ ℝ पर विचार करता है, बहु-इनपुट स्थिति में विस्तार के लिए आगे के अनुसंधान की आवश्यकता है। 3. **Lyapunov फ़ंक्शन निर्भरता**: पहले से समांगी Lyapunov फ़ंक्शन V(x) जानना आवश्यक है, जटिल प्रणालियों के लिए निर्माण कठिन हो सकता है। 4. **पैरामीटर चयन जटिलता**: पैरामीटर κ का चयन समांगी गोलाकार पर अनुकूलन समस्या हल करने की आवश्यकता है, गणना जटिल हो सकती है। 5. **चिकनाई धारणा**: f(x), G(x), h(x) को ℝⁿ\{0} पर निरंतर अवकलनीय होना आवश्यक है, कुछ गैर-चिकनी प्रणालियों को बाहर करता है। 6. **ऑर्थोगोनैलिटी धारणा**: धारणा hᵀd = 0 कुछ अनुप्रयोगों में संतुष्ट नहीं हो सकती, विधि की प्रयोज्यता को सीमित करती है। ### भविष्य की दिशाएं 1. **अधिक सामान्य प्रणालियों तक विस्तार**: गैर-समांगी प्रणालियों या अधिक सामान्य संरचना वाली प्रणालियों की व्युत्क्रम इष्टतम IOS नियंत्रण का अध्ययन। 2. **बहु-इनपुट बहु-आउटपुट**: सिद्धांत को MIMO प्रणालियों तक विस्तारित करें। 3. **अनुकूली स्थिति**: अनुकूली नियंत्रण तकनीकों को संयोजित करें, पैरामीटर अनिश्चितता को संभालें। 4. **संख्यात्मक एल्गोरिदम**: पैरामीटर κ की गणना और Lyapunov फ़ंक्शन निर्माण के लिए कुशल संख्यात्मक एल्गोरिदम विकसित करें। 5. **अनुप्रयोग अनुसंधान**: सिद्धांत को रोबोटिक्स नियंत्रण, विद्युत प्रणाली, एयरोस्पेस आदि वास्तविक प्रणालियों में लागू करें। 6. **धारणाएं शिथिल करना**: hᵀd = 0 जैसी धारणा शर्तों को शिथिल करने का अनुसंधान करें। ## गहन मूल्यांकन ### लाभ #### 1. सैद्धांतिक नवाचार - **अग्रणीता**: व्युत्क्रम इष्टतम नियंत्रण ढांचे में पहली बार आउटपुट दंड पेश किया, सैद्धांतिक अंतराल भरा। - **एकीकृत ढांचा**: ISS और IOS को व्युत्क्रम इष्टतम नियंत्रण ढांचे में एकीकृत किया, सैद्धांतिक सुंदरता प्रदान की। - **तकनीकी सफलता**: आउटपुट दंड के कारण स्थिति दंड l(x) की सकारात्मकता सुनिश्चित करने की मुख्य तकनीकी कठिनाई हल की। #### 2. विधि कठोरता - **पूर्ण प्रमाण**: सभी प्रमेयों के कठोर गणितीय प्रमाण हैं, तार्किक श्रृंखला पूर्ण है। - **निर्माणात्मक**: प्रमेय 2 स्पष्ट नियंत्रक डिजाइन विधि प्रदान करता है, केवल अस्तित्व नहीं बल्कि निर्माण प्रक्रिया भी देता है। - **प्रतिउदाहरण समर्थन**: उदाहरण 1 और 3 के माध्यम से मौजूदा विधियों की सीमाएं स्पष्ट रूप से प्रदर्शित की। #### 3. तकनीकी गहराई - **समांगीता का चतुर उपयोग**: - समांगी गोलाकार का उपयोग करके वैश्विक समस्या को कॉम्पैक्ट सेट पर समस्या में रूपांतरित करना (लेम्मा 4) - सहायक प्रणाली की समांगीता संरक्षित करने के लिए विशेष डिजाइन (लेम्मा 3) - **Legendre-Fenchel रूपांतरण**: ℓγ(2εs) = ε²ℓγ(2s) गुण का चतुर उपयोग - **वजन मैट्रिक्स डिजाइन**: Sontag नियंत्रक विचार से प्रेरित होकर निरंतरता सुनिश्चित करना #### 4. व्यावहारिक मूल्य - **लाभ मार्जिन**: समायोज्य लाभ मार्जिन (1/β, ∞) प्रदान करता है, मजबूतता बढ़ाता है। - **दोहरी गारंटी**: ISS और IOS दोनों सुनिश्चित करता है, व्यावहारिक नियंत्रण आवश्यकताओं को पूरा करता है। - **डिजाइन प्रक्रिया**: उदाहरण 4 पूर्ण डिजाइन उदाहरण प्रदान करता है, अनुप्रयोग में सुविधा देता है। ### कमियां #### 1. प्रयोज्यता सीमा - **कठोर समांगीता आवश्यकता**: कई वास्तविक प्रणालियां समांगीता संतुष्ट नहीं करती, हालांकि टिप्पणी 7 स्थानीय समाधान प्रदान करती है, लेकिन वैश्विक कार्यक्षमता की गारंटी नहीं है। - **एकल इनपुट सीमा**: बहु-इनपुट स्थिति शामिल नहीं है, जटिल प्रणालियों में अनुप्रयोग को सीमित करता है। #### 2. कार्यान्वयन जटिलता - **पैरामीटर चयन**: κ का चयन समांगी गोलाकार पर min-max समस्या हल करने की आवश्यकता है, गणना मात्रा बड़ी हो सकती है। - **Lyapunov फ़ंक्शन**: समांगी Lyapunov फ़ंक्शन पहले से निर्मित करना आवश्यक है, गैर-विशेषज्ञों के लिए कठिन हो सकता है। - **वजन मैट्रिक्स**: R(x) की अभिव्यक्ति (समीकरण 47) जटिल है, वास्तविक कार्यान्वयन कठिन हो सकता है। #### 3. प्रायोगिक सत्यापन अपर्याप्त - **संख्यात्मक सिमुलेशन की कमी**: उदाहरण 4 के सैद्धांतिक गणना के अलावा, संख्यात्मक सिमुलेशन परिणाम (जैसे स्थिति प्रक्षेपवक्र, नियंत्रण इनपुट तरंग) प्रदान नहीं किए गए। - **वास्तविक प्रणाली सत्यापन नहीं**: वास्तविक भौतिक प्रणाली पर सैद्धांतिक परिणामों का सत्यापन नहीं किया गया। - **कार्यक्षमता तुलना**: अन्य विधियों के साथ मात्रात्मक कार्यक्षमता तुलना की कमी। #### 4. सैद्धांतिक पूर्णता - **आवश्यकता**: केवल पर्याप्त शर्तें दी गई हैं, आवश्यकता पर चर्चा नहीं की गई। - **इष्टतमता अंतराल**: प्राप्त नियंत्रक और वास्तविक इष्टतम नियंत्रक के बीच कार्यक्षमता अंतराल का विश्लेषण नहीं किया। - **व्यतिक्रमण प्रकार**: केवल L∞ व्यतिक्रमण पर विचार किया, अन्य प्रकार के व्यतिक्रमण (जैसे यादृच्छिक व्यतिक्रमण) पर चर्चा नहीं की। #### 5. लेखन समस्याएं - **प्रतीक घनत्व**: गणितीय प्रतीक और सूत्र बहुत घने हैं, पठनीयता कठिन है। - **सहज ज्ञान की कमी**: ज्यामितीय सहज ज्ञान और भौतिक अर्थ की व्याख्या की कमी। - **सरल उदाहरण**: उदाहरण 4 पूर्ण है, लेकिन प्रणाली आयाम कम है (n=2), उच्च-आयामी स्थिति प्रदर्शित नहीं करता। ### प्रभाव #### 1. शैक्षणिक योगदान - **सैद्धांतिक सफलता**: व्युत्क्रम इष्टतम नियंत्रण सिद्धांत में नई दिशा खोली, बाद के अनुसंधान को प्रेरित करने की अपेक्षा है। - **पद्धति योगदान**: समांगीता तकनीक का व्युत्क्रम इष्टतम नियंत्रण में अनुप्रयोग नई अनुसंधान प्रतिमा प्रदान करता है। - **उद्धरण संभावना**: ISS और IOS दोनों पर विचार करने वाला पहला पेपर होने के नाते, इस दिशा का आधार साहित्य बनने की संभावना है। #### 2. व्यावहारिक अनुप्रयोग संभावनाएं - **रोबोटिक्स नियंत्रण**: स्थिरता और आउटपुट कार्यक्षमता दोनों सुनिश्चित करने की आवश्यकता वाली रोबोटिक प्रणालियों में अनुप्रयोग संभावना है। - **विद्युत प्रणाली**: व्यतिक्रमण दमन की आवश्यकता वाली विद्युत प्रणाली नियंत्रण में उपयोगी हो सकता है। - **सीमा**: समांगीता आवश्यकता सीधे अनुप्रयोग सीमा को सीमित करती है, आगे के अनुसंधान की आवश्यकता है। #### 3. पुनरुत्पादनीयता - **सैद्धांतिक पुनरुत्पादनीयता**: प्रमाण कठोर है, सैद्धांतिक परिणाम पुनरुत्पादनीय हैं। - **कार्यान्वयन चुनौती**: कोड और विस्तृत एल्गोरिदम की कमी, वास्तविक कार्यान्वयन कठिन हो सकता है। - **आवश्यक पूरक**: लेखकों को Matlab/Python टूलकिट प्रदान करने की सिफारिश की जाती है उपयोगिता बढ़ाने के लिए। ### प्रयोज्य परिदृश्य #### 1. आदर्श प्रयोज्य परिदृश्य - **समांगी यांत्रिक प्रणाली**: जैसे Euler-Lagrange प्रणाली कुछ निर्देशांकों में समांगी हो सकती है। - **शक्ति प्रणाली**: कुछ शक्ति परिवर्तक मॉडल समांगी संरचना रखते हैं। - **कम-आयामी अरैखिक प्रणाली**: आयाम कम (n≤5) और समांगीता रखने वाली प्रणाली। #### 2. सुधार के बाद प्रयोज्य - **गैर-समांगी प्रणाली**: समांगी अनुमान या स्थानीय अनुप्रयोग की आवश्यकता (जैसे टिप्पणी 7)। - **बहु-इनपुट प्रणाली**: सैद्धांतिक विस्तार की आवश्यकता। - **बाधा वाली प्रणाली**: स्थिति या नियंत्रण बाधाएं विचार नहीं की गई। #### 3. अप्रयोज्य परिदृश्य - **अत्यधिक अरैखिक गैर-समांगी प्रणाली**: जैसे तंत्रिका नेटवर्क, अराजक प्रणाली। - **असतत समय प्रणाली**: सिद्धांत केवल निरंतर समय के लिए है। - **समय-विलंब प्रणाली**: समय-विलंब प्रभाव विचार नहीं किए गए। ## संदर्भ (मुख्य साहित्य) [1] Kawski, M. (1990). समांगी स्थिरीकरण प्रतिक्रिया कानून। [4] Rosier, L. (1992). समांगी सतत वेक्टर क्षेत्र के लिए समांगी Lyapunov फ़ंक्शन। [11] Krstic, M., & Li, Z. H. (1998). इनपुट-टू-स्टेट स्थिरीकरण अरैखिक नियंत्रकों का व्युत्क्रम इष्टतम डिजाइन। (इस पेपर का मुख्य संदर्भ) [19] Bhat, S. P., & Bernstein, D. S. (2005). परिमित-समय स्थिरता के अनुप्रयोगों के साथ ज्यामितीय समांगीता। [20] Sontag, E. D. (1989). अरैखिक स्थिरीकरण पर Artstein प्रमेय का सार्वभौमिक निर्माण। [32] Polyakov, A. (2020). प्रणालियों और नियंत्रण में सामान्यीकृत समांगीता। --- ## समग्र मूल्यांकन यह पेपर उच्च गुणवत्ता का सैद्धांतिक नियंत्रण पेपर है, व्युत्क्रम इष्टतम नियंत्रण क्षेत्र में महत्वपूर्ण योगदान देता है। समांगी गुणों का चतुर उपयोग करके, पहली बार ISS और IOS दोनों को सुनिश्चित करने वाली व्युत्क्रम इष्टतम नियंत्रण समस्या हल की। सिद्धांत कठोर है, प्रमाण पूर्ण है, तकनीकी गहराई अधिक है। मुख्य कमी समांगीता द्वारा सीमित प्रयोज्य सीमा और अपर्याप्त प्रायोगिक सत्यापन है। अनुशंसा की जाती है कि आगे के कार्य संख्यात्मक सिमुलेशन और व्यावहारिक अनुप्रयोग सत्यापन को मजबूत करें, और समांगीता आवश्यकता को शिथिल करने की संभावनाओं का अन्वेषण करें। अरैखिक नियंत्रण सिद्धांत अनुसंधान में लगे विद्वानों के लिए, यह गहन अध्ययन के योग्य एक पेपर है।