Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic
डेटा-संचालित स्थिरीकरण पूर्व ज्ञान का उपयोग करते हुए स्थिरीकरणीयता और नियंत्रणीयता पर
यह पेपर रैखिक समय-अपरिवर्तनीय प्रणालियों के डेटा-संचालित स्थिरीकरण समस्या का अध्ययन करता है, जहां प्रणाली सिद्धांत के गुणों (विशेषकर स्थिरीकरणीयता और नियंत्रणीयता) को पूर्व ज्ञान के रूप में उपयोग किया जाता है। लेखकों ने डेटा सूचनात्मकता की अवधारणा को विस्तारित किया है, जिसमें एक नियंत्रक के अस्तित्व की आवश्यकता होती है जो डेटा और पूर्व ज्ञान के अनुरूप सभी प्रणालियों को स्थिर कर सके। अनुसंधान से पता चलता है: (1) यदि प्रणाली नियंत्रणीय है, तो इसे पूर्व ज्ञान के रूप में उपयोग करने से डेटा-संचालित स्थिरीकरण की शर्तें शिथिल नहीं होती हैं; (2) यदि प्रणाली स्थिरीकरणीय है, तो इस पूर्व ज्ञान का उपयोग करने से बिना पूर्व ज्ञान की तुलना में कमजोर पर्याप्त शर्तें मिलती हैं। दूसरे शब्दों में, यदि अंतर्निहित प्रणाली स्थिरीकरणीय है, तो डेटा-संचालित स्थिरीकरण अधिक आसानी से प्राप्त होता है। लेख रैखिक मैट्रिक्स असमानता (LMI) पर आधारित नए डेटा-संचालित नियंत्रण डिजाइन विधि भी प्रदान करता है।
यह पेपर निम्नलिखित को हल करता है: सीमित डेटा की स्थिति में, प्रणाली की स्थिरीकरणीयता या नियंत्रणीयता के पूर्व ज्ञान को जोड़कर, स्थिरीकरण नियंत्रक को कैसे डिजाइन किया जाए?
पारंपरिक डेटा-संचालित नियंत्रण मानता है कि प्रणाली पैरामीटर पूरी तरह से अज्ञात हैं, लेकिन अधिकांश भौतिक प्रणालियों के लिए यह धारणा बहुत रूढ़िवादी है। व्यवहार में, हम अक्सर कुछ पूर्व ज्ञान रखते हैं (जैसे द्रव्यमान, वसंत स्थिरांक आदि भौतिक मात्राओं की सीमा, या प्रणाली संरचना से अनुमानित नियंत्रणीयता/स्थिरीकरणीयता)।
डेटा आवश्यकता में कमी: डेटा से सीधे नियंत्रक डिजाइन करने के लिए निरंतर उत्तेजना शर्त को पूरा करने के लिए बड़ी मात्रा में डेटा की आवश्यकता हो सकती है, लेकिन पूर्व ज्ञान के साथ कम डेटा से स्थिरीकरण संभव हो सकता है
व्यावहारिक व्यवहार्यता: कुछ मामलों में केवल डेटा से स्थिरीकरण नियंत्रक डिजाइन करना संभव नहीं है (जैसे स्थिति डेटा रैंक-कमी), लेकिन पूर्व ज्ञान जोड़ने से डिजाइन संभव हो सकता है
सैद्धांतिक पूर्णता: प्रणाली सिद्धांत के गुण (नियंत्रणीयता, स्थिरीकरणीयता) नियंत्रण सिद्धांत की मौलिक अवधारणाएं हैं, लेकिन डेटा-संचालित ढांचे में अभी तक पूरी तरह से अध्ययन नहीं किए गए हैं
डेटा-संचालित नियंत्रण: मौजूदा कार्य (जैसे डी पेर्सिस और टेसी 2019, वैन वार्डे एट अल. 2020) मुख्य रूप से बिना पूर्व ज्ञान के मामले का अध्ययन करते हैं, कठोर डेटा शर्तों (जैसे निरंतर उत्तेजना, स्थिति डेटा पूर्ण रैंक) को पूरा करने की आवश्यकता है
पूर्व ज्ञान एकीकरण: मौजूदा अनुसंधान केवल पैरामीटर सीमा बाधाओं 12-14 या आंशिक ज्ञात पैरामीटर 15 तक सीमित है, प्रणाली सिद्धांत के गुणों को शामिल नहीं करता है
गैर-उत्तल चुनौती: स्थिरीकरणीय और नियंत्रणीय प्रणाली सेट गैर-उत्तल हैं, मौजूदा कार्य द्वारा विचार किए गए उत्तल प्रणाली सेट से अलग
कई व्यावहारिक अनुप्रयोगों में, प्रणाली संरचना से नियंत्रणीयता या स्थिरीकरणीयता का अनुमान लगाया जा सकता है (संरचनात्मक नियंत्रणीयता सिद्धांत), लेकिन इस तरह का पूर्व ज्ञान डेटा-संचालित नियंत्रण में अभी तक उपयोग नहीं किया गया है। यह पेपर इस सैद्धांतिक अंतर को भरता है।
सैद्धांतिक ढांचे का विस्तार: डेटा सूचनात्मकता (data informativity) की अवधारणा को पूर्व ज्ञान को शामिल करने के लिए विस्तारित किया, Σ_pk-सूचनात्मकता परिभाषा प्रस्तुत की (परिभाषा 3)
नियंत्रणीयता पूर्व के समतुल्यता प्रमेय (प्रमेय 5): साबित किया कि नियंत्रणीयता को पूर्व ज्ञान के रूप में उपयोग करना बिना पूर्व ज्ञान के मामले के समतुल्य है, अर्थात् नियंत्रणीयता पूर्व डेटा शर्तों को शिथिल नहीं कर सकता
स्थिरीकरणीयता पूर्व के लाभ प्रमेय (प्रमेय 14, 15):
जब स्थिति डेटा पूर्ण रैंक हो (rank X⁻ = n), तो स्थिरीकरणीयता पूर्व अतिरिक्त सहायता नहीं देता
जब स्थिति डेटा रैंक-कमी हो (rank X⁻ < n), तो स्थिरीकरणीयता पूर्व शर्तों को महत्वपूर्ण रूप से शिथिल करता है, पर्याप्त और आवश्यक शर्तें देता है
गणनीय डिजाइन विधि (प्रस्ताव 16): LMI पर आधारित स्थिरीकरण नियंत्रक की गणना विधि प्रदान करता है, जो Σ_stab-सूचनात्मक डेटा से सीधे हल किया जा सकता है
सैद्धांतिक अंतर्दृष्टि: एक प्रतीत होने वाली विरोधाभासी घटना को प्रकट करता है—अधिक मजबूत गुण (नियंत्रणीयता) शर्तों को शिथिल नहीं कर सकता, जबकि कमजोर गुण (स्थिरीकरणीयता) कर सकता है, यह इसलिए है कि कुछ मामलों में सभी डेटा-सुसंगत प्रणालियां नियंत्रणीय नहीं हैं
परिभाषा 3 (स्थिरीकरण के लिए Σ_pk-सूचनात्मकता):
डेटा D को स्थिरीकरण के लिए Σ_pk-सूचनात्मक कहा जाता है, यदि K∈ℝᵐˣⁿ मौजूद है ताकि A+BK सभी (A,B)∈Σ_D∩Σ_pk के लिए Schur स्थिर हो।
प्रमेय 5 (मुख्य परिणाम): मान लें (A_true, B_true)∈Σ_cont, तो निम्नलिखित समतुल्य हैं:
(a) डेटा D स्थिरीकरण के लिए Σ_cont-सूचनात्मक है
(b) डेटा D स्थिरीकरण के लिए सूचनात्मक है (बिना पूर्व ज्ञान)
प्रमाण विचार:
(b)⇒(a) स्पष्ट रूप से सत्य है
(a)⇒(b) की कुंजी:
यदि Σ_D⊆Σ_cont, तो निष्कर्ष स्पष्ट है
यदि गैर-नियंत्रणीय (Ā,B̄)∈Σ_D मौजूद है, लेम्मा 7 (लगभग सभी बिंदुओं पर प्रणाली परिवार नियंत्रणीय) और लेम्मा 9 (मैट्रिक्स बीम स्थिरता) का उपयोग करके साबित करें कि स्थिरीकरण K भी (Ā,B̄) को स्थिर कर सकता है
मुख्य लेम्मा:
लेम्मा 7: यदि (M,N) नियंत्रणीय है, तो (M+αM₀, N+αN₀) अधिकतम n² α मानों को छोड़कर सभी के लिए नियंत्रणीय है
लेम्मा 9: यदि M+δN सभी δ∈[ε,∞)\F (F परिमित) के लिए Schur है, तो N nilpotent है और M+δN सभी δ∈ℝ के लिए Schur है
यदि डेटा Σ_stab-सूचनात्मक है और K स्थिरीकरण लाभ है, तो:
(a) (A₀+B₀K)R(A,B) = {0} सभी (A,B)∈Σ_D∩Σ_stab और (A₀,B₀)∈Σ⁰_D के लिए
(b) यदि rank X⁻ < n, तो imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ A-अपरिवर्तनीय है और im B को शामिल करता है
टिप्पणी 11: शर्त (a) बिना पूर्व ज्ञान के मामले में A₀+B₀K=0 की शिथिलता है; शर्तें (b)-(d) rank X⁻ = n होने पर स्वचालित रूप से संतुष्ट होती हैं, लेकिन रैंक-कमी मामले में गैर-तुच्छ हैं।
जिया एट अल. (2020) आदि ने प्रणाली संरचना से नियंत्रणीयता का अनुमान लगाने का अध्ययन किया, यह पेपर इन संरचनात्मक जानकारी को डेटा-संचालित नियंत्रण में उपयोग करने के पुल के रूप में देखा जा सकता है।
नियंत्रणीयता पूर्व की अप्रभावशीलता: यदि प्रणाली नियंत्रणीय है, तो यह पूर्व डेटा-संचालित स्थिरीकरण की शर्तों को शिथिल नहीं कर सकता (प्रमेय 5)
स्थिरीकरणीयता पूर्व की प्रभावशीलता:
स्थिति डेटा पूर्ण रैंक होने पर कोई सहायता नहीं (प्रमेय 14)
स्थिति डेटा रैंक-कमी होने पर शर्तों को महत्वपूर्ण रूप से शिथिल करता है (प्रमेय 15)
प्रतिकूल घटना: अधिक मजबूत गुण (नियंत्रणीयता) बेकार है, कमजोर गुण (स्थिरीकरणीयता) सहायक है—कारण यह है कि संभवतः सभी डेटा-सुसंगत प्रणालियां नियंत्रणीय नहीं हैं
व्यावहारिक डिजाइन विधि: LMI पर आधारित गणनीय नियंत्रक डिजाइन विधि प्रदान करता है (प्रस्ताव 16)
शोर-मुक्त धारणा: वर्तमान सिद्धांत केवल शोर-मुक्त डेटा पर लागू होता है, शोर मामले में विस्तार खुली समस्या है
ऑफलाइन डेटा: पूर्ण डेटा सेट पहले से एकत्र करने की आवश्यकता है, ऑनलाइन सीखने के परिदृश्य के लिए उपयुक्त नहीं है
रैखिक प्रणालियां: केवल LTI प्रणालियों पर विचार करता है, गैर-रैखिक प्रणालियों का विस्तार चुनौतीपूर्ण है
बाइनरी पूर्व: केवल "स्थिरीकरणीय" या "गैर-स्थिरीकरणीय" पर विचार करता है, पहुंच योग्य उप-स्थान आयाम की ऊपरी सीमा जैसे अधिक सूक्ष्म पूर्व पर विचार नहीं करता है
Schur स्थिरता: केवल स्थिरता पर विचार करता है, प्रदर्शन संकेतक (जैसे H∞ मानदंड) को शामिल नहीं करता है
गैर-उत्तल पूर्व का प्रबंधन: डेटा-संचालित नियंत्रण में पहली बार गैर-उत्तल पूर्व ज्ञान सेट (स्थिरीकरणीय/नियंत्रणीय प्रणाली सेट गैर-उत्तल) को संभाला, तकनीकी कठिनाई अधिक है
पर्याप्त और आवश्यक शर्तें: प्रमेय 15 रैंक-कमी मामले के लिए पर्याप्त और आवश्यक शर्तें देता है, सैद्धांतिक पूर्णता
प्रतिकूल परिणाम: नियंत्रणीयता बेकार लेकिन स्थिरीकरणीयता सहायक होने की घटना को प्रकट करता है, गहन अंतर्दृष्टि प्रदान करता है
यह एक उच्च गुणवत्ता का सैद्धांतिक नियंत्रण पेपर है, जो डेटा-संचालित नियंत्रण क्षेत्र में महत्वपूर्ण योगदान देता है। मुख्य हाइलाइट्स हैं:
पहली बार प्रणाली सिद्धांत गुणों को पूर्व ज्ञान के रूप में व्यवस्थित रूप से अध्ययन किया
नियंत्रणीयता और स्थिरीकरणीयता के बीच मौलिक अंतर को प्रकट किया
पूर्ण पर्याप्त और आवश्यक शर्तें और गणनीय विधि प्रदान की
मुख्य कमी प्रायोगिक सत्यापन अपर्याप्त है, शोर मजबूती पर विचार नहीं किया।
अनुशंसा सूचकांक: ⭐⭐⭐⭐☆ (4/5)
सैद्धांतिक गहराई: ⭐⭐⭐⭐⭐
व्यावहारिक मूल्य: ⭐⭐⭐⭐
प्रायोगिक पूर्णता: ⭐⭐⭐
लेखन गुणवत्ता: ⭐⭐⭐⭐⭐
नवाचार: ⭐⭐⭐⭐⭐
नियंत्रण क्षेत्र के शीर्ष पत्रिकाओं (जैसे IEEE TAC, Automatica) में प्रकाशन के लिए उपयुक्त है, डेटा-संचालित नियंत्रण और प्रणाली सिद्धांत अनुसंधानकर्ताओं के लिए महत्वपूर्ण संदर्भ मूल्य है।
3 एच. जे. वैन वार्डे एट अल., "डेटा सूचनात्मकता: डेटा-संचालित विश्लेषण और नियंत्रण पर एक नया दृष्टिकोण," IEEE TAC, 2020। (डेटा सूचनात्मकता ढांचे का मौलिक कार्य)
4 सी. डी पेर्सिस और पी. टेसी, "डेटा-संचालित नियंत्रण के लिए सूत्र: स्थिरीकरण, इष्टतमता, और मजबूती," IEEE TAC, 2019। (पहली डेटा-संचालित स्थिरीकरण LMI विधि)
12 जे. बर्बेरिच एट अल., "पूर्व ज्ञान और डेटा को जोड़कर मजबूत नियंत्रक डिजाइन," IEEE TAC, 2022। (पैरामीटर सीमा पूर्व ज्ञान)
25 जे. जिया एट अल., "मजबूत संरचनात्मक नियंत्रणीयता के लिए एकीकृत ढांचा," IEEE TAC, 2020। (संरचनात्मक नियंत्रणीयता सिद्धांत)
27 एच. जे. वैन वार्डे और एम. के. कैमलिबेल, "डेटा-संचालित नियंत्रण के अनुप्रयोगों के साथ मैट्रिक्स Finsler की लेम्मा," CDC, 2021। (द्विघात स्थिरीकरण सिद्धांत)