2025-11-17T05:46:12.770787

Data-Driven Structured Controller Design Using the Matrix S-Procedure

Yang, Zhong, Yang et al.
This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.
academic

डेटा-संचालित संरचित नियंत्रक डिजाइन मैट्रिक्स S-प्रक्रिया का उपयोग करते हुए

मूल जानकारी

  • पेपर ID: 2503.14949
  • शीर्षक: डेटा-संचालित संरचित नियंत्रक डिजाइन मैट्रिक्स S-प्रक्रिया का उपयोग करते हुए
  • लेखक: Zhaohua Yang, Yuxing Zhong, Nachuan Yang, Xiaoxu Lyu, Ling Shi
  • वर्गीकरण: math.OC (गणितीय अनुकूलन और नियंत्रण)
  • प्रकाशन समय: 25 अक्टूबर, 2025 (Automatica को प्रस्तुत प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2503.14949

सारांश

यह पेपर असतत समय रैखिक समय-अपरिवर्तनीय (LTI) प्रणालियों के लिए डेटा-संचालित इष्टतम संरचित नियंत्रक डिजाइन पर केंद्रित है, जबकि H2H_2 प्रदर्शन और HH_\infty प्रदर्शन दोनों पर विचार किया जाता है। विशेष रूप से तीन परिदृश्यों का अध्ययन किया जाता है: (i) मॉडल-आधारित संरचित नियंत्रण, (ii) डेटा-संचालित असंरचित नियंत्रण, (iii) डेटा-संचालित संरचित नियंत्रण। H2H_2 प्रदर्शन के लिए, मुख्य रूप से परिदृश्य (ii) और (iii) का अध्ययन किया जाता है, क्योंकि परिदृश्य (i) पहले से ही साहित्य में व्यापक रूप से अध्ययन किया जा चुका है। HH_\infty प्रदर्शन के लिए, सभी तीन परिदृश्यों पर विचार किया जाता है। संरचित नियंत्रण के लिए, एक रैखिकीकरण तकनीक प्रस्तुत की गई है जो मूल गैर-उत्तल समस्या को अर्ध-निश्चित प्रोग्रामिंग (SDP) समस्या में परिवर्तित करती है, और इसके आधार पर पुनरावृत्तिमूलक रैखिक मैट्रिक्स असमानता (ILMI) एल्गोरिदम विकसित किया गया है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

  1. नेटवर्क नियंत्रण प्रणालियों की चुनौतियाँ: बड़े पैमाने की नेटवर्क नियंत्रण प्रणालियों में, केंद्रीकृत नियंत्रण रणनीति भारी संचार बोझ लाती है, इसलिए विरल संरचना वाले नियंत्रकों को डिजाइन करने की आवश्यकता है।
  2. संरचित नियंत्रक डिजाइन की कठिनाई: संरचनात्मक बाधाओं के साथ नियंत्रक डिजाइन NP-कठिन जटिलता रखता है, मौजूदा विधियाँ मुख्य रूप से LMI-आधारित और ढाल-आधारित विधियों में विभाजित हैं।
  3. डेटा-संचालित नियंत्रण की आवश्यकता: व्यावहारिक अनुप्रयोगों में, कई प्रणालियों की गतिशीलता मॉडल अक्सर प्राप्त नहीं किए जा सकते, जो डेटा-संचालित नियंत्रण के अनुसंधान को प्रेरित करता है।

मौजूदा विधियों की सीमाएँ

  1. पारंपरिक विधियाँ ज्ञात मॉडल पर निर्भर हैं: मौजूदा संरचित नियंत्रक डिजाइन विधियाँ मानती हैं कि प्रणाली मॉडल ज्ञात है।
  2. डेटा-संचालित विधियों की रूढ़िवादिता: Miller आदि 15 के कार्य जैसी मौजूदा डेटा-संचालित विधियों में निम्नलिखित समस्याएँ हैं:
    • तात्कालिक सीमित शोर को ऊर्जा-सीमित शोर अनुक्रम के रूप में अत्यधिक अनुमानित करना, अतिरिक्त रूढ़िवादिता का परिचय देना
    • केवल गैर-उत्तल व्यावहारिक क्षेत्र के उत्तल उपसमुच्चय के भीतर संरचित नियंत्रक डिजाइन करना
    • प्रदर्शन एकरसता की गारंटी का अभाव

मुख्य योगदान

  1. सुधारी गई डेटा-संचालित रूपरेखा:
    • सभी संभावित प्रणाली मैट्रिक्स के समुच्चय को प्रत्येक डेटा बिंदु समुच्चय के प्रतिच्छेदन के रूप में प्रस्तुत करना, जो 15 में समुच्चय से छोटा है
    • सभी संभावित प्रणाली मैट्रिक्स को संभालने के लिए मैट्रिक्स S-प्रक्रिया का उपयोग करना, यह साबित करना कि व्यावहारिक क्षेत्र 15 में व्यावहारिक क्षेत्र को शामिल करता है
    • डेटा लंबाई के संबंध में प्रदर्शन की एकरस गैर-घटती प्रकृति को साबित करना
  2. नई रैखिकीकरण तकनीक:
    • मूल गैर-उत्तल समस्या को SDP समस्या में परिवर्तित करने के लिए रैखिकीकरण तकनीक विकसित करना
    • संरचित नियंत्रक की गणना के लिए ILMI एल्गोरिदम प्रस्तावित करना
    • 15 की तुलना में बड़े व्यावहारिक क्षेत्र की खोज करने में सक्षम होना
  3. व्यापक HH_\infty नियंत्रण अनुसंधान:
    • पहली बार मॉडल-आधारित संरचित नियंत्रण, डेटा-संचालित असंरचित नियंत्रण और डेटा-संचालित संरचित नियंत्रण का व्यापक अध्ययन

विधि विवरण

कार्य परिभाषा

असतत समय LTI प्रणाली पर विचार करें:

x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k

जहाँ xkRnxx_k \in \mathbb{R}^{n_x} प्रणाली स्थिति है, ukRnuu_k \in \mathbb{R}^{n_u} नियंत्रण इनपुट है, ykRnyy_k \in \mathbb{R}^{n_y} नियंत्रण आउटपुट है, dkRndd_k \in \mathbb{R}^{n_d} बाहरी व्यतिक्रम है।

स्थिति प्रतिक्रिया नियंत्रक uk=Kxku_k = Kx_k का उपयोग करें, जहाँ KRnu×nxK \in \mathbb{R}^{n_u \times n_x} को संरचनात्मक बाधा KSK \in S को संतुष्ट करना चाहिए।

डेटा संग्रह तंत्र

मान लें कि मैट्रिक्स A,BA, B अज्ञात लेकिन निश्चित हैं, मैट्रिक्स C,D,G,HC, D, G, H ज्ञात हैं। संग्रहीत डेटा में शामिल हैं:

X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}

मुख्य धारणा: प्रक्रिया शोर सीमित है, अर्थात् wk2ϵ\|w_k\|_2 \leq \epsilon

मुख्य तकनीकी नवाचार

1. सुधारी गई प्रणाली मैट्रिक्स समुच्चय प्रतिनिधित्व

ii-वें समय चरण के डेटा (xi,ui,xi+1)(x_i, u_i, x_{i+1}) के आधार पर, परिभाषित करें:

Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}

डेटा के साथ सभी सुसंगत प्रणाली मैट्रिक्स का समुच्चय:

Σ = ∩_{i=0}^{T-1} Σ_i

यह 15 में समुच्चय की तुलना में अधिक सटीक है, रूढ़िवादिता को कम करता है।

2. मैट्रिक्स S-प्रक्रिया का अनुप्रयोग

H2H_2 नियंत्रण के लिए, मैट्रिक्स S-प्रक्रिया का उपयोग करते हुए, शर्त (5a) सभी (A,B)Σ(A,B) \in Σ के लिए सत्य होने के लिए पर्याप्त शर्त यह है कि गैर-नकारात्मक α0,α1,...,αT1α_0, α_1, ..., α_{T-1} और β>0β > 0 मौजूद हैं जैसे:

[PGGTβI00[IK]P[IK]T]i=0T1αiΨi0\begin{bmatrix} P - GG^T - βI & 0 \\ 0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T \end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0

3. रैखिकीकरण तकनीक

संरचित नियंत्रण के लिए, मुख्य चुनौती बाधा YP1Y ⪯ P^{-1} की गैर-उत्तलता है। दिए गए बिंदु P~\tilde{P} के पास P1P^{-1} को रैखिकीकृत करके:

Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1}

एल्गोरिदम ढाँचा

एल्गोरिदम 1: असंरचित इष्टतम नियंत्रक डिजाइन

इनपुट: डेटा X, U, शोर सीमा ε
आउटपुट: नियंत्रक K*, प्रदर्शन सीमा γ*
1. समस्या प्रकार के अनुसार संबंधित SDP समस्या चुनें
2. SDP को हल करके L*, P*, γ* प्राप्त करें
3. K* = L*P*^{-1}, γ* लौटाएँ

एल्गोरिदम 2: संरचित इष्टतम नियंत्रक डिजाइन

इनपुट: डेटा X, U, संरचनात्मक बाधा I_S
आउटपुट: नियंत्रक K*, प्रदर्शन सीमा γ*
1. λ, μ, δ, ε, P_0 = I, k = 0 को आरंभ करें
2. दोहराएँ:
   a. P̃ = P_k और λ के साथ SDP को हल करें
   b. K_{k+1}, P_{k+1}, γ_{k+1} को अपडेट करें
   c. यदि λ < δ तो λ = μλ
   d. k = k + 1
3. जब तक अभिसरण न हो
4. K_k, γ_k लौटाएँ

प्रयोगात्मक सेटअप

H2H_2 नियंत्रण केस

प्रणाली पैरामीटर:

A = [-0.4095  0.4036 -0.0874
      0.5154 -0.0815  0.1069
      1.6715  0.7718 -0.3376]

B = [ 0      0
     -0.6359 -0.1098
     -0.0325  2.2795]

संरचनात्मक बाधा: I_S = [1 1 0
                        0 1 1]

HH_\infty नियंत्रण केस

प्रणाली पैरामीटर:

A = [0.8  0.2  0.1
     0.1  0.7 -0.3
    -0.3  0.5  0.9]

B = [1 0
     0 1
     1 1]

संरचनात्मक बाधा: I_S = [1 1 0
                        1 1 0]

मूल्यांकन मेट्रिक्स

  • H2H_2/HH_\infty प्रदर्शन सीमा
  • गणना समय
  • बेंचमार्क विधियों के साथ प्रदर्शन तुलना

प्रयोगात्मक परिणाम

H2H_2 नियंत्रण परिणाम

विभिन्न शोर स्तरों के तहत प्रदर्शन तुलना (T=20)

डिजाइन विधि(A,B) ज्ञातε=0.05ε=0.1ε=0.2
असंरचित 152.15372.34483.09395.2814
असंरचित (यह पेपर)2.15372.26632.56602.7889
संरचित 152.97943.54944.680611.3186
संरचित (यह पेपर)2.71652.91543.22494.0422

विभिन्न डेटा लंबाई के तहत प्रदर्शन तुलना (ε=0.1)

डिजाइन विधि(A,B) ज्ञातT=6T=10T=15
असंरचित 152.15372.99112.81562.6836
असंरचित (यह पेपर)2.15372.74942.56452.4374
संरचित 152.97944.40364.43234.4456
संरचित (यह पेपर)2.71653.52493.24293.1485

HH_\infty नियंत्रण परिणाम

विभिन्न शोर स्तरों के तहत प्रदर्शन तुलना (T=50)

डिजाइन विधि(A,B) ज्ञातε=0.01ε=0.05ε=0.15
असंरचित 150.78150.80350.90631.6483
असंरचित (यह पेपर)0.78150.79210.82071.0303
संरचित विकर्ण P3.74644.09506.6234अव्यावहारिक
संरचित (यह पेपर)1.05801.08901.18261.5969

मुख्य निष्कर्ष

  1. प्रदर्शन लाभ: यह पेपर सभी परीक्षण परिदृश्यों में बेंचमार्क विधि 15 से काफी बेहतर है
  2. एकरसता: यह पेपर की विधि डेटा लंबाई T के साथ प्रदर्शन सीमा की एकरस गैर-घटती प्रकृति की गारंटी देती है, जबकि 15 में यह गुण नहीं है
  3. गणना लागत: पुनरावृत्तिमूलक प्रक्रिया और अधिक अनुकूलन चर के कारण, गणना समय में वृद्धि हुई है

संबंधित कार्य

संरचित नियंत्रक डिजाइन

  • LMI विधि: Polyak आदि 2, Fardad आदि 5 का कार्य
  • ढाल विधि: Lin आदि 3 की संवर्धित लैग्रेंजियन विधि
  • आंतरिक बिंदु विधि: Yang आदि 6 का नया एल्गोरिदम

डेटा-संचालित नियंत्रण

  • मूल सिद्धांत: Willems आदि 7 की मौलिक लेम्मा
  • मजबूत स्थिरीकरण: De Persis और Tesi 8, Berberich आदि 9 का कार्य
  • मैट्रिक्स S-लेम्मा अनुप्रयोग: van Waarde आदि 11, Bisoffi आदि 12,13 का अनुसंधान

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. अधिक सटीक प्रणाली मैट्रिक्स समुच्चय प्रतिनिधित्व प्रस्तुत किया, रूढ़िवादिता को कम किया
  2. संरचनात्मक बाधाओं को संभालने के लिए प्रभावी रैखिकीकरण तकनीक विकसित की
  3. विधि के सैद्धांतिक लाभों को साबित किया और संख्यात्मक प्रयोगों के माध्यम से सत्यापित किया

सीमाएँ

  1. गणना जटिलता: पुनरावृत्तिमूलक एल्गोरिदम और अतिरिक्त चर गणना बोझ को बढ़ाते हैं
  2. अभिसरण: एल्गोरिदम अभिसरण के लिए सैद्धांतिक गारंटी प्रदान नहीं की गई है
  3. संरचनात्मक बाधा सीमाएँ: विधि की प्रभावशीलता उचित संरचनात्मक बाधाओं पर निर्भर करती है

भविष्य की दिशाएँ

  1. एल्गोरिदम अभिसरण का सैद्धांतिक विश्लेषण
  2. गणना दक्षता का आगे अनुकूलन
  3. अधिक जटिल संरचनात्मक बाधाओं का प्रबंधन

गहन मूल्यांकन

शक्तियाँ

  1. ठोस सैद्धांतिक योगदान: सुधारी गई प्रणाली समुच्चय प्रतिनिधित्व और मैट्रिक्स S-प्रक्रिया अनुप्रयोग में सैद्धांतिक मूल्य है
  2. विधि नवाचार शक्तिशाली: रैखिकीकरण तकनीक गैर-उत्तल बाधाओं को कुशलतापूर्वक संभालती है
  3. पर्याप्त प्रयोगात्मक सत्यापन: विभिन्न परिदृश्यों में विधि की प्रभावशीलता सत्यापित की गई है
  4. महत्वपूर्ण प्रदर्शन सुधार: मौजूदा विधियों की तुलना में स्पष्ट प्रदर्शन सुधार

कमियाँ

  1. बड़ी गणना ओवरहेड: पुनरावृत्तिमूलक एल्गोरिदम की गणना लागत व्यावहारिक अनुप्रयोग के लिए बाधा है
  2. एल्गोरिदम अभिसरण की कमी: सैद्धांतिक विश्लेषण अधूरा है
  3. अनुप्रयोग सीमा: विधि संरचनात्मक बाधाओं की उचितता के लिए आवश्यकताएँ रखती है

प्रभाव

  1. शैक्षणिक मूल्य: डेटा-संचालित संरचित नियंत्रण के लिए नई सैद्धांतिक रूपरेखा प्रदान करता है
  2. व्यावहारिक मूल्य: नेटवर्क नियंत्रण प्रणालियों में महत्वपूर्ण अनुप्रयोग संभावना
  3. पुनरुत्पादनीयता: एल्गोरिदम विवरण स्पष्ट है, पुनरुत्पादन के लिए सुविधाजनक

लागू परिदृश्य

  • बड़े पैमाने की नेटवर्क नियंत्रण प्रणालियाँ
  • संचार-सीमित वितरित नियंत्रण
  • प्रणाली मॉडल अज्ञात लेकिन ऐतिहासिक डेटा उपलब्ध परिदृश्य
  • नियंत्रण प्रदर्शन के लिए उच्च आवश्यकताओं वाले अनुप्रयोग

संदर्भ

पेपर में 42 संबंधित संदर्भ उद्धृत किए गए हैं, जो संरचित नियंत्रण, डेटा-संचालित नियंत्रण, मजबूत नियंत्रण और अन्य कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हैं, जो अनुसंधान के लिए ठोस सैद्धांतिक आधार प्रदान करते हैं।