2025-11-17T05:46:12.770787

Data-Driven Structured Controller Design Using the Matrix S-Procedure

Yang, Zhong, Yang et al.
This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.
academic

ম্যাট্রিক্স এস-প্রসিডিউর ব্যবহার করে ডেটা-চালিত কাঠামোগত নিয়ন্ত্রক ডিজাইন

মৌলিক তথ্য

  • পত্র আইডি: 2503.14949
  • শিরোনাম: ম্যাট্রিক্স এস-প্রসিডিউর ব্যবহার করে ডেটা-চালিত কাঠামোগত নিয়ন্ত্রক ডিজাইন
  • লেখক: ঝাও হুয়া ইয়াং, ইউক্সিং ঝং, নাচুয়ান ইয়াং, জিয়াওক্সু লিউ, লিং শি
  • শ্রেণীবিভাগ: math.OC (গণিত অপ্টিমাইজেশন এবং নিয়ন্ত্রণ)
  • প্রকাশনার সময়: ২০২৫ সালের অক্টোবর ১৪ (অটোমেটিকা-তে প্রি-প্রিন্ট জমা দেওয়া)
  • পত্রের লিঙ্ক: https://arxiv.org/abs/2503.14949

সারসংক্ষেপ

এই পত্রটি বিচ্ছিন্ন সময় রৈখিক সময়-অপরিবর্তনীয় (LTI) সিস্টেমের জন্য ডেটা-চালিত সর্বোত্তম কাঠামোগত নিয়ন্ত্রক ডিজাইনের উপর দৃষ্টি নিবদ্ধ করে, যখন H2H_2 কর্মক্ষমতা এবং HH_\infty কর্মক্ষমতা বিবেচনা করে। তিনটি পরিস্থিতি নির্দিষ্টভাবে অধ্যয়ন করা হয়: (i) মডেল-ভিত্তিক কাঠামোগত নিয়ন্ত্রণ, (ii) ডেটা-চালিত অ-কাঠামোগত নিয়ন্ত্রণ, (iii) ডেটা-চালিত কাঠামোগত নিয়ন্ত্রণ। H2H_2 কর্মক্ষমতার জন্য, প্রধানত পরিস্থিতি (ii) এবং (iii) অধ্যয়ন করা হয়, কারণ পরিস্থিতি (i) ইতিমধ্যে সাহিত্যে ব্যাপকভাবে অধ্যয়ন করা হয়েছে। HH_\infty কর্মক্ষমতার জন্য, তিনটি পরিস্থিতি সবই বিবেচনা করা হয়। কাঠামোগত নিয়ন্ত্রণের জন্য, একটি রৈখিকীকরণ কৌশল প্রবর্তন করা হয়েছে যা মূল অ-উত্তল সমস্যাকে আধা-নির্দিষ্ট প্রোগ্রামিং (SDP) সমস্যায় রূপান্তরিত করে এবং এর উপর ভিত্তি করে পুনরাবৃত্তিমূলক রৈখিক ম্যাট্রিক্স অসমতা (ILMI) অ্যালগরিদম বিকশিত করা হয়েছে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

  1. নেটওয়ার্ক নিয়ন্ত্রণ সিস্টেমের চ্যালেঞ্জ: বড় আকারের নেটওয়ার্ক নিয়ন্ত্রণ সিস্টেমে, কেন্দ্রীভূত নিয়ন্ত্রণ কৌশল বিশাল যোগাযোগ বোঝা নিয়ে আসে, তাই বিরল কাঠামো সহ নিয়ন্ত্রক ডিজাইন করার প্রয়োজন।
  2. কাঠামোগত নিয়ন্ত্রক ডিজাইনের অসুবিধা: কাঠামো সীমাবদ্ধতা সহ নিয়ন্ত্রক ডিজাইন NP-কঠিন জটিলতা রয়েছে, বিদ্যমান পদ্ধতিগুলি প্রধানত LMI-ভিত্তিক এবং গ্রেডিয়েন্ট-ভিত্তিক পদ্ধতিতে বিভক্ত।
  3. ডেটা-চালিত নিয়ন্ত্রণের প্রয়োজনীয়তা: বাস্তব প্রয়োগে, অনেক সিস্টেমের গতিশীলতা মডেল প্রায়শই পাওয়া যায় না, যা ডেটা-চালিত নিয়ন্ত্রণ গবেষণাকে উৎসাহিত করে।

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

  1. ঐতিহ্যবাহী পদ্ধতি পরিচিত মডেলের উপর নির্ভর করে: বিদ্যমান কাঠামোগত নিয়ন্ত্রক ডিজাইন পদ্ধতিগুলি সিস্টেম মডেল পরিচিত বলে ধরে নেয়।
  2. ডেটা-চালিত পদ্ধতির রক্ষণশীলতা: মিলার এবং অন্যদের 15 এর মতো বিদ্যমান ডেটা-চালিত পদ্ধতিগুলি নিম্নলিখিত সমস্যাগুলি উপস্থাপন করে:
    • তাৎক্ষণিক সীমাবদ্ধ শব্দকে অতিরিক্ত শক্তি-সীমাবদ্ধ শব্দ ক্রম হিসাবে অনুমান করে, অতিরিক্ত রক্ষণশীলতা প্রবর্তন করে
    • শুধুমাত্র অ-উত্তল সম্ভাব্য ডোমেনের উত্তল উপসেটের মধ্যে কাঠামোগত নিয়ন্ত্রক ডিজাইন করে
    • কর্মক্ষমতা একঘেয়েতা নিশ্চয়তার অভাব

মূল অবদান

  1. উন্নত ডেটা-চালিত কাঠামো:
    • সমস্ত সম্ভাব্য সিস্টেম ম্যাট্রিক্সের সেটকে প্রতিটি ডেটা পয়েন্ট সেটের ছেদ হিসাবে প্রতিনিধিত্ব করে, যা 15-এ সেটের চেয়ে ছোট
    • সমস্ত সম্ভাব্য সিস্টেম ম্যাট্রিক্স পরিচালনা করতে ম্যাট্রিক্স এস-প্রসিডিউর ব্যবহার করে, প্রমাণ করে যে সম্ভাব্য ডোমেন 15-এ সম্ভাব্য ডোমেন অন্তর্ভুক্ত করে
    • ডেটা দৈর্ঘ্যের সাথে সম্পর্কে কর্মক্ষমতার একঘেয়ে অ-হ্রাসমান প্রমাণ করে
  2. উপন্যাস রৈখিকীকরণ কৌশল:
    • মূল অ-উত্তল সমস্যাকে SDP সমস্যায় রূপান্তরিত করার জন্য রৈখিকীকরণ কৌশল বিকশিত করে
    • কাঠামোগত নিয়ন্ত্রক গণনা করতে ILMI অ্যালগরিদম প্রস্তাব করে
    • 15-এর চেয়ে বৃহত্তর সম্ভাব্য ডোমেন অন্বেষণ করতে পারে
  3. ব্যাপক HH_\infty নিয়ন্ত্রণ অধ্যয়ন:
    • প্রথমবারের মতো মডেল-ভিত্তিক কাঠামোগত নিয়ন্ত্রণ, ডেটা-চালিত অ-কাঠামোগত নিয়ন্ত্রণ এবং ডেটা-চালিত কাঠামোগত নিয়ন্ত্রণের ব্যাপক অধ্যয়ন পরিচালনা করে

পদ্ধতির বিস্তারিত বিবরণ

কাজের সংজ্ঞা

বিচ্ছিন্ন সময় LTI সিস্টেম বিবেচনা করুন:

x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k

যেখানে xkRnxx_k \in \mathbb{R}^{n_x} সিস্টেম অবস্থা, ukRnuu_k \in \mathbb{R}^{n_u} নিয়ন্ত্রণ ইনপুট, ykRnyy_k \in \mathbb{R}^{n_y} নিয়ন্ত্রণ আউটপুট, dkRndd_k \in \mathbb{R}^{n_d} বাহ্যিক ব্যাঘাত।

অবস্থা প্রতিক্রিয়া নিয়ন্ত্রক uk=Kxku_k = Kx_k ব্যবহার করুন, যেখানে KRnu×nxK \in \mathbb{R}^{n_u \times n_x} কাঠামো সীমাবদ্ধতা KSK \in S পূরণ করতে হবে।

ডেটা সংগ্রহ প্রক্রিয়া

ধরে নিন ম্যাট্রিক্স A,BA, B অজানা কিন্তু নির্ধারিত, ম্যাট্রিক্স C,D,G,HC, D, G, H পরিচিত। সংগৃহীত ডেটা অন্তর্ভুক্ত করে:

X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}

মূল অনুমান: প্রক্রিয়া শব্দ সীমাবদ্ধ, অর্থাৎ wk2ϵ\|w_k\|_2 \leq \epsilon

মূল প্রযুক্তিগত উদ্ভাবন

1. উন্নত সিস্টেম ম্যাট্রিক্স সেট প্রতিনিধিত্ব

ii-তম সময় ধাপের ডেটা (xi,ui,xi+1)(x_i, u_i, x_{i+1}) এর উপর ভিত্তি করে, সংজ্ঞায়িত করুন:

Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}

ডেটার সাথে সামঞ্জস্যপূর্ণ সমস্ত সিস্টেম ম্যাট্রিক্সের সেট:

Σ = ∩_{i=0}^{T-1} Σ_i

এটি 15-এ সেটের চেয়ে আরও নির্ভুল, রক্ষণশীলতা হ্রাস করে।

2. ম্যাট্রিক্স এস-প্রসিডিউরের প্রয়োগ

H2H_2 নিয়ন্ত্রণের জন্য, ম্যাট্রিক্স এস-প্রসিডিউর ব্যবহার করে, শর্ত (5a) সমস্ত (A,B)Σ(A,B) \in Σ এর জন্য সত্য হওয়ার জন্য যথেষ্ট শর্ত হল অ-নেতিবাচক α0,α1,...,αT1α_0, α_1, ..., α_{T-1} এবং β>0β > 0 বিদ্যমান থাকা যেমন:

P - GG^T - βI & 0 \\ 0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T \end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0$$ #### 3. রৈখিকীকরণ কৌশল কাঠামোগত নিয়ন্ত্রণের জন্য, মূল চ্যালেঞ্জ হল সীমাবদ্ধতা $Y ⪯ P^{-1}$ এর অ-উত্তলতা। প্রদত্ত বিন্দু $\tilde{P}$ এর কাছাকাছি $P^{-1}$ রৈখিকীকরণ করে: ``` Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1} ``` ### অ্যালগরিদম কাঠামো #### অ্যালগরিদম 1: অ-কাঠামোগত সর্বোত্তম নিয়ন্ত্রক ডিজাইন ``` ইনপুট: ডেটা X, U, শব্দ সীমা ε আউটপুট: নিয়ন্ত্রক K*, কর্মক্ষমতা সীমা γ* 1. সমস্যার ধরন অনুযায়ী সংশ্লিষ্ট SDP সমস্যা নির্বাচন করুন 2. SDP সমাধান করে L*, P*, γ* পান 3. K* = L*P*^{-1}, γ* ফেরত দিন ``` #### অ্যালগরিদম 2: কাঠামোগত সর্বোত্তম নিয়ন্ত্রক ডিজাইন ``` ইনপুট: ডেটা X, U, কাঠামো সীমাবদ্ধতা I_S আউটপুট: নিয়ন্ত্রক K*, কর্মক্ষমতা সীমা γ* 1. λ, μ, δ, ε, P_0 = I, k = 0 শুরু করুন 2. পুনরাবৃত্তি করুন: a. P̃ = P_k এবং λ দিয়ে SDP সমাধান করুন b. K_{k+1}, P_{k+1}, γ_{k+1} আপডেট করুন c. যদি λ < δ হয় তাহলে λ = μλ d. k = k + 1 3. সংমিশ্রণ পর্যন্ত 4. K_k, γ_k ফেরত দিন ``` ## পরীক্ষামূলক সেটআপ ### $H_2$ নিয়ন্ত্রণ কেস **সিস্টেম পরামিতি**: ``` A = [-0.4095 0.4036 -0.0874 0.5154 -0.0815 0.1069 1.6715 0.7718 -0.3376] B = [ 0 0 -0.6359 -0.1098 -0.0325 2.2795] কাঠামো সীমাবদ্ধতা: I_S = [1 1 0 0 1 1] ``` ### $H_\infty$ নিয়ন্ত্রণ কেস **সিস্টেম পরামিতি**: ``` A = [0.8 0.2 0.1 0.1 0.7 -0.3 -0.3 0.5 0.9] B = [1 0 0 1 1 1] কাঠামো সীমাবদ্ধতা: I_S = [1 1 0 1 1 0] ``` ### মূল্যায়ন মেট্রিক্স - $H_2$/$H_\infty$ কর্মক্ষমতা সীমা - গণনা সময় - বেঞ্চমার্ক পদ্ধতির সাথে কর্মক্ষমতা তুলনা ## পরীক্ষামূলক ফলাফল ### $H_2$ নিয়ন্ত্রণ ফলাফল #### বিভিন্ন শব্দ স্তরে কর্মক্ষমতা তুলনা (T=20) | ডিজাইন পদ্ধতি | (A,B) পরিচিত | ε=0.05 | ε=0.1 | ε=0.2 | |----------|-----------|--------|-------|-------| | অ-কাঠামোগত [15] | 2.1537 | 2.3448 | 3.0939 | 5.2814 | | অ-কাঠামোগত (এই পত্র) | 2.1537 | 2.2663 | 2.5660 | 2.7889 | | কাঠামোগত [15] | 2.9794 | 3.5494 | 4.6806 | 11.3186 | | কাঠামোগত (এই পত্র) | 2.7165 | 2.9154 | 3.2249 | 4.0422 | #### বিভিন্ন ডেটা দৈর্ঘ্যে কর্মক্ষমতা তুলনা (ε=0.1) | ডিজাইন পদ্ধতি | (A,B) পরিচিত | T=6 | T=10 | T=15 | |----------|-----------|-----|------|------| | অ-কাঠামোগত [15] | 2.1537 | 2.9911 | 2.8156 | 2.6836 | | অ-কাঠামোগত (এই পত্র) | 2.1537 | 2.7494 | 2.5645 | 2.4374 | | কাঠামোগত [15] | 2.9794 | 4.4036 | 4.4323 | 4.4456 | | কাঠামোগত (এই পত্র) | 2.7165 | 3.5249 | 3.2429 | 3.1485 | ### $H_\infty$ নিয়ন্ত্রণ ফলাফল #### বিভিন্ন শব্দ স্তরে কর্মক্ষমতা তুলনা (T=50) | ডিজাইন পদ্ধতি | (A,B) পরিচিত | ε=0.01 | ε=0.05 | ε=0.15 | |----------|-----------|--------|--------|--------| | অ-কাঠামোগত [15] | 0.7815 | 0.8035 | 0.9063 | 1.6483 | | অ-কাঠামোগত (এই পত্র) | 0.7815 | 0.7921 | 0.8207 | 1.0303 | | কাঠামোগত কর্ণ P | 3.7464 | 4.0950 | 6.6234 | অসম্ভব | | কাঠামোগত (এই পত্র) | 1.0580 | 1.0890 | 1.1826 | 1.5969 | ### প্রধান অনুসন্ধান 1. **কর্মক্ষমতা সুবিধা**: এই পত্রের পদ্ধতি সমস্ত পরীক্ষা পরিস্থিতিতে বেঞ্চমার্ক পদ্ধতি [15]-এর চেয়ে উল্লেখযোগ্যভাবে ভাল 2. **একঘেয়েতা**: এই পত্রের পদ্ধতি ডেটা দৈর্ঘ্য T এর সাথে কর্মক্ষমতা সীমা একঘেয়ে অ-বৃদ্ধিশীল নিশ্চিত করে, যখন [15] এই বৈশিষ্ট্য নেই 3. **গণনা খরচ**: পুনরাবৃত্তিমূলক প্রক্রিয়া এবং আরও অপ্টিমাইজেশন ভেরিয়েবলের কারণে, গণনা সময় কিছুটা বৃদ্ধি পায় ## সম্পর্কিত কাজ ### কাঠামোগত নিয়ন্ত্রক ডিজাইন - **LMI পদ্ধতি**: পলিয়াক এবং অন্যদের [2], ফার্ডাদ এবং অন্যদের [5] এর কাজ - **গ্রেডিয়েন্ট পদ্ধতি**: লিন এবং অন্যদের [3] এর বর্ধিত ল্যাগ্রেঞ্জ পদ্ধতি - **অভ্যন্তরীণ বিন্দু পদ্ধতি**: ইয়াং এবং অন্যদের [6] এর নতুন অ্যালগরিদম ### ডেটা-চালিত নিয়ন্ত্রণ - **মৌলিক তত্ত্ব**: উইলেমস এবং অন্যদের [7] এর মৌলিক লেম্মা - **শক্তিশালী স্থিতিশীলকরণ**: ডি পেরসিস এবং টেসি [8], বার্বেরিচ এবং অন্যদের [9] এর কাজ - **ম্যাট্রিক্স এস-লেম্মা প্রয়োগ**: ভ্যান ওয়ার্ড এবং অন্যদের [11], বিসফি এবং অন্যদের [12,13] এর গবেষণা ## উপসংহার এবং আলোচনা ### প্রধান উপসংহার 1. আরও নির্ভুল সিস্টেম ম্যাট্রিক্স সেট প্রতিনিধিত্ব প্রস্তাব করা হয়েছে, রক্ষণশীলতা হ্রাস করে 2. কাঠামো সীমাবদ্ধতা পরিচালনা করার জন্য কার্যকর রৈখিকীকরণ কৌশল বিকশিত করা হয়েছে 3. পদ্ধতির তাত্ত্বিক সুবিধা প্রমাণ করা হয়েছে এবং সংখ্যাসূচক পরীক্ষার মাধ্যমে যাচাই করা হয়েছে ### সীমাবদ্ধতা 1. **গণনা জটিলতা**: পুনরাবৃত্তিমূলক অ্যালগরিদম এবং অতিরিক্ত ভেরিয়েবল গণনা বোঝা বৃদ্ধি করে 2. **সংমিশ্রণ**: অ্যালগরিদম সংমিশ্রণের জন্য তাত্ত্বিক নিশ্চয়তা প্রদান করা হয়নি 3. **কাঠামো সীমাবদ্ধতা সীমাবদ্ধতা**: পদ্ধতির কার্যকারিতা যুক্তিসঙ্গত কাঠামো সীমাবদ্ধতার উপর নির্ভর করে ### ভবিষ্যত দিকনির্দেশনা 1. অ্যালগরিদম সংমিশ্রণের তাত্ত্বিক বিশ্লেষণ 2. গণনা দক্ষতার আরও অপ্টিমাইজেশন 3. আরও জটিল কাঠামো সীমাবদ্ধতার পরিচালনা ## গভীর মূল্যায়ন ### শক্তি 1. **দৃঢ় তাত্ত্বিক অবদান**: উন্নত সিস্টেম সেট প্রতিনিধিত্ব এবং ম্যাট্রিক্স এস-প্রসিডিউর প্রয়োগ তাত্ত্বিক মূল্য রয়েছে 2. **শক্তিশালী পদ্ধতি উদ্ভাবন**: রৈখিকীকরণ কৌশল চতুরভাবে অ-উত্তল সীমাবদ্ধতা পরিচালনা করে 3. **পর্যাপ্ত পরীক্ষামূলক যাচাইকরণ**: একাধিক পরিস্থিতিতে পদ্ধতির কার্যকারিতা যাচাই করা হয়েছে 4. **উল্লেখযোগ্য কর্মক্ষমতা উন্নতি**: বিদ্যমান পদ্ধতির তুলনায় স্পষ্ট কর্মক্ষমতা উন্নতি ### অপূর্ণতা 1. **বড় গণনা ওভারহেড**: পুনরাবৃত্তিমূলক অ্যালগরিদমের গণনা খরচ বাস্তব প্রয়োগের বাধা 2. **অ্যালগরিদম সংমিশ্রণ নিশ্চয়তার অভাব**: তাত্ত্বিক বিশ্লেষণ সম্পূর্ণ নয় 3. **প্রয়োগযোগ্যতার পরিধি সীমাবদ্ধ**: পদ্ধতি কাঠামো সীমাবদ্ধতার যুক্তিসঙ্গততার প্রয়োজন ### প্রভাব 1. **একাডেমিক মূল্য**: ডেটা-চালিত কাঠামোগত নিয়ন্ত্রণের জন্য নতুন তাত্ত্বিক কাঠামো প্রদান করে 2. **ব্যবহারিক মূল্য**: নেটওয়ার্ক নিয়ন্ত্রণ সিস্টেমে গুরুত্বপূর্ণ প্রয়োগ সম্ভাবনা 3. **পুনরুৎপাদনযোগ্যতা**: অ্যালগরিদম বর্ণনা স্পষ্ট, পুনরুৎপাদনের জন্য সুবিধাজনক ### প্রযোজ্য পরিস্থিতি - বড় আকারের নেটওয়ার্ক নিয়ন্ত্রণ সিস্টেম - যোগাযোগ-সীমাবদ্ধ বিতরণকৃত নিয়ন্ত্রণ - সিস্টেম মডেল অজানা কিন্তু ঐতিহাসিক ডেটা উপলব্ধ পরিস্থিতি - নিয়ন্ত্রণ কর্মক্ষমতার জন্য উচ্চ প্রয়োজনীয়তা সহ প্রয়োগ ## রেফারেন্স এই পত্রটি ৪২টি সম্পর্কিত রেফারেন্স উদ্ধৃত করে, যা কাঠামোগত নিয়ন্ত্রণ, ডেটা-চালিত নিয়ন্ত্রণ, শক্তিশালী নিয়ন্ত্রণ এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।