2025-11-17T05:46:12.770787

Data-Driven Structured Controller Design Using the Matrix S-Procedure

Yang, Zhong, Yang et al.

This paper focuses on the data-driven optimal structured controller design for discrete-time linear time-invariant (LTI) systems, considering both the $H_2$ performance and the $H_\infty$ performance. Specifically, we consider three scenarios: (i) the model-based structured control, (ii) the data-driven unstructured control, and (iii) the data-driven structured control. For the $H_2$ performance, we primarily investigate cases (ii) and (iii), since case (i) has been extensively studied in the literature. For the $H_\infty$ performance, all three scenarios are considered. For the structured control, we introduce a linearization technique that transforms the original nonconvex problem into a semidefinite programming (SDP) problem. Based on this transformation, we develop an iterative linear matrix inequality (ILMI) algorithm. For the data-driven control, we describe the set of all possible system matrices that can generate the sequence of collected data. Additionally, we propose a sufficient condition to handle all possible system matrices using the matrix S-procedure. The data-driven structured control is followed by combining the previous two cases. We compare our methods with those in the existing literature and demonstrate our superiority via several numerical simulations.

academic

تصميم المتحكم المهيكل المدفوع بالبيانات باستخدام إجراء المصفوفة S

المعلومات الأساسية

معرّف الورقة: 2503.14949
العنوان: Data-Driven Structured Controller Design Using the Matrix S-Procedure
المؤلفون: Zhaohua Yang, Yuxing Zhong, Nachuan Yang, Xiaoxu Lyu, Ling Shi
التصنيف: math.OC (تحسين وتحكم رياضي)
تاريخ النشر: 14 أكتوبر 2025 (نسخة أولية مقدمة إلى Automatica)
رابط الورقة: https://arxiv.org/abs/2503.14949

الملخص

تركز هذه الورقة على تصميم المتحكم المهيكل الأمثل المدفوع بالبيانات للأنظمة الخطية الثابتة زمنياً (LTI) في الوقت المنفصل، مع الأخذ في الاعتبار أداء $H_2$ و $H_\infty$ . يتم دراسة ثلاث حالات محددة: (i) التحكم المهيكل القائم على النموذج، (ii) التحكم غير المهيكل المدفوع بالبيانات، (iii) التحكم المهيكل المدفوع بالبيانات. بالنسبة لأداء $H_2$ ، يتم التركيز على الحالات (ii) و (iii) لأن الحالة (i) تمت دراستها على نطاق واسع في الأدبيات. بالنسبة لأداء $H_\infty$ ، يتم النظر في جميع الحالات الثلاث. بخصوص التحكم المهيكل، يتم تقديم تقنية خطية تحول المشكلة غير المحدبة الأصلية إلى مشكلة برمجة شبه محددة (SDP)، وتم تطوير خوارزمية عدم المساواة المصفوفية الخطية التكرارية (ILMI) بناءً على ذلك.

الخلفية البحثية والدافع

خلفية المشكلة

تحديات أنظمة التحكم الموزعة: في الأنظمة الموزعة الكبيرة، تؤدي استراتيجيات التحكم المركزية إلى عبء اتصالات هائل، مما يتطلب تصميم متحكمات ذات هيكل متناثر.
صعوبات تصميم المتحكم المهيكل: يتمتع تصميم المتحكم مع القيود الهيكلية بتعقيد NP-hard، والطرق الموجودة تنقسم بشكل أساسي إلى طرق قائمة على LMI وطرق قائمة على التدرج.
الحاجة إلى التحكم المدفوع بالبيانات: في التطبيقات العملية، غالباً ما يكون من المستحيل الحصول على نماذج الديناميكا للأنظمة، مما يحفز البحث في التحكم المدفوع بالبيانات.

قيود الطرق الموجودة

الطرق التقليدية تعتمد على نموذج معروف: تفترض طرق تصميم المتحكم المهيكل الموجودة أن نموذج النظام معروف.
محافظية الطرق المدفوعة بالبيانات: الطرق المدفوعة بالبيانات الموجودة مثل عمل Miller وآخرين 15 تعاني من:
- التقريب الزائد للضوضاء المحدودة لحظياً كتسلسل ضوضاء محدود الطاقة، مما يدخل محافظية إضافية
- تصميم المتحكم المهيكل فقط داخل مجموعة فرعية محدبة من المجال المجدي غير المحدب
- غياب ضمانات الرتابة في الأداء

المساهمات الأساسية

إطار عمل محسّن مدفوع بالبيانات:
- تمثيل مجموعة جميع مصفوفات النظام الممكنة كتقاطع مجموعات نقاط البيانات، وهي أصغر من المجموعة في 15
- استخدام إجراء المصفوفة S للتعامل مع جميع مصفوفات النظام الممكنة، مع إثبات أن المجال المجدي يحتوي على المجال المجدي في 15
- إثبات الرتابة غير المتناقصة للأداء بالنسبة لطول البيانات
تقنية خطية مبتكرة:
- تطوير تقنية خطية تحول المشكلة غير المحدبة الأصلية إلى مشكلة SDP
- اقتراح خوارزمية ILMI لحساب المتحكم المهيكل
- القدرة على استكشاف مجال مجدي أكبر من 15
دراسة شاملة للتحكم $H_\infty$ :
- أول دراسة شاملة للتحكم المهيكل القائم على النموذج والتحكم غير المهيكل المدفوع بالبيانات والتحكم المهيكل المدفوع بالبيانات

شرح الطريقة

تعريف المهمة

نظر في نظام LTI منفصل زمنياً:

x_{k+1} = Ax_k + Bu_k + Gd_k
y_k = Cx_k + Du_k + Hd_k

حيث $x_k \in \mathbb{R}^{n_x}$ هي حالة النظام، $u_k \in \mathbb{R}^{n_u}$ هي مدخل التحكم، $y_k \in \mathbb{R}^{n_y}$ هي مخرجات التحكم، $d_k \in \mathbb{R}^{n_d}$ هي الاضطرابات الخارجية.

استخدام متحكم ردود الفعل الحالة $u_k = Kx_k$ ، حيث يجب أن يفي $K \in \mathbb{R}^{n_u \times n_x}$ بالقيود الهيكلية $K \in S$ .

آلية جمع البيانات

افترض أن المصفوفات $A, B$ غير معروفة لكن محددة، والمصفوفات $C, D, G, H$ معروفة. تتضمن البيانات المجمعة:

X = [x_0, x_1, ..., x_T] ∈ ℝ^{n×(T+1)}
U = [u_0, u_1, ..., u_{T-1}] ∈ ℝ^{m×T}

الافتراض الرئيسي: ضوضاء العملية محدودة، أي $\|w_k\|_2 \leq \epsilon$ .

الابتكارات التقنية الأساسية

1. تمثيل محسّن لمجموعة مصفوفات النظام

بناءً على البيانات في الخطوة الزمنية $i$ وهي $(x_i, u_i, x_{i+1})$ ، يتم تعريف:

Σ_i = {(A,B) | x_{i+1} = Ax_i + Bu_i + w_i, w_i w_i^T ⪯ ε²I}

مجموعة جميع مصفوفات النظام المتسقة مع البيانات هي:

Σ = ∩_{i=0}^{T-1} Σ_i

هذا أكثر دقة من المجموعة في 15، مما يقلل المحافظية.

2. تطبيق إجراء المصفوفة S

بالنسبة للتحكم $H_2$ ، باستخدام إجراء المصفوفة S، الشرط الكافي لأن تكون الحالة (5a) صحيحة لجميع $(A,B) \in Σ$ هو وجود $α_0, α_1, ..., α_{T-1}$ و $β > 0$ غير سالبة بحيث:

$\begin{bmatrix} P - GG^T - βI & 0 \\ 0 & -\begin{bmatrix} I \\ K \end{bmatrix} P \begin{bmatrix} I \\ K \end{bmatrix}^T \end{bmatrix} - \sum_{i=0}^{T-1} α_i Ψ_i ⪰ 0$

3. تقنية الخطية

بالنسبة للتحكم المهيكل، التحدي الرئيسي هو عدم محدبية القيد $Y ⪯ P^{-1}$ . من خلال خطية $P^{-1}$ بالقرب من نقطة معينة $\tilde{P}$ :

Y ⪯ P̃^{-1} - P̃^{-1}(P - P̃)P̃^{-1}

إطار الخوارزمية

الخوارزمية 1: تصميم المتحكم الأمثل غير المهيكل

الإدخال: البيانات X, U، حد الضوضاء ε
الإخراج: المتحكم K*، حد الأداء γ*
1. اختر مشكلة SDP المناسبة بناءً على نوع المشكلة
2. حل SDP للحصول على L*, P*, γ*
3. أرجع K* = L*P*^{-1}, γ*

الخوارزمية 2: تصميم المتحكم الأمثل المهيكل

الإدخال: البيانات X, U، القيود الهيكلية I_S
الإخراج: المتحكم K*، حد الأداء γ*
1. هيّئ λ, μ, δ, ε, P_0 = I, k = 0
2. كرر:
   a. حل SDP باستخدام P̃ = P_k و λ
   b. حدّث K_{k+1}, P_{k+1}, γ_{k+1}
   c. إذا كان λ < δ فاجعل λ = μλ
   d. k = k + 1
3. حتى التقارب
4. أرجع K_k, γ_k

إعداد التجارب

حالة التحكم $H_2$

معاملات النظام:

A = [-0.4095  0.4036 -0.0874
      0.5154 -0.0815  0.1069
      1.6715  0.7718 -0.3376]

B = [ 0      0
     -0.6359 -0.1098
     -0.0325  2.2795]

القيود الهيكلية: I_S = [1 1 0
                         0 1 1]

حالة التحكم $H_\infty$

معاملات النظام:

A = [0.8  0.2  0.1
     0.1  0.7 -0.3
    -0.3  0.5  0.9]

B = [1 0
     0 1
     1 1]

القيود الهيكلية: I_S = [1 1 0
                         1 1 0]

مؤشرات التقييم

حدود أداء $H_2$ / $H_\infty$
وقت الحساب
مقارنة الأداء مع الطرق المرجعية

نتائج التجارب

نتائج التحكم $H_2$

مقارنة الأداء عند مستويات ضوضاء مختلفة (T=20)

طريقة التصميم	(A,B) معروفة	ε=0.05	ε=0.1	ε=0.2
غير مهيكل 15	2.1537	2.3448	3.0939	5.2814
غير مهيكل (هذه الورقة)	2.1537	2.2663	2.5660	2.7889
مهيكل 15	2.9794	3.5494	4.6806	11.3186
مهيكل (هذه الورقة)	2.7165	2.9154	3.2249	4.0422

مقارنة الأداء عند أطوال بيانات مختلفة (ε=0.1)

طريقة التصميم	(A,B) معروفة	T=6	T=10	T=15
غير مهيكل 15	2.1537	2.9911	2.8156	2.6836
غير مهيكل (هذه الورقة)	2.1537	2.7494	2.5645	2.4374
مهيكل 15	2.9794	4.4036	4.4323	4.4456
مهيكل (هذه الورقة)	2.7165	3.5249	3.2429	3.1485

نتائج التحكم $H_\infty$

مقارنة الأداء عند مستويات ضوضاء مختلفة (T=50)

طريقة التصميم	(A,B) معروفة	ε=0.01	ε=0.05	ε=0.15
غير مهيكل 15	0.7815	0.8035	0.9063	1.6483
غير مهيكل (هذه الورقة)	0.7815	0.7921	0.8207	1.0303
مهيكل قطري P	3.7464	4.0950	6.6234	غير مجدي
مهيكل (هذه الورقة)	1.0580	1.0890	1.1826	1.5969

الاكتشافات الرئيسية

المزايا في الأداء: تتفوق طريقة هذه الورقة بشكل كبير على الطريقة المرجعية 15 في جميع سيناريوهات الاختبار
الرتابة: تضمن طريقة هذه الورقة أن حد الأداء ينخفض بشكل رتيب مع طول البيانات T، بينما 15 لا تتمتع بهذه الخاصية
التكلفة الحسابية: نظراً للعملية التكرارية والمتغيرات الإضافية، يزداد وقت الحساب قليلاً

الأعمال ذات الصلة

تصميم المتحكم المهيكل

طرق LMI: أعمال Polyak وآخرين 2، Fardad وآخرين 5
طرق التدرج: طريقة لاغرانج المعززة لـ Lin وآخرين 3
طرق النقطة الداخلية: خوارزمية جديدة لـ Yang وآخرين 6

التحكم المدفوع بالبيانات

النظرية الأساسية: اللمة الأساسية لـ Willems وآخرين 7
التثبيت القوي: أعمال De Persis و Tesi 8، Berberich وآخرين 9
تطبيقات إجراء المصفوفة S: أبحاث van Waarde وآخرين 11، Bisoffi وآخرين 12,13

الخلاصة والمناقشة

الاستنتاجات الرئيسية

تم اقتراح تمثيل أكثر دقة لمجموعة مصفوفات النظام، مما يقلل المحافظية
تم تطوير تقنية خطية فعالة للتعامل مع القيود الهيكلية
تم إثبات المزايا النظرية للطريقة والتحقق منها من خلال التجارب الرقمية

القيود

التعقيد الحسابي: تزيد الخوارزمية التكرارية والمتغيرات الإضافية من العبء الحسابي
التقارب: لم يتم توفير ضمانات نظرية لتقارب الخوارزمية
قيود القيود الهيكلية: يعتمد فعالية الطريقة على القيود الهيكلية المعقولة

الاتجاهات المستقبلية

التحليل النظري لتقارب الخوارزمية
تحسين إضافي للكفاءة الحسابية
التعامل مع القيود الهيكلية الأكثر تعقيداً

التقييم المتعمق

المزايا

مساهمات نظرية متينة: تمثيل مجموعة النظام المحسّن وتطبيق إجراء المصفوفة S لهما قيمة نظرية
قوة الابتكار في الطريقة: تتعامل تقنية الخطية بذكاء مع القيود غير المحدبة
التحقق التجريبي الكافي: تم التحقق من فعالية الطريقة في سيناريوهات متعددة
تحسن الأداء الملحوظ: تحسن واضح مقارنة بالطرق الموجودة

أوجه القصور

النفقات الحسابية الكبيرة: تكلفة الخوارزمية التكرارية تشكل عائقاً أمام التطبيق العملي
نقص ضمانات تقارب الخوارزمية: التحليل النظري غير مكتمل
تقييد نطاق التطبيق: يعتمد فعالية الطريقة على معقولية القيود الهيكلية

التأثير

القيمة الأكاديمية: توفير إطار نظري جديد للتحكم المهيكل المدفوع بالبيانات
القيمة العملية: آفاق تطبيق مهمة في أنظمة التحكم الموزعة
قابلية إعادة الإنتاج: وصف واضح للخوارزمية يسهل إعادة الإنتاج

السيناريوهات المناسبة

أنظمة التحكم الموزعة الكبيرة
التحكم الموزع مع قيود الاتصالات
السيناريوهات التي يكون فيها نموذج النظام غير معروف لكن توجد بيانات تاريخية
التطبيقات التي تتطلب أداء تحكم عالية

المراجع

تستشهد الورقة بـ 42 مرجعاً ذا صلة، تغطي أعمالاً مهمة في مجالات التحكم المهيكل والتحكم المدفوع بالبيانات والتحكم القوي، مما يوفر أساساً نظرياً متيناً للبحث.