Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic
التثبيت المدفوع بالبيانات باستخدام المعرفة المسبقة حول قابلية التثبيت والتحكم
تتناول هذه الورقة مشكلة التثبيت المدفوع بالبيانات للأنظمة الخطية الثابتة زمنياً باستخدام الخصائص النظرية للنظام (وخاصة قابلية التثبيت والتحكم) كمعرفة مسبقة. يوسّع المؤلفون مفهوم المعلوماتية البيانية، مما يتطلب وجود متحكم قادر على تثبيت جميع الأنظمة المتوافقة مع البيانات والمعرفة المسبقة. تُظهر الدراسة أن: (1) إذا كان النظام قابلاً للتحكم، فإن استخدام هذه المعرفة المسبقة لا يخفف من شروط التثبيت المدفوع بالبيانات؛ (2) إذا كان النظام قابلاً للتثبيت، فإن استخدام هذه المعرفة المسبقة يوفر شروطاً كافية وضرورية أضعف من تلك الخالية من المعرفة المسبقة. بعبارة أخرى، إذا كان النظام الأساسي معروفاً أنه قابل للتثبيت، فإن التثبيت المدفوع بالبيانات يصبح أسهل في التحقيق. تقدم الورقة أيضاً طريقة جديدة لتصميم التحكم المدفوع بالبيانات بناءً على عدم المساواة المصفوفية الخطية (LMI).
تسعى هذه الورقة إلى حل المشكلة التالية: كيفية تصميم متحكم تثبيت في ظروف البيانات المحدودة، مع دمج المعرفة المسبقة حول قابلية التثبيت أو التحكم في النظام؟
يفترض التحكم المدفوع بالبيانات التقليدي أن معاملات النظام غير معروفة تماماً، لكن هذا الافتراض محافظ جداً بالنسبة لمعظم الأنظمة الفيزيائية. في الواقع، غالباً ما نمتلك بعض المعرفة المسبقة (مثل نطاقات الكميات الفيزيائية كالكتلة وثابت الزنبرك، أو قابلية التحكم/التثبيت التي يمكن استنتاجها من بنية النظام).
تقليل متطلبات البيانات: قد يتطلب التصميم المباشر للمتحكم من البيانات كمية كبيرة من البيانات لتلبية شروط الإثارة المستمرة، لكن دمج المعرفة المسبقة قد يحقق التثبيت ببيانات أقل
الجدوى العملية: في بعض الحالات، لا يمكن تصميم متحكم تثبيت من البيانات وحدها (مثل البيانات الحالية ناقصة الرتبة)، لكن إضافة المعرفة المسبقة قد تجعل التصميم ممكناً
الاكتمال النظري: خصائص النظام النظرية (القابلية للتحكم والتثبيت) هي مفاهيم أساسية في نظرية التحكم، لكنها لم تُدرس بشكل كافٍ في إطار العمل المدفوع بالبيانات
التحكم المدفوع بالبيانات: تركز الأعمال الموجودة (مثل De Persis & Tesi 2019, van Waarde et al. 2020) بشكل أساسي على حالات عدم وجود معرفة مسبقة، وتتطلب استيفاء شروط بيانات صارمة (مثل الإثارة المستمرة، بيانات الحالة ذات الرتبة الكاملة)
دمج المعرفة المسبقة: تقتصر الأبحاث الموجودة على قيود حدود المعاملات 12-14 أو معاملات معروفة جزئياً 15، ولا تتناول خصائص النظام النظرية
تحدي عدم التحدب: مجموعات الأنظمة القابلة للتثبيت والتحكم غير محدبة، بخلاف الأعمال الموجودة التي تتناول مجموعات أنظمة محدبة
في العديد من التطبيقات العملية، يمكن استنتاج قابلية التحكم أو التثبيت من بنية النظام (نظرية القابلية للتحكم الهيكلية)، لكن هذه الأنواع من المعرفة المسبقة لم تُستخدم بعد في التحكم المدفوع بالبيانات. تملأ هذه الورقة هذا الفراغ النظري.
توسيع الإطار النظري: توسيع مفهوم المعلوماتية البيانية (data informativity) ليشمل المعرفة المسبقة، مع تقديم تعريف Σ_pk-informativity (التعريف 3)
نظرية التكافؤ للمعرفة المسبقة حول قابلية التحكم (النظرية 5): تثبت أن استخدام قابلية التحكم كمعرفة مسبقة يكافئ حالة عدم وجود معرفة مسبقة، أي أن المعرفة المسبقة حول قابلية التحكم لا تخفف من شروط البيانات
نظريات الميزة للمعرفة المسبقة حول قابلية التثبيت (النظريات 14، 15):
عندما تكون بيانات الحالة ذات رتبة كاملة (rank X⁻ = n)، لا توفر المعرفة المسبقة حول قابلية التثبيت مساعدة إضافية
عندما تكون بيانات الحالة ناقصة الرتبة (rank X⁻ < n)، تخفف المعرفة المسبقة حول قابلية التثبيت الشروط بشكل كبير، مما يوفر شروطاً كافية وضرورية
طريقة تصميم قابلة للحساب (الاقتراح 16): توفر طريقة حساب متحكم التثبيت بناءً على LMI، يمكن حلها مباشرة من البيانات Σ_stab-informative
الرؤى النظرية: تكشف عن ظاهرة تبدو متناقضة - خاصية أقوى (قابلية التحكم) لا تساعد في تخفيف الشروط، بينما خاصية أضعف (قابلية التثبيت) يمكنها ذلك، وذلك لأنه في بعض الحالات جميع الأنظمة المتوافقة مع البيانات غير قابلة للتحكم
التعريف 3 (Σ_pk-informativity للتثبيت):
تُسمى البيانات D بـ Σ_pk-informative للتثبيت، إذا كان هناك K∈ℝᵐˣⁿ بحيث يكون A+BK مستقراً Schur لجميع (A,B)∈Σ_D∩Σ_pk.
النظرية 5 (النتيجة الأساسية): بافتراض (A_true, B_true)∈Σ_cont، يكون ما يلي متكافئاً:
(a) البيانات D هي Σ_cont-informative للتثبيت
(b) البيانات D هي informative للتثبيت (بدون معرفة مسبقة)
فكرة الإثبات:
(b)⇒(a) واضح
(a)⇒(b) المفتاح:
إذا كان Σ_D⊆Σ_cont، فالنتيجة واضحة
إذا كان هناك نظام غير قابل للتحكم (Ā,B̄)∈Σ_D، استخدم اللمة 7 (قابلية التحكم البارامترية في جميع النقاط تقريباً) واللمة 9 (استقرار حزمة المصفوفات) لإثبات أن مكسب التثبيت K يثبت أيضاً (Ā,B̄)
اللمات الرئيسية:
اللمة 7: إذا كان (M,N) قابلاً للتحكم، فإن (M+αM₀, N+αN₀) قابل للتحكم لجميع α باستثناء n² قيمة على الأكثر
اللمة 9: إذا كان M+δN مستقراً Schur لجميع δ∈[ε,∞)\F (F محدودة)، فإن N نيلبوتنت و M+δN مستقر Schur لجميع δ∈ℝ
إذا كانت البيانات Σ_stab-informative و K هو مكسب التثبيت، فإن:
(a) (A₀+B₀K)R(A,B) = {0} لجميع (A,B)∈Σ_D∩Σ_stab و (A₀,B₀)∈Σ⁰_D
(b) إذا كان rank X⁻ < n، فإن imX⁻;U⁻ = im X⁻ × ℝᵐ
(c) im X⁺ ⊆ im X⁻
(d) im X⁻ ثابتة بالنسبة لـ A وتحتوي على im B
ملاحظة 11: الشرط (a) هو نسخة مخففة من A₀+B₀K=0 في حالة عدم وجود معرفة مسبقة؛ الشروط (b)-(d) تُستوفى تلقائياً عندما يكون rank X⁻ = n، لكنها غير بديهية في حالة نقص الرتبة.
درس Jia et al. (2020) وآخرون استنتاج القابلية للتحكم من بنية النظام، يمكن اعتبار هذه الورقة جسراً لاستخدام هذه المعلومات الهيكلية في التحكم المدفوع بالبيانات.
عدم فعالية المعرفة المسبقة حول قابلية التحكم: إذا كان معروفاً أن النظام قابل للتحكم، فإن هذه المعرفة المسبقة لا تخفف من شروط التثبيت المدفوع بالبيانات (النظرية 5)
فعالية المعرفة المسبقة حول قابلية التثبيت:
عندما تكون بيانات الحالة ذات رتبة كاملة لا تساعد (النظرية 14)
عندما تكون بيانات الحالة ناقصة الرتبة تخفف الشروط بشكل كبير (النظرية 15)
ظاهرة مضادة للحدس: خاصية أقوى (قابلية التحكم) غير مفيدة، خاصية أضعف (قابلية التثبيت) مفيدة - السبب هو أن جميع الأنظمة المتوافقة مع البيانات قد تكون غير قابلة للتحكم
طريقة تصميم عملية: توفير طريقة حساب متحكم تثبيت قابلة للتطبيق بناءً على LMI (الاقتراح 16)
معالجة المعرفة المسبقة غير المحدبة: أول معالجة منهجية لمجموعات معرفة مسبقة غير محدبة (مجموعات الأنظمة القابلة للتثبيت/التحكم غير محدبة) في التحكم المدفوع بالبيانات، درجة صعوبة تقنية عالية
شروط كافية وضرورية: النظرية 15 توفر شروطاً كافية وضرورية لحالة نقص الرتبة، اكتمال نظري
نتائج مضادة للحدس: تكشف عن ظاهرة أن قابلية التحكم (خاصية أقوى) غير مفيدة لكن قابلية التثبيت (خاصية أضعف) مفيدة، توفر رؤى عميقة
3 H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, 2020. (العمل الأساسي لإطار عمل المعلوماتية البيانية)
4 C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, 2019. (أول طريقة LMI لتثبيت مدفوع بالبيانات)
12 J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, 2022. (معرفة مسبقة حول حدود المعاملات)
25 J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, 2020. (نظرية القابلية للتحكم الهيكلية)
27 H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, 2021. (نظرية التثبيت التربيعي)