2025-11-10T03:05:03.039858

Designing Control Barrier Functions Using a Dynamic Backup Policy

Freire, Nicotra
This paper presents a systematic approach to construct control barrier functions for nonlinear control affine systems subject to arbitrary state and input constraints. Taking inspiration from the reference governor literature, the proposed method defines a family of backup policies, parametrized by the equilibrium manifold of the system. The control barrier function is defined on the augmented state-and-reference space: given a state-reference pair, the approach quantifies the distance to constraint violation at any time in the future, should the current backup policy reference remain constant. Sensitivity analysis is then used to compute the (possibly nonsmooth) Jacobian with respect to the augmented state vector. To showcase its simple yet general nature, the proposed method is applied to an inverted pendulum on cart.
academic

تصميم دوال حاجز التحكم باستخدام سياسة نسخ احتياطي ديناميكية

المعلومات الأساسية

  • معرّف الورقة: 2510.09810
  • العنوان: تصميم دوال حاجز التحكم باستخدام سياسة نسخ احتياطي ديناميكية
  • المؤلفون: Victor Freire و Marco M. Nicotra (جامعة كولورادو، بولدر)
  • التصنيف: eess.SY cs.SY
  • وقت النشر: ورقة arXiv، أكتوبر 2025
  • رابط الورقة: https://arxiv.org/abs/2510.09810

الملخص

تقترح هذه الورقة منهجاً منظماً لبناء دوال حاجز التحكم للأنظمة الخطية التحكمية غير الخطية تحت قيود الحالة والمدخلات العشوائية. مستوحاة من أدبيات منظمات المراجع، تحدد الطريقة عائلة من السياسات الاحتياطية المعاملة بواسطة متعددات التوازن للنظام. يتم تعريف دالة حاجز التحكم في فضاء الحالة-المرجع المعزز: بالنظر إلى زوج الحالة-المرجع، تقيس الطريقة المسافة في أي وقت مستقبلي إلى انتهاك القيد عندما تبقى مرجعية السياسة الاحتياطية ثابتة. ثم يتم استخدام تحليل الحساسية لحساب مصفوفة جاكوبيان (المحتملة غير الملساء) فيما يتعلق بمتجه الحالة المعزز.

الخلفية البحثية والدافع

المشكلة الأساسية

دوال حاجز التحكم (CBFs) هي أدوات قوية لتصميم متحكمات الأنظمة الحرجة من حيث السلامة، لكن من الصعب توليفها بشكل منظم للأنظمة العامة تحت قيود الحالة والمدخلات العشوائية. على الرغم من أن التعريف الحديث لـ CBF قد تم تأسيسه في عام 2017، فإن تصميمه المنظم لا يزال مشكلة مفتوحة.

أهمية المشكلة

في العديد من التطبيقات، يضطر الممارسون إلى اعتماد دوال حاجز تحكم مرشحة لأنها أسهل في التصميم، وتحقق أداءً جيداً من خلال ضبط المعاملات ومتغيرات الاسترخاء، لكنها تفتقر إلى ضمانات السلامة الصارمة لـ CBF فعال.

قيود الطرق الموجودة

  1. طرق التعلم الآلي: تفتقر إلى الضمانات النظرية
  2. طرق مجموع المربعات: تنطبق فقط على الأنظمة متعددة الحدود
  3. طرق العرض الخبير: تعتمد على بيانات تدريب عالية الجودة
  4. طرق CBF الاحتياطية: تفتقر إلى طريقة منظمة لتصميم السياسات الاحتياطية

الدافع البحثي

أثبتت الأعمال السابقة للمؤلفين أن الحدود الأمان الديناميكية (DSMs) في فضاء الحالة-المرجع المعزز هي CBF، وتوسع هذه الورقة DSM المستند إلى المسار لبناء CBF، مما يوفر طريقة أكثر منهجية وعمومية.

المساهمات الأساسية

  1. طريقة منظمة لتصميم CBF: تقترح طريقة بناء DSM-CBF المستندة إلى التنبؤ بالمسار، قابلة للتطبيق على الأنظمة الخطية التحكمية غير الخطية ذات قيود الحالة والمدخلات العشوائية
  2. سياسة نسخ احتياطي ديناميكية: يتم تعريف السياسة الاحتياطية بواسطة متعددات التوازن للنظام، والمعاملة متغيرة بمرور الوقت، مما يوفر مرونة أكبر من السياسات الاحتياطية الثابتة
  3. ضمانات نظرية: تثبت الاستقرار المقارب لمصفوفة الحساسية الأساسية تحت افتراضات معتدلة، وتتعامل بصرامة مع المشاكل الناشئة عن عدم الملاسة المحتملة لـ CBF
  4. الاعتبارات العملية: تحل مشاكل الأفق الزمني المحدود والملاسة، وتقترح استراتيجيات أسهل في التنفيذ وتثبت كفايتها وجدواها

شرح الطريقة

تعريف المهمة

ضع في الاعتبار النظام الخطي التحكمي:

ẋ = f(x) + g(x)u

خاضع لقيود الحالة x ∈ X وقيود المدخلات u ∈ U، والهدف هو تصميم CBF لفرض رضا القيد.

الافتراضات الأساسية

الافتراض 3: يعترف النظام بمتعددة توازن معاملة بواسطة v ∈ ℝˡ، وتوجد دوال مستمرة x̄(v) و ū(v) بحيث:

f(x̄(v)) + g(x̄(v))ū(v) = 0, ∀v ∈ ℝˡ

وتوجد استراتيجية تحكم مستقرة مسبقاً π(x,v) بحيث x̄(v) هي نقطة توازن مستقرة بشكل مقارب.

بناء DSM-CBF المستند إلى المسار

1. تعريف الحد الأمان الديناميكي

Δ(x,v) = inf_{τ∈[0,∞)} c(Φ(τ,x,v), v)

حيث:

  • c(x,v) يصف قيد الحالة المعتمد على المرجع
  • Φ(τ,x,v) هو حل الديناميكا المستقرة مسبقاً

2. تحليل الحساسية

حساب مصفوفة جاكوبيان حساسية التدفق:

حساسية الحالة:

∂S_x(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_x(τ), S_x(0) = I_n

حساسية المرجع:

∂S_v(τ)/∂τ = (∂f_π(Φ(τ),v)/∂x)S_v(τ) + ∂f_π(Φ(τ),v)/∂v, S_v(0) = 0

3. تنفيذ الأفق الزمني المحدود

نظراً لأن الأفق الزمني غير المحدود غير قابل للتطبيق عددياً، يتم اعتماد أفق زمني محدود T وإدخال DSM نهائي:

Δ(x,v) = [min_{τ∈[0,T]} c(Φ(τ),v); Δ_T(Φ(T),v)]

نقاط الابتكار التقني

  1. عائلة السياسات الاحتياطية المعاملة: بخلاف السياسات الاحتياطية الثابتة، توفر المعاملة بواسطة متعددات التوازن عائلة كاملة من السياسات
  2. CBF في الفضاء المعزز: تعريف CBF في فضاء الحالة-المرجع المعزز، يتعامل بشكل طبيعي مع ديناميكا المرجع
  3. معالجة عدم الملاسة: استخدام مصفوفة جاكوبيان المعممة لـ Clarke للتعامل بصرامة مع عدم الملاسة المحتملة لـ CBF
  4. ضمان الجدوى: إثبات جدوى مرشح السلامة، u = π(x,v), w = 0 هو دائماً حل قابل للتطبيق

الإعداد التجريبي

نموذج النظام

نظام عربة البندول المقلوب:

M(q)q̈ + C(q,q̇)q̇ + G(q) = Bu

المعاملات:

  • كتلة العربة m_c = 1kg
  • كتلة البندول m_p = 0.5kg
  • طول البندول L = 0.7m

شروط القيد

  • قيود الحالة: |x| ≤ 4.5m, |θ-π| ≤ π/9
  • قيود المدخلات: |u| ≤ 20N

تصميم المتحكم

  • المتحكم المستقر مسبقاً: تصميم LQR، K_π = -0.44, 35.3, -1.4, 8.0
  • المتحكم الاسمي: K_κ = -35, 150, -20, 50
  • أفق التنبؤ: T = 10 ثوان
  • دالة من فئة K∞: α(c) = 100c (القيد)، α(c) = 400c (DSM النهائي)

طرق المقارنة

  1. التحكم الاسمي: استخدام المتحكم الاسمي فقط (غير آمن)
  2. DSM-CBF المستند إلى Lyapunov: طريقة DSM المستندة إلى دالة Lyapunov
  3. ERG: منظم المرجع الصريح
  4. CBF الاحتياطي: طريقة CBF الاحتياطية التقليدية

نتائج التجارب

النتائج الرئيسية

من نتائج المحاكاة يمكن ملاحظة:

  1. السلامة: تحافظ الطريقة المقترحة بنجاح على رضا جميع القيود، يبقى موضع العربة ضمن نطاق ±4.5m، ويبقى انحراف زاوية البندول ضمن نطاق ±20°
  2. مزايا الأداء:
    • مقارنة بـ DSM-CBF المستند إلى Lyapunov: تقارب أسرع، مسارات أكثر سلاسة
    • مقارنة بـ ERG: تحسن كبير في سرعة الاستجابة
    • مقارنة بـ CBF الاحتياطي التقليدي: أداء أفضل، يعود إلى الحرية الإضافية التي توفرها عائلة السياسات الاحتياطية المعاملة
  3. مدخلات التحكم: تبقى المدخلات دائماً ضمن قيد ±20N، وأكثر سلاسة مقارنة بالطرق الأخرى

تحليل الأداء

  • جودة المسار: تحقق الطريقة المقترحة انتقالاً سلساً من الموضع الأولي إلى الموضع المستهدف
  • رضا القيد: رضا صارم لجميع قيود الحالة والمدخلات
  • الخصائص التقاربية: تظهر خصائص تقارب أفضل مقارنة بطرق المقارنة

التحقق من مزايا الطريقة

تتحقق التجارب من التوقعات النظرية التالية:

  1. توفر عائلة السياسات الاحتياطية المعاملة أداءً أفضل من السياسات الاحتياطية الثابتة
  2. فعالية طريقة التنبؤ بالمسار في التعامل مع الأنظمة ذات الدرجة النسبية العالية والطور غير الأدنى
  3. العملية العملية لطريقة CBF في الفضاء المعزز

الأعمال ذات الصلة

طرق تصميم CBF

  1. طرق التعلم الآلي (Harms et al. 2024): استخدام التعلم الآلي لتصميم CBF
  2. طرق مجموع المربعات (Dai et al. 2024): تصميم CBF متعدد الحدود
  3. طرق العرض الخبير (Lindemann et al. 2024): تعلم CBF من العروض الآمنة

الأعمال ذات الصلة بـ CBF الاحتياطي

  1. Chen et al. (2021): اقتراح مفهوم CBF الاحتياطي
  2. Van Wijk et al. (2024): CBF احتياطي قوي ضد الاضطرابات
  3. Choi et al. (2021): دالة قيمة حاجز التحكم القوية

أدبيات منظمات المراجع

تستوحي طريقة هذه الورقة بشكل كبير من أدبيات منظمات المراجع، خاصة مفهوم الحدود الأمان الديناميكية، لكنها توسعها في إطار CBF.

الاستنتاجات والمناقشة

الاستنتاجات الرئيسية

  1. التصميم المنظم: توفر طريقة منظمة لبناء CBF فعال، قابل للتطبيق على الأنظمة غير الخطية ذات القيود العشوائية
  2. الضمانات النظرية: توفر تحليلاً نظرياً صارماً وضمانات جدوى تحت افتراضات معتدلة
  3. العملية: الطريقة بسيطة وسهلة التنفيذ، التعقيد الحسابي نسبياً منخفض

القيود

  1. الاعتماد على الافتراضات: يتطلب أن يعترف النظام بمتعددة توازن وأن يكون بإمكان تصميم متحكم مستقر مسبقاً
  2. التعقيد الحسابي: على الرغم من أنه أقل من MPC، لا يزال يتطلب التنبؤ بالمسار وحساب الحساسية
  3. ضبط المعاملات: تتطلب دوال من فئة K∞ والأفق الزمني للتنبؤ اختياراً مناسباً

الاتجاهات المستقبلية

  1. دراسات الثبات: دراسة خصائص الثبات تحت الاضطرابات المحدودة
  2. تقنيات تنبؤ مختلفة: استكشاف تقنيات تنبؤ مسار أخرى
  3. تحسين حسابي: طرق لتقليل التعقيد الحسابي بشكل أكبر

التقييم المتعمق

المزايا

  1. الصرامة النظرية: توفر تحليلاً نظرياً شاملاً، بما في ذلك إثباتات الوجود والجدوى والتقارب
  2. عمومية الطريقة: قابلة للتطبيق على نطاق واسع من الأنظمة الخطية التحكمية غير الخطية
  3. بساطة التنفيذ: التعقيد الحسابي نسبياً منخفض مقارنة بطرق مثل MPC
  4. معالجة التعقيد: قادرة على التعامل مع التشبع في المدخلات والقيود المتعددة والخطية غير الخطية الشديدة

أوجه القصور

  1. تقييد الافتراضات: قد يحد افتراض متعددة التوازن من نطاق تطبيق الطريقة
  2. حساسية المعاملات: قد تكون أداء الطريقة حساسة نسبياً لاختيار المعاملات
  3. نطاق التجارب: تم التحقق فقط على نظام واحد، يفتقر إلى التحقق التجريبي الأوسع

التأثير

  1. المساهمة الأكاديمية: توفر إطار نظري جديد وطريقة عملية لتصميم CBF
  2. القيمة العملية: الطريقة نسبياً بسيطة، من المتوقع أن تطبق في الأنظمة الفعلية
  3. قابلية إعادة الإنتاج: يوفر المؤلفون كوداً مفتوح المصدر، مما يعزز قابلية إعادة الإنتاج

السيناريوهات المطبقة

  1. الأنظمة الحرجة من حيث السلامة: مثل الروبوتات والمركبات ذاتية القيادة وغيرها من الأنظمة التي تتطلب رضا قيد صارم
  2. الأنظمة غير الخطية: مناسبة بشكل خاص للأنظمة غير الخطية ذات القيود المعقدة
  3. التحكم في الوقت الفعلي: التعقيد الحسابي الأقل مقارنة بـ MPC، مناسب للتطبيقات في الوقت الفعلي

المراجع

تستشهد الورقة بالأعمال الرئيسية في هذا المجال، بما في ذلك:

  • Ames et al. (2017): التعريف الحديث لـ CBF
  • Chen et al. (2021): مفهوم CBF الاحتياطي
  • Nicotra and Garone (2018): منظم المرجع الصريح
  • الأعمال السابقة للمؤلفين: الأساس النظري لـ DSM-CBF

التقييم الشامل: هذه ورقة عالية الجودة ذات صرامة نظرية وطريقة مبتكرة، توفر طريقة منظمة لتصميم CBF، وتحافظ على الصرامة النظرية مع امتلاك عملية جيدة. عمومية الطريقة والتنفيذ النسبي البسيط يمنحها قيمة عملية عالية.