We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.
- معرّف الورقة: 2407.18159
- العنوان: التحكم الأمثل في التخصيص والحركة في أسراب الاستمرارية ثنائية الفئة
- المؤلفون: Max Emerick, Stacy Patterson, Bassam Bamieh
- التصنيف: eess.SY (الأنظمة والتحكم)، cs.SY (الأنظمة والتحكم)، math.OC (التحسين والتحكم)
- تاريخ النشر/المؤتمر: تم التقديم في 24 يوليو 2024، تم التعديل في 10 أكتوبر 2025
- رابط الورقة: https://arxiv.org/abs/2407.18159
تتناول هذه الورقة مشكلة التحكم الأمثل في الأسراب التي تحتوي على فئتين مختلفتين من الوكلاء. يتم استخدام نموذج الاستمرارية المثالي للأسراب الكبيرة، حيث تصف الديناميكيات تطور كثافة التوزيع المكاني لكل فئة من الوكلاء. يستند نمذجة المشكلة إلى سيناريوهات تطبيقية حيث يجب تخصيص فئة واحدة من الوكلاء لفئة أخرى، يُشار إليها باسم وكلاء الطلب ووكلاء الموارد على التوالي. يرتبط تكلفة التخصيص بالمسافة بين الوكلاء المخصصين لبعضهم البعض، وتُقاس التكلفة الإجمالية للتخصيص من خلال مسافة Wasserstein بين كثافات الفئتين. عندما يمكن للوكلاء التحرك، يمكن تقليل تكلفة التخصيص، لكن هذا يتطلب تكاليف حركة فيزيائية، مما يؤسس مشكلة تحكم أمثل غير خطية وذات أبعاد لا نهائية. تُظهر الدراسة أنه في الحالة أحادية البعد، عند التعبير عن المشكلة باستخدام دوال الكميات لكثافات الوكلاء، يمكن تحويل المشكلة إلى مشكلة تتبع خطية تربيعية (LQ) ذات أبعاد لا نهائية ولكن منفصلة. يتم تقديم الحلول للحالة العامة أحادية البعد وكذلك الحالات الخاصة للطلب الثابت والمتغير الدوري.
مع تطور أجهزة الاستشعار والمعالجة والاتصالات منخفضة التكلفة، تُستخدم أسراب الروبوتات المستقلة على نطاق واسع في عدة مجالات منها الاستجابة للطوارئ والنقل واللوجستيات وجمع البيانات والدفاع. تتمتع الأسراب الكبيرة بمزايا كبيرة من حيث الكفاءة والمتانة، لكن مع زيادة حجم السرب، يصبح التخطيط الحركي والتنسيق بين الوكلاء أكثر صعوبة.
يستند الجزء الرياضي من نموذج الورقة إلى تطبيقات الحوسبة الطرفية والحوسبة السحابية المتنقلة:
- وكلاء الطلب: أجهزة خفيفة الوزن (مثل الطائرات بدون طيار المزودة بكاميرات)، بقدرات حوسبة وتخزين محدودة، لكن بقدرة حركة عالية
- وكلاء الموارد: أجهزة ثقيلة (مثل خوادم الحوسبة الطرفية المتنقلة)، بقدرات حوسبة قوية لكن بقدرة حركة منخفضة
- التطبيقات النموذجية: المراقبة بالفيديو في عمليات الإنقاذ من الكوارث، حيث يتولى وكلاء الطلب جمع البيانات ووكلاء الموارد معالجة البيانات
- تحديات الحجم: النمذجة التقليدية للوكلاء المنفصلين تتمتع بتعقيد حسابي مرتفع جداً في الأسراب الكبيرة
- مزايا الاستمرارية: نمذجة السرب كتوزيع كثافة يمكن أن تقلل بشكل كبير من تعقيد النموذج وتوفر رؤى حول السلوك الكلي
- الاقتران بين التخصيص والحركة: يتطلب تحسين التخصيص والحركة الفيزيائية في نفس الوقت، مع وجود مقايضة جوهرية
- الفراغ النظري: تفتقر الأبحاث الحالية إلى التحليل النظري المنهجي لمثل هذه المشاكل المقترنة
- نمذجة مشكلة جديدة: دمج المطابقة الديناميكية والتحكم الزمكاني لأول مرة، وإنشاء نموذج تحكم أمثل للسرب المستمر يحتوي على فئتين من الوكلاء
- اختراق التحويل الرياضي: اكتشاف أنه في الحالة أحادية البعد، يمكن تحويل المشكلة غير الخطية ذات الأبعاد اللا نهائية إلى مشكلة تتبع خطية تربيعية منفصلة
- بناء الحلول التحليلية: توفير حلول تحليلية صريحة للحالة العامة أحادية البعد، وهو أمر نادر جداً في مثل هذه المشاكل
- التحليل المتعمق للحالات الخاصة:
- الطلب الثابت: يتبع الحل خطوط Wasserstein الجيوديسية لكن الجدولة الزمنية يحددها مشكلة التحكم الأمثل
- الطلب الدوري: يمكن التعبير عن الحل كنسخة مفلترة من إشارة التتبع
- الرؤى النظرية: الكشف عن البنية الهندسية للحل الأمثل وطبيعة حدود الأداء
بالنظر إلى التوزيع الأولي للموارد R0 والتوزيع المتغير بالزمن للطلب Dt، حل على الفترة الزمنية [0,T]:
minR,V∫0T(W22(Rt,Dt)+α2∫Ω∥Vt(x)∥22Rt(x)dx)dt
مع القيود: ∂tRt(x)=−∇⋅(Rt(x)Vt(x))
حيث:
- W22(Rt,Dt): مربع مسافة Wasserstein من الدرجة الثانية، يقيس تكلفة التخصيص
- Vt(x): حقل السرعة (متغيرات التحكم)
- α>0: معامل المقايضة
- توزيع الطلب Dt(x): يحتوي على أجزاء مستمرة ومنفصلة
- توزيع الموارد Rt(x): يحتوي أيضاً على أجزاء مستمرة ومنفصلة
- خطة التخصيص Kt(x,y): توزيع ثنائي الأبعاد، يرضي قيود الهامش
- ديناميكيات الموارد: معادلة تفاضلية جزئية للاستمرارية
- الهدف الأداء: المقايضة بين تكلفة التخصيص وتكلفة الحركة
تحويل دالة الكمية: لكثافة أحادية البعد μ، يتم تعريف
- دالة التوزيع التراكمي: Fμ(x)=∫−∞xμ(ξ)dξ
- دالة الكمية: Qμ(z)=inf{x:Fμ(x)≥z}
اللمة الأساسية: في الحالة أحادية البعد، يمكن التعبير عن مسافة Wasserstein من الدرجة الثانية كـ
W22(μ,ν)=∫01(Qν(z)−Qμ(z))2dz
الديناميكيات الثنائية الخطية الأصلية:
∂tR(x,t)=−∂x(V(x,t)R(x,t))
ديناميكيات دالة الكمية المكافئة:
∂tQR(z,t)=U(z,t)
حيث U(z,t)=V(QR(z,t),t)
اكتشاف وجود خريطة إسومترية بين فضاء دالة الكمية L2 وفضاء الكثافة Wasserstein من الدرجة الثانية، مما يجعل مشكلة النقل الأمثل المعقدة تصبح مشكلة L2 بسيطة في فضاء دالة الكمية.
من خلال تقنية تقسيم مجموعات المستويات، يتم تحليل مشكلة التتبع الخطية التربيعية ذات الأبعاد اللا نهائية إلى عدد لا نهائي من مشاكل التتبع الخطية التربيعية العددية المستقلة:
minri,ui∫0T((ri(t)−di(t))2+α2ui2(t))dt
مع القيد: r˙i(t)=ui(t)
يتمتع التحكم الأمثل للمشكلة العددية ببنية تغذية راجعة وتغذية أمامية:
ui(t)=−α21(p(t)ri(t)+yi(t))
حيث:
- كسب التغذية الراجعة: p(t)=αtanh((T−t)/α)
- حد التغذية الأمامية: yi(t)=∫tTϕy(t,τ)di(τ)dτ
تعتمد الورقة بشكل أساسي على التحليل النظري والأمثلة الرقمية للتحقق من فعالية الطريقة، وليس على التقييم التجريبي واسع النطاق.
- توزيع الموارد: 11 وكيل منفصل بكتل غير متساوية
- توزيع الطلب: توزيع ثابت مستمر
- إعدادات المعاملات: α=2, T=10
- دالة الطلب: نموذج خليط غاوسي
D(x,t)=(1+sin(2πt))N(2.5,1)+(1−sin(2πt))N(7.5,1)
- تغيير المعاملات: α∈{0.08,1,>1}
- قيمة دالة التكلفة الأمثل
- تقارب المسار: درجة اقتراب توزيع الموارد من توزيع الطلب
- الخصائص الهندسية: التحقق مما إذا كان الحل يتبع خطوط Wasserstein الجيوديسية
- البنية الهندسية: المسار الأمثل في فضاء دالة الكمية عبارة عن خط مستقيم، يتوافق مع خط Wasserstein الجيوديسي في فضاء الكثافة
- الجدولة الزمنية: بخلاف معدل النقل الديناميكي الأمثل الكلاسيكي الثابت، يتم تحديد المعدل هنا بواسطة ϕr(t,0)
- تحليل التكلفة:
J=W22(R0,Dˉ)αtanh(T/α)+TW22(D,Dˉ)
- التفسير في المجال الترددي: يمكن تفسير الحل الأمثل كإشارة الطلب التي تمر عبر مرشح تمرير منخفض بتردد قطع 1/α
- استجابة الطور: بسبب حد التغذية الأمامية غير السببي، تكون الحالة متطابقة الطور تماماً مع إشارة المرجع
- الانتقائية الترددية: عندما يزداد α، يتتبع النظام بشكل أساسي المكونات منخفضة التردد للطلب
- حدود الأداء: يوجد حد أداء أساسي K، يعتمد فقط على معاملات المشكلة
- القابلية للوصول: يمثل Dˉ التوزيع الأقرب إلى D الذي يمكن الوصول إليه من الحالة الأولية R0
- آلية المقايضة: معامل α يتحكم بفعالية في المقايضة بين دقة التتبع وتكلفة الحركة
- صيغة Benamou-Brenier: حل ديناميكا السوائل الحسابية للنقل الأمثل الديناميكي
- الفرق: هذه الورقة تتعلق بمشكلة التحكم في التتبع، وليس مشكلة نقل الحالة
- التحكم في التغطية: طرق موزعة قائمة على رسوم Voronoi
- التحكم في الشكل: التحكم الهندسي لأنظمة متعددة الوكلاء
- الأنظمة ذاتية التفاعل: تطبيق نظرية المتوسط الميداني في التحكم في الأسراب
- المطابقة الزمكانية: خوارزميات التخصيص على الإنترنت في البيئات الديناميكية
- اتخاذ القرار الموزع: طرق التخصيص المركزية للمهام
- اختراق نظري: تحقيق الحل التحليلي لمشكلة التحكم الأمثل في السرب المستمر ثنائي الفئة لأول مرة
- الرؤى الهندسية: الكشف عن البنية الهندسية Wasserstein للحل الأمثل
- المزايا الحسابية: تحويل دالة الكمية يبسط بشكل كبير التعقيد الحسابي
- قيود الأبعاد: النتائج الحالية تنطبق فقط على الفضاء أحادي البعد
- السببية: يتطلب معرفة مسبقة بإشارة الطلب بالكامل، مما يحد من التطبيقات في الوقت الفعلي
- حفظ الكتلة: يفترض أن الكتلة الإجمالية ثابتة، قد تحتاج التطبيقات العملية إلى تخفيف هذا الافتراض
- التحكم المركزي: لم يتم النظر في قيود الاتصالات والحسابات للتنفيذ الموزع
- التعميم على أبعاد أعلى: توسيع النتائج إلى الفضاء ثنائي الأبعاد والثلاثي الأبعاد
- السببية: تطوير حلول سببية قائمة على التحكم التنبؤي بالنموذج
- النقل غير المتوازن: النظر في الحالات التي تتغير فيها الكتلة
- التنفيذ الموزع: تصميم خوارزميات موزعة فعالة من حيث الاتصالات
- الطرق الرقمية: تطوير حلول رقمية للحالات ذات الأبعاد الأعلى
- الابتكار النظري:
- تطبيق ذكي لتحويل دالة الكمية يحقق فك الاقتران للمشكلة المعقدة
- إنشاء ارتباط جديد بين النقل الأمثل والتحكم الأمثل
- توفير حلول تحليلية صريحة نادرة
- الصرامة الرياضية:
- الاشتقاق النظري الكامل والإثبات
- سلسلة تحويل المشكلة الواضحة
- معالجة صارمة للقيود
- عمق الرؤى:
- الكشف عن الطبيعة الهندسية للمشكلة
- توفير توصيف واضح لحدود الأداء
- إنشاء تفسير في المجال الترددي
- الصلة التطبيقية:
- نمذجة المشكلة قريبة من سيناريوهات التطبيق الفعلي
- توفير أساس نظري للمجالات الناشئة مثل الحوسبة الطرفية
- نطاق التطبيق محدود:
- مقتصر على الحالة أحادية البعد، التعميم على أبعاد أعلى غير بديهي
- يتطلب معرفة مسبقة بإشارة الطلب، مما يحد من الفائدة العملية
- التحقق التجريبي غير كافٍ:
- افتقار المقارنة مع طرق مرجعية فعلية
- أمثلة رقمية بحجم صغير
- عدم التحقق من كفاءة الحساب في السيناريوهات الكبيرة
- تفاصيل التنفيذ مفقودة:
- خطط التنفيذ الموزع غير واضحة
- تحليل التعقيد الاتصالي مفقود
- تحليل المتانة غير كافٍ
- المساهمة النظرية: توفير أدوات نظرية مهمة لمجال التحكم في الأسراب المستمرة
- القيمة المنهجية: قد تلهم تقنية تحويل دالة الكمية حل مشاكل أخرى ذات صلة
- الإمكانات التطبيقية: توفير أساس نظري للتحكم في أنظمة فعلية مثل أسراب الطائرات بدون طيار وأسراب الروبوتات
- الأبحاث اللاحقة: وضع أساس لأبحاث الحالات ذات الأبعاد الأعلى والخوارزميات في الوقت الفعلي
- النشر أحادي البعد: نشر الوكلاء على الطرق السريعة أو خطوط الحدود
- التخطيط غير المتصل: مشاكل التخطيط طويلة الأجل حيث تكون أنماط الطلب معروفة
- التحليل النظري: بمثابة معيار أداء لخوارزميات أكثر تعقيداً
- البحث التعليمي: البحث المتقاطع بين نظرية التحكم الأمثل ونظرية النقل الأمثل
تستشهد الورقة بـ 41 مرجعاً ذا صلة، تشمل بشكل أساسي:
- الأدبيات الكلاسيكية لنظرية النقل الأمثل (Santambrogio, Benamou-Brenier وغيرهم)
- الأعمال ذات الصلة بالتحكم في الأسراب (Fornasier, Bonnet وغيرهم)
- أدبيات أنظمة متعددة الوكلاء (Bandyopadhyaay, Krishnan وغيرهم)
- أدبيات تطبيقات الحوسبة الطرفية (He, Yang وغيرهم)
التقييم الشامل: هذه ورقة ذات مساهمة نظرية مهمة، حيث تحل مشكلة تحكم أمثل معقدة ذات أبعاد لا نهائية من خلال تحويل رياضي ذكي. على الرغم من وجود قيود في الأبعاد والفائدة العملية، إلا أنها توفر أساساً نظرياً مهماً لتطور المجالات ذات الصلة، وتتمتع بقيمة أكاديمية عالية وآفاق تطبيقية واعدة.