We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.
- पेपर आईडी: 2407.18159
- शीर्षक: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
- लेखक: Max Emerick, Stacy Patterson, Bassam Bamieh
- वर्गीकरण: eess.SY (प्रणाली और नियंत्रण), cs.SY (प्रणाली और नियंत्रण), math.OC (अनुकूलन और नियंत्रण)
- प्रकाशन समय/सम्मेलन: 24 जुलाई 2024 को प्रस्तुत, 10 अक्टूबर 2025 को संशोधित
- पेपर लिंक: https://arxiv.org/abs/2407.18159
यह पेपर दो विभिन्न वर्गों के एजेंटों वाली इष्टतम झुंड नियंत्रण समस्या का अध्ययन करता है। बड़े पैमाने पर झुंडों के सातत्य्य आदर्शीकरण का उपयोग किया जाता है, जहां गतिविज्ञान प्रत्येक वर्ग के एजेंटों के स्थानिक वितरण घनत्व के विकास का वर्णन करता है। समस्या का मॉडलिंग एक अनुप्रयोग परिदृश्य से प्रेरित है जहां एक वर्ग के एजेंटों को दूसरे वर्ग के एजेंटों को सौंपा जाना चाहिए, जिन्हें क्रमशः मांग एजेंट और संसाधन एजेंट कहा जाता है। असाइनमेंट लागत परस्पर असाइन किए गए एजेंटों के बीच की दूरी से संबंधित है, कुल असाइनमेंट लागत दोनों वर्गों के घनत्व के बीच Wasserstein दूरी द्वारा परिमाणित की जाती है। जब एजेंट चल सकते हैं, तो असाइनमेंट लागत को कम किया जा सकता है, लेकिन भौतिक गति की लागत का भुगतान करना पड़ता है, यह व्यापार एक अरैखिक अनंत-आयामी इष्टतम नियंत्रण समस्या स्थापित करता है। अनुसंधान से पता चलता है कि एक-आयामी स्थान में, जब एजेंट घनत्व के क्वांटाइल फ़ंक्शन द्वारा व्यक्त किया जाता है, तो समस्या को अनंत-आयामी लेकिन विघटित रैखिक द्विघात (LQ) ट्रैकिंग समस्या में परिवर्तित किया जा सकता है। सामान्य एक-आयामी स्थिति और स्थिर तथा आवधिक समय-परिवर्तनशील मांग के विशेष मामलों के समाधान दिए गए हैं।
कम लागत वाले संवेदन, प्रसंस्करण और संचार हार्डवेयर के विकास के साथ, स्वायत्त रोबोट झुंड आपातकालीन प्रतिक्रिया, परिवहन, लॉजिस्टिक्स, डेटा संग्रह और रक्षा सहित कई क्षेत्रों में व्यापक रूप से लागू होते हैं। बड़े पैमाने पर झुंड दक्षता और मजबूती के मामले में महत्वपूर्ण लाभ प्रदान करते हैं, लेकिन झुंड के आकार के बढ़ने के साथ, एजेंटों के बीच गति योजना और समन्वय तेजी से कठिन हो जाता है।
पेपर का गणितीय मॉडल किनारे कंप्यूटिंग और मोबाइल क्लाउड कंप्यूटिंग अनुप्रयोगों से प्रेरित है:
- मांग एजेंट: हल्के उपकरण (जैसे कैमरा से लैस ड्रोन), सीमित कंप्यूटिंग और भंडारण क्षमता लेकिन उच्च गतिशीलता
- संसाधन एजेंट: भारी उपकरण (जैसे मोबाइल एज कंप्यूटिंग सर्वर), शक्तिशाली कंप्यूटिंग क्षमता लेकिन कम गतिशीलता
- विशिष्ट अनुप्रयोग: आपदा राहत में वीडियो निगरानी, मांग एजेंट डेटा संग्रह के लिए जिम्मेदार, संसाधन एजेंट डेटा प्रसंस्करण के लिए जिम्मेदार
- पैमाने की चुनौती: पारंपरिक असतत एजेंट मॉडलिंग बड़े पैमाने पर झुंडों में अत्यधिक कम्प्यूटेशनल जटिलता प्रदान करती है
- सातत्य्य लाभ: झुंड को घनत्व वितरण के रूप में मॉडल करना मॉडल जटिलता को काफी कम कर सकता है और मैक्रोस्कोपिक व्यवहार में अंतर्दृष्टि प्रदान करता है
- असाइनमेंट और गति युग्मन: कार्य असाइनमेंट और भौतिक गति दोनों को अनुकूलित करने की आवश्यकता है, मौलिक व्यापार-बंद संबंध मौजूद है
- सैद्धांतिक अंतराल: मौजूदा अनुसंधान में इस तरह की युग्मित समस्याओं के व्यवस्थित सैद्धांतिक विश्लेषण की कमी है
- नवीन समस्या मॉडलिंग: पहली बार गतिशील मिलान और स्पेस-टाइम नियंत्रण को जोड़ा, दो वर्गों के एजेंटों वाली सातत्य्य झुंड इष्टतम नियंत्रण मॉडल स्थापित किया
- गणितीय रूपांतरण सफलता: एक-आयामी स्थिति में, क्वांटाइल फ़ंक्शन रूपांतरण के माध्यम से अरैखिक अनंत-आयामी समस्या को विघटित रैखिक द्विघात ट्रैकिंग समस्या में परिवर्तित किया जा सकता है
- विश्लेषणात्मक समाधान निर्माण: सामान्य एक-आयामी स्थिति के लिए स्पष्ट विश्लेषणात्मक समाधान प्रदान किया, जो इस तरह की समस्याओं में अत्यंत दुर्लभ है
- विशेष मामलों का गहन विश्लेषण:
- स्थिर मांग: समाधान Wasserstein जियोडेसिक का पालन करता है लेकिन समय अनुसूचन इष्टतम नियंत्रण समस्या द्वारा निर्धारित होता है
- आवधिक मांग: समाधान को ट्रैकिंग सिग्नल के फ़िल्टर किए गए संस्करण के रूप में व्यक्त किया जा सकता है
- सैद्धांतिक अंतर्दृष्टि: इष्टतम समाधान की ज्यामितीय संरचना और प्रदर्शन सीमाओं की प्रकृति का खुलासा किया
प्रारंभिक संसाधन वितरण R0 और समय-परिवर्तनशील मांग वितरण Dt दिया गया है, समय अंतराल [0,T] पर हल करें:
minR,V∫0T(W22(Rt,Dt)+α2∫Ω∥Vt(x)∥22Rt(x)dx)dt
बाधा शर्त: ∂tRt(x)=−∇⋅(Rt(x)Vt(x))
जहां:
- W22(Rt,Dt): 2-Wasserstein दूरी का वर्ग, असाइनमेंट लागत को परिमाणित करता है
- Vt(x): वेग क्षेत्र (नियंत्रण चर)
- α>0: व्यापार-बंद पैरामीटर
- मांग वितरण Dt(x): निरंतर और असतत भाग दोनों शामिल
- संसाधन वितरण Rt(x): समान रूप से निरंतर और असतत भाग शामिल
- असाइनमेंट योजना Kt(x,y): द्वि-आयामी वितरण, सीमांत बाधाओं को संतुष्ट करता है
- संसाधन गतिविज्ञान: सातत्य्य आंशिक अवकल समीकरण
- प्रदर्शन उद्देश्य: असाइनमेंट लागत और गति लागत का व्यापार-बंद
क्वांटाइल फ़ंक्शन रूपांतरण: एक-आयामी घनत्व μ के लिए, परिभाषित करें
- संचयी वितरण फ़ंक्शन: Fμ(x)=∫−∞xμ(ξ)dξ
- क्वांटाइल फ़ंक्शन: Qμ(z)=inf{x:Fμ(x)≥z}
मुख्य लेम्मा: एक-आयामी स्थिति में, 2-Wasserstein दूरी को इस प्रकार व्यक्त किया जा सकता है
W22(μ,ν)=∫01(Qν(z)−Qμ(z))2dz
मूल द्विरैखिक गतिविज्ञान:
∂tR(x,t)=−∂x(V(x,t)R(x,t))
समतुल्य क्वांटाइल फ़ंक्शन गतिविज्ञान:
∂tQR(z,t)=U(z,t)
जहां U(z,t)=V(QR(z,t),t)
L2 क्वांटाइल फ़ंक्शन स्पेस और 2-Wasserstein घनत्व स्पेस के बीच समदूरी मानचित्र की खोज की, जो जटिल इष्टतम परिवहन समस्या को क्वांटाइल फ़ंक्शन स्पेस में सरल L2 समस्या में बदल देता है।
जल-स्तर विभाजन तकनीक के माध्यम से, अनंत-आयामी LQ ट्रैकिंग समस्या को अनंत स्वतंत्र अदिश LQ ट्रैकिंग समस्याओं में विघटित किया:
minri,ui∫0T((ri(t)−di(t))2+α2ui2(t))dt
बाधा: r˙i(t)=ui(t)
अदिश समस्या का इष्टतम नियंत्रण प्रतिक्रिया-फीडफॉरवर्ड संरचना रखता है:
ui(t)=−α21(p(t)ri(t)+yi(t))
जहां:
- प्रतिक्रिया लाभ: p(t)=αtanh((T−t)/α)
- फीडफॉरवर्ड पद: yi(t)=∫tTϕy(t,τ)di(τ)dτ
पेपर मुख्य रूप से सैद्धांतिक विश्लेषण और संख्यात्मक उदाहरणों के माध्यम से विधि की प्रभावशीलता को सत्यापित करता है, बड़े पैमाने पर प्रायोगिक मूल्यांकन के बजाय।
- संसाधन वितरण: 11 असमान द्रव्यमान वाले असतत एजेंट
- मांग वितरण: निरंतर स्थिर वितरण
- पैरामीटर सेटिंग: α=2, T=10
- मांग फ़ंक्शन: गाऊसी मिश्रण मॉडल
D(x,t)=(1+sin(2πt))N(2.5,1)+(1−sin(2πt))N(7.5,1)
- पैरामीटर भिन्नता: α∈{0.08,1,>1}
- इष्टतम लागत फ़ंक्शन मान
- प्रक्षेपवक्र अभिसरण: संसाधन वितरण की मांग वितरण की ओर सन्निकटन की डिग्री
- ज्यामितीय विशेषताएं: यह सत्यापित करना कि क्या समाधान Wasserstein जियोडेसिक का पालन करता है
- ज्यामितीय संरचना: इष्टतम प्रक्षेपवक्र क्वांटाइल फ़ंक्शन स्पेस में सीधी रेखा है, घनत्व स्पेस में Wasserstein जियोडेसिक के अनुरूप है
- समय अनुसूचन: शास्त्रीय गतिशील इष्टतम परिवहन के निरंतर दर के विपरीत, यहां दर ϕr(t,0) द्वारा निर्धारित होता है
- लागत विघटन:
J=W22(R0,Dˉ)αtanh(T/α)+TW22(D,Dˉ)
- आवृत्ति डोमेन व्याख्या: इष्टतम समाधान को कटऑफ आवृत्ति 1/α वाले कम-पास फ़िल्टर के माध्यम से मांग सिग्नल के रूप में व्याख्या किया जा सकता है
- चरण प्रतिक्रिया: गैर-कारणात्मक फीडफॉरवर्ड पद के कारण, स्थिति संदर्भ सिग्नल के साथ पूरी तरह से चरण में है
- आवृत्ति चयनात्मकता: जब α बढ़ता है, तो सिस्टम मुख्य रूप से मांग के निम्न-आवृत्ति घटकों को ट्रैक करता है
- प्रदर्शन सीमा: मौलिक प्रदर्शन निचली सीमा K मौजूद है, जो केवल समस्या पैरामीटर पर निर्भर करती है
- पहुंच योग्यता: Dˉ प्रारंभिक स्थिति R0 से पहुंचने योग्य D के सबसे करीब वितरण का प्रतिनिधित्व करता है
- व्यापार-बंद तंत्र: α पैरामीटर ट्रैकिंग सटीकता और गति लागत के व्यापार-बंद को प्रभावी ढंग से नियंत्रित करता है
- Benamou-Brenier सूत्र: गतिशील इष्टतम परिवहन का कम्प्यूटेशनल द्रव गतिविज्ञान समाधान
- अंतर: यह पेपर ट्रैकिंग नियंत्रण समस्या है, स्थिति स्थानांतरण समस्या नहीं
- कवरेज नियंत्रण: Voronoi आरेख पर आधारित वितरित विधि
- आकार नियंत्रण: बहु-एजेंट प्रणालियों की ज्यामितीय नियंत्रण
- स्व-अंतःक्रिया प्रणाली: झुंड नियंत्रण में माध्य-क्षेत्र सिद्धांत
- स्पेस-टाइम मिलान: गतिशील वातावरण में ऑनलाइन असाइनमेंट एल्गोरिदम
- वितरित निर्णय: विकेंद्रीकृत कार्य असाइनमेंट विधि
- सैद्धांतिक सफलता: पहली बार द्वि-वर्गीय सातत्य्य झुंड इष्टतम नियंत्रण समस्या का विश्लेषणात्मक समाधान प्राप्त किया
- ज्यामितीय अंतर्दृष्टि: इष्टतम समाधान की Wasserstein ज्यामितीय संरचना का खुलासा किया
- कम्प्यूटेशनल लाभ: क्वांटाइल फ़ंक्शन रूपांतरण ने कम्प्यूटेशनल जटिलता को काफी सरल बनाया
- आयाम प्रतिबंध: वर्तमान परिणाम केवल एक-आयामी स्पेस पर लागू होते हैं
- कारणात्मकता: पूरे मांग सिग्नल को पहले से जानने की आवश्यकता है, वास्तविक समय अनुप्रयोगों को सीमित करता है
- द्रव्यमान संरक्षण: कुल द्रव्यमान स्थिर मानता है, व्यावहारिक अनुप्रयोगों में शिथिल करने की आवश्यकता हो सकती है
- केंद्रीकृत नियंत्रण: वितरित कार्यान्वयन के संचार और कम्प्यूटेशनल बाधाओं पर विचार नहीं किया
- उच्च-आयामी सामान्यीकरण: द्वि-आयामी और त्रि-आयामी स्पेस तक विस्तार
- कारणात्मकीकरण: मॉडल पूर्वानुमानित नियंत्रण पर आधारित कारणात्मक समाधान विकसित करना
- गैर-संतुलन परिवहन: परिवर्तनशील द्रव्यमान वाली स्थितियों पर विचार करना
- वितरित कार्यान्वयन: संचार-कुशल वितरित एल्गोरिदम डिजाइन करना
- संख्यात्मक विधि: उच्च-आयामी स्थितियों के लिए संख्यात्मक समाधान विधि विकसित करना
- सैद्धांतिक नवाचार:
- क्वांटाइल फ़ंक्शन रूपांतरण का चतुर अनुप्रयोग जटिल समस्या के विघटन को प्राप्त करता है
- इष्टतम परिवहन और इष्टतम नियंत्रण के बीच नया संबंध स्थापित किया
- दुर्लभ स्पष्ट विश्लेषणात्मक समाधान प्रदान किया
- गणितीय कठोरता:
- पूर्ण सैद्धांतिक व्युत्पत्ति और प्रमाण
- समस्या रूपांतरण श्रृंखला स्पष्ट है
- कठोर बाधा हैंडलिंग
- अंतर्दृष्टि की गहराई:
- समस्या की ज्यामितीय प्रकृति का खुलासा किया
- प्रदर्शन सीमाओं का स्पष्ट लक्षण वर्णन प्रदान किया
- आवृत्ति डोमेन व्याख्या स्थापित की
- अनुप्रयोग प्रासंगिकता:
- समस्या मॉडलिंग वास्तविक अनुप्रयोग परिदृश्यों के करीब है
- किनारे कंप्यूटिंग जैसे उभरते क्षेत्रों के लिए सैद्धांतिक आधार प्रदान करता है
- सीमित प्रयोज्यता:
- केवल एक-आयामी स्थिति तक सीमित, उच्च-आयामी सामान्यीकरण गैर-तुच्छ है
- मांग सिग्नल को पहले से जानने की आवश्यकता है, व्यावहारिकता सीमित है
- अपर्याप्त प्रायोगिक सत्यापन:
- वास्तविक बेंचमार्क विधियों के साथ तुलना की कमी
- संख्यात्मक उदाहरण छोटे पैमाने पर हैं
- बड़े पैमाने पर परिदृश्यों में कम्प्यूटेशनल दक्षता सत्यापित नहीं की गई
- कार्यान्वयन विवरण की कमी:
- वितरित कार्यान्वयन योजना स्पष्ट नहीं है
- संचार जटिलता विश्लेषण अनुपस्थित है
- मजबूती विश्लेषण अपर्याप्त है
- सैद्धांतिक योगदान: सातत्य्य झुंड नियंत्रण क्षेत्र के लिए महत्वपूर्ण सैद्धांतिक उपकरण प्रदान करता है
- पद्धति मूल्य: क्वांटाइल फ़ंक्शन रूपांतरण तकनीक अन्य संबंधित समस्याओं के समाधान को प्रेरित कर सकती है
- अनुप्रयोग संभावना: ड्रोन झुंड, रोबोट झुंड आदि वास्तविक प्रणालियों के लिए नियंत्रण सिद्धांत आधार प्रदान करता है
- अनुवर्ती अनुसंधान: उच्च-आयामी स्थितियों और वास्तविक समय एल्गोरिदम के अनुसंधान के लिए आधार स्थापित करता है
- एक-आयामी तैनाती: राजमार्गों, सीमा रेखाओं के साथ एजेंट तैनाती
- ऑफलाइन योजना: मांग पैटर्न ज्ञात दीर्घकालीन योजना समस्याएं
- सैद्धांतिक विश्लेषण: अधिक जटिल एल्गोरिदम के प्रदर्शन बेंचमार्क के रूप में
- शिक्षण अनुसंधान: इष्टतम नियंत्रण और इष्टतम परिवहन सिद्धांत के अंतर-अनुशासनात्मक अनुसंधान
पेपर 41 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं:
- इष्टतम परिवहन सिद्धांत की शास्त्रीय साहित्य (Santambrogio, Benamou-Brenier आदि)
- झुंड नियंत्रण संबंधित कार्य (Fornasier, Bonnet आदि)
- बहु-एजेंट प्रणाली साहित्य (Bandyopadhyay, Krishnan आदि)
- किनारे कंप्यूटिंग अनुप्रयोग साहित्य (He, Yang आदि)
समग्र मूल्यांकन: यह एक सैद्धांतिक रूप से महत्वपूर्ण योगदान वाला पेपर है, जो चतुर गणितीय रूपांतरण के माध्यम से एक चुनौतीपूर्ण अनंत-आयामी इष्टतम नियंत्रण समस्या को हल करता है। हालांकि आयाम और व्यावहारिकता के मामले में सीमाएं हैं, यह संबंधित क्षेत्रों के सैद्धांतिक विकास के लिए महत्वपूर्ण आधार प्रदान करता है, उच्च शैक्षणिक मूल्य और संभावित अनुप्रयोग संभावनाएं रखता है।