2025-11-24T03:04:18.080955

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

Emerick, Patterson, Bamieh
We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.
academic

दो-वर्गीय सातत्य्य झुंडों में इष्टतम असाइनमेंट और गति नियंत्रण

मूल जानकारी

  • पेपर आईडी: 2407.18159
  • शीर्षक: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
  • लेखक: Max Emerick, Stacy Patterson, Bassam Bamieh
  • वर्गीकरण: eess.SY (प्रणाली और नियंत्रण), cs.SY (प्रणाली और नियंत्रण), math.OC (अनुकूलन और नियंत्रण)
  • प्रकाशन समय/सम्मेलन: 24 जुलाई 2024 को प्रस्तुत, 10 अक्टूबर 2025 को संशोधित
  • पेपर लिंक: https://arxiv.org/abs/2407.18159

सारांश

यह पेपर दो विभिन्न वर्गों के एजेंटों वाली इष्टतम झुंड नियंत्रण समस्या का अध्ययन करता है। बड़े पैमाने पर झुंडों के सातत्य्य आदर्शीकरण का उपयोग किया जाता है, जहां गतिविज्ञान प्रत्येक वर्ग के एजेंटों के स्थानिक वितरण घनत्व के विकास का वर्णन करता है। समस्या का मॉडलिंग एक अनुप्रयोग परिदृश्य से प्रेरित है जहां एक वर्ग के एजेंटों को दूसरे वर्ग के एजेंटों को सौंपा जाना चाहिए, जिन्हें क्रमशः मांग एजेंट और संसाधन एजेंट कहा जाता है। असाइनमेंट लागत परस्पर असाइन किए गए एजेंटों के बीच की दूरी से संबंधित है, कुल असाइनमेंट लागत दोनों वर्गों के घनत्व के बीच Wasserstein दूरी द्वारा परिमाणित की जाती है। जब एजेंट चल सकते हैं, तो असाइनमेंट लागत को कम किया जा सकता है, लेकिन भौतिक गति की लागत का भुगतान करना पड़ता है, यह व्यापार एक अरैखिक अनंत-आयामी इष्टतम नियंत्रण समस्या स्थापित करता है। अनुसंधान से पता चलता है कि एक-आयामी स्थान में, जब एजेंट घनत्व के क्वांटाइल फ़ंक्शन द्वारा व्यक्त किया जाता है, तो समस्या को अनंत-आयामी लेकिन विघटित रैखिक द्विघात (LQ) ट्रैकिंग समस्या में परिवर्तित किया जा सकता है। सामान्य एक-आयामी स्थिति और स्थिर तथा आवधिक समय-परिवर्तनशील मांग के विशेष मामलों के समाधान दिए गए हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

कम लागत वाले संवेदन, प्रसंस्करण और संचार हार्डवेयर के विकास के साथ, स्वायत्त रोबोट झुंड आपातकालीन प्रतिक्रिया, परिवहन, लॉजिस्टिक्स, डेटा संग्रह और रक्षा सहित कई क्षेत्रों में व्यापक रूप से लागू होते हैं। बड़े पैमाने पर झुंड दक्षता और मजबूती के मामले में महत्वपूर्ण लाभ प्रदान करते हैं, लेकिन झुंड के आकार के बढ़ने के साथ, एजेंटों के बीच गति योजना और समन्वय तेजी से कठिन हो जाता है।

अनुप्रयोग परिदृश्य

पेपर का गणितीय मॉडल किनारे कंप्यूटिंग और मोबाइल क्लाउड कंप्यूटिंग अनुप्रयोगों से प्रेरित है:

  • मांग एजेंट: हल्के उपकरण (जैसे कैमरा से लैस ड्रोन), सीमित कंप्यूटिंग और भंडारण क्षमता लेकिन उच्च गतिशीलता
  • संसाधन एजेंट: भारी उपकरण (जैसे मोबाइल एज कंप्यूटिंग सर्वर), शक्तिशाली कंप्यूटिंग क्षमता लेकिन कम गतिशीलता
  • विशिष्ट अनुप्रयोग: आपदा राहत में वीडियो निगरानी, मांग एजेंट डेटा संग्रह के लिए जिम्मेदार, संसाधन एजेंट डेटा प्रसंस्करण के लिए जिम्मेदार

अनुसंधान प्रेरणा

  1. पैमाने की चुनौती: पारंपरिक असतत एजेंट मॉडलिंग बड़े पैमाने पर झुंडों में अत्यधिक कम्प्यूटेशनल जटिलता प्रदान करती है
  2. सातत्य्य लाभ: झुंड को घनत्व वितरण के रूप में मॉडल करना मॉडल जटिलता को काफी कम कर सकता है और मैक्रोस्कोपिक व्यवहार में अंतर्दृष्टि प्रदान करता है
  3. असाइनमेंट और गति युग्मन: कार्य असाइनमेंट और भौतिक गति दोनों को अनुकूलित करने की आवश्यकता है, मौलिक व्यापार-बंद संबंध मौजूद है
  4. सैद्धांतिक अंतराल: मौजूदा अनुसंधान में इस तरह की युग्मित समस्याओं के व्यवस्थित सैद्धांतिक विश्लेषण की कमी है

मुख्य योगदान

  1. नवीन समस्या मॉडलिंग: पहली बार गतिशील मिलान और स्पेस-टाइम नियंत्रण को जोड़ा, दो वर्गों के एजेंटों वाली सातत्य्य झुंड इष्टतम नियंत्रण मॉडल स्थापित किया
  2. गणितीय रूपांतरण सफलता: एक-आयामी स्थिति में, क्वांटाइल फ़ंक्शन रूपांतरण के माध्यम से अरैखिक अनंत-आयामी समस्या को विघटित रैखिक द्विघात ट्रैकिंग समस्या में परिवर्तित किया जा सकता है
  3. विश्लेषणात्मक समाधान निर्माण: सामान्य एक-आयामी स्थिति के लिए स्पष्ट विश्लेषणात्मक समाधान प्रदान किया, जो इस तरह की समस्याओं में अत्यंत दुर्लभ है
  4. विशेष मामलों का गहन विश्लेषण:
    • स्थिर मांग: समाधान Wasserstein जियोडेसिक का पालन करता है लेकिन समय अनुसूचन इष्टतम नियंत्रण समस्या द्वारा निर्धारित होता है
    • आवधिक मांग: समाधान को ट्रैकिंग सिग्नल के फ़िल्टर किए गए संस्करण के रूप में व्यक्त किया जा सकता है
  5. सैद्धांतिक अंतर्दृष्टि: इष्टतम समाधान की ज्यामितीय संरचना और प्रदर्शन सीमाओं की प्रकृति का खुलासा किया

विधि विवरण

कार्य परिभाषा

प्रारंभिक संसाधन वितरण R0R_0 और समय-परिवर्तनशील मांग वितरण DtD_t दिया गया है, समय अंतराल [0,T][0,T] पर हल करें: minR,V0T(W22(Rt,Dt)+α2ΩVt(x)22Rt(x)dx)dt\min_{R,V} \int_0^T \left( W_2^2(R_t, D_t) + \alpha^2 \int_\Omega \|V_t(x)\|_2^2 R_t(x) dx \right) dt बाधा शर्त: tRt(x)=(Rt(x)Vt(x))\partial_t R_t(x) = -\nabla \cdot (R_t(x)V_t(x))

जहां:

  • W22(Rt,Dt)W_2^2(R_t, D_t): 2-Wasserstein दूरी का वर्ग, असाइनमेंट लागत को परिमाणित करता है
  • Vt(x)V_t(x): वेग क्षेत्र (नियंत्रण चर)
  • α>0\alpha > 0: व्यापार-बंद पैरामीटर

मॉडल आर्किटेक्चर

1. पांच मुख्य घटक

  1. मांग वितरण Dt(x)D_t(x): निरंतर और असतत भाग दोनों शामिल
  2. संसाधन वितरण Rt(x)R_t(x): समान रूप से निरंतर और असतत भाग शामिल
  3. असाइनमेंट योजना Kt(x,y)K_t(x,y): द्वि-आयामी वितरण, सीमांत बाधाओं को संतुष्ट करता है
  4. संसाधन गतिविज्ञान: सातत्य्य आंशिक अवकल समीकरण
  5. प्रदर्शन उद्देश्य: असाइनमेंट लागत और गति लागत का व्यापार-बंद

2. मुख्य गणितीय रूपांतरण

क्वांटाइल फ़ंक्शन रूपांतरण: एक-आयामी घनत्व μ\mu के लिए, परिभाषित करें

  • संचयी वितरण फ़ंक्शन: Fμ(x)=xμ(ξ)dξF_\mu(x) = \int_{-\infty}^x \mu(\xi) d\xi
  • क्वांटाइल फ़ंक्शन: Qμ(z)=inf{x:Fμ(x)z}Q_\mu(z) = \inf\{x : F_\mu(x) \geq z\}

मुख्य लेम्मा: एक-आयामी स्थिति में, 2-Wasserstein दूरी को इस प्रकार व्यक्त किया जा सकता है W22(μ,ν)=01(Qν(z)Qμ(z))2dzW_2^2(\mu, \nu) = \int_0^1 (Q_\nu(z) - Q_\mu(z))^2 dz

3. गतिविज्ञान रूपांतरण

मूल द्विरैखिक गतिविज्ञान: tR(x,t)=x(V(x,t)R(x,t))\partial_t R(x,t) = -\partial_x(V(x,t)R(x,t))

समतुल्य क्वांटाइल फ़ंक्शन गतिविज्ञान: tQR(z,t)=U(z,t)\partial_t Q_R(z,t) = U(z,t) जहां U(z,t)=V(QR(z,t),t)U(z,t) = V(Q_R(z,t), t)

तकनीकी नवाचार बिंदु

1. क्वांटाइल फ़ंक्शन स्पेस में समदूरी

L2L^2 क्वांटाइल फ़ंक्शन स्पेस और 2-Wasserstein घनत्व स्पेस के बीच समदूरी मानचित्र की खोज की, जो जटिल इष्टतम परिवहन समस्या को क्वांटाइल फ़ंक्शन स्पेस में सरल L2L^2 समस्या में बदल देता है।

2. अनंत-आयामी समस्या का विघटन

जल-स्तर विभाजन तकनीक के माध्यम से, अनंत-आयामी LQ ट्रैकिंग समस्या को अनंत स्वतंत्र अदिश LQ ट्रैकिंग समस्याओं में विघटित किया: minri,ui0T((ri(t)di(t))2+α2ui2(t))dt\min_{r_i,u_i} \int_0^T \left( (r_i(t) - d_i(t))^2 + \alpha^2 u_i^2(t) \right) dt बाधा: r˙i(t)=ui(t)\dot{r}_i(t) = u_i(t)

3. स्पष्ट समाधान निर्माण

अदिश समस्या का इष्टतम नियंत्रण प्रतिक्रिया-फीडफॉरवर्ड संरचना रखता है: ui(t)=1α2(p(t)ri(t)+yi(t))u_i(t) = -\frac{1}{\alpha^2}(p(t)r_i(t) + y_i(t))

जहां:

  • प्रतिक्रिया लाभ: p(t)=αtanh((Tt)/α)p(t) = \alpha \tanh((T-t)/\alpha)
  • फीडफॉरवर्ड पद: yi(t)=tTϕy(t,τ)di(τ)dτy_i(t) = \int_t^T \phi_y(t,\tau) d_i(\tau) d\tau

प्रायोगिक सेटअप

संख्यात्मक सत्यापन परिदृश्य

पेपर मुख्य रूप से सैद्धांतिक विश्लेषण और संख्यात्मक उदाहरणों के माध्यम से विधि की प्रभावशीलता को सत्यापित करता है, बड़े पैमाने पर प्रायोगिक मूल्यांकन के बजाय।

स्थिर मांग मामला

  • संसाधन वितरण: 11 असमान द्रव्यमान वाले असतत एजेंट
  • मांग वितरण: निरंतर स्थिर वितरण
  • पैरामीटर सेटिंग: α=2\alpha = 2, T=10T = 10

आवधिक मांग मामला

  • मांग फ़ंक्शन: गाऊसी मिश्रण मॉडल D(x,t)=(1+sin(2πt))N(2.5,1)+(1sin(2πt))N(7.5,1)D(x,t) = (1 + \sin(2\pi t))\mathcal{N}(2.5, 1) + (1 - \sin(2\pi t))\mathcal{N}(7.5, 1)
  • पैरामीटर भिन्नता: α{0.08,1,>1}\alpha \in \{0.08, 1, >1\}

मूल्यांकन मेट्रिक्स

  1. इष्टतम लागत फ़ंक्शन मान
  2. प्रक्षेपवक्र अभिसरण: संसाधन वितरण की मांग वितरण की ओर सन्निकटन की डिग्री
  3. ज्यामितीय विशेषताएं: यह सत्यापित करना कि क्या समाधान Wasserstein जियोडेसिक का पालन करता है

प्रायोगिक परिणाम

मुख्य परिणाम

स्थिर मांग स्थिति

  1. ज्यामितीय संरचना: इष्टतम प्रक्षेपवक्र क्वांटाइल फ़ंक्शन स्पेस में सीधी रेखा है, घनत्व स्पेस में Wasserstein जियोडेसिक के अनुरूप है
  2. समय अनुसूचन: शास्त्रीय गतिशील इष्टतम परिवहन के निरंतर दर के विपरीत, यहां दर ϕr(t,0)\phi_r(t,0) द्वारा निर्धारित होता है
  3. लागत विघटन: J=W22(R0,Dˉ)αtanh(T/α)+TW22(D,Dˉ)J = W_2^2(R_0, \bar{D}) \alpha \tanh(T/\alpha) + T W_2^2(D, \bar{D})

आवधिक मांग स्थिति

  1. आवृत्ति डोमेन व्याख्या: इष्टतम समाधान को कटऑफ आवृत्ति 1/α1/\alpha वाले कम-पास फ़िल्टर के माध्यम से मांग सिग्नल के रूप में व्याख्या किया जा सकता है
  2. चरण प्रतिक्रिया: गैर-कारणात्मक फीडफॉरवर्ड पद के कारण, स्थिति संदर्भ सिग्नल के साथ पूरी तरह से चरण में है
  3. आवृत्ति चयनात्मकता: जब α\alpha बढ़ता है, तो सिस्टम मुख्य रूप से मांग के निम्न-आवृत्ति घटकों को ट्रैक करता है

मुख्य निष्कर्ष

  1. प्रदर्शन सीमा: मौलिक प्रदर्शन निचली सीमा KK मौजूद है, जो केवल समस्या पैरामीटर पर निर्भर करती है
  2. पहुंच योग्यता: Dˉ\bar{D} प्रारंभिक स्थिति R0R_0 से पहुंचने योग्य DD के सबसे करीब वितरण का प्रतिनिधित्व करता है
  3. व्यापार-बंद तंत्र: α\alpha पैरामीटर ट्रैकिंग सटीकता और गति लागत के व्यापार-बंद को प्रभावी ढंग से नियंत्रित करता है

संबंधित कार्य

इष्टतम परिवहन सिद्धांत

  • Benamou-Brenier सूत्र: गतिशील इष्टतम परिवहन का कम्प्यूटेशनल द्रव गतिविज्ञान समाधान
  • अंतर: यह पेपर ट्रैकिंग नियंत्रण समस्या है, स्थिति स्थानांतरण समस्या नहीं

झुंड नियंत्रण

  • कवरेज नियंत्रण: Voronoi आरेख पर आधारित वितरित विधि
  • आकार नियंत्रण: बहु-एजेंट प्रणालियों की ज्यामितीय नियंत्रण
  • स्व-अंतःक्रिया प्रणाली: झुंड नियंत्रण में माध्य-क्षेत्र सिद्धांत

बहु-एजेंट असाइनमेंट

  • स्पेस-टाइम मिलान: गतिशील वातावरण में ऑनलाइन असाइनमेंट एल्गोरिदम
  • वितरित निर्णय: विकेंद्रीकृत कार्य असाइनमेंट विधि

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. सैद्धांतिक सफलता: पहली बार द्वि-वर्गीय सातत्य्य झुंड इष्टतम नियंत्रण समस्या का विश्लेषणात्मक समाधान प्राप्त किया
  2. ज्यामितीय अंतर्दृष्टि: इष्टतम समाधान की Wasserstein ज्यामितीय संरचना का खुलासा किया
  3. कम्प्यूटेशनल लाभ: क्वांटाइल फ़ंक्शन रूपांतरण ने कम्प्यूटेशनल जटिलता को काफी सरल बनाया

सीमाएं

  1. आयाम प्रतिबंध: वर्तमान परिणाम केवल एक-आयामी स्पेस पर लागू होते हैं
  2. कारणात्मकता: पूरे मांग सिग्नल को पहले से जानने की आवश्यकता है, वास्तविक समय अनुप्रयोगों को सीमित करता है
  3. द्रव्यमान संरक्षण: कुल द्रव्यमान स्थिर मानता है, व्यावहारिक अनुप्रयोगों में शिथिल करने की आवश्यकता हो सकती है
  4. केंद्रीकृत नियंत्रण: वितरित कार्यान्वयन के संचार और कम्प्यूटेशनल बाधाओं पर विचार नहीं किया

भविष्य की दिशाएं

  1. उच्च-आयामी सामान्यीकरण: द्वि-आयामी और त्रि-आयामी स्पेस तक विस्तार
  2. कारणात्मकीकरण: मॉडल पूर्वानुमानित नियंत्रण पर आधारित कारणात्मक समाधान विकसित करना
  3. गैर-संतुलन परिवहन: परिवर्तनशील द्रव्यमान वाली स्थितियों पर विचार करना
  4. वितरित कार्यान्वयन: संचार-कुशल वितरित एल्गोरिदम डिजाइन करना
  5. संख्यात्मक विधि: उच्च-आयामी स्थितियों के लिए संख्यात्मक समाधान विधि विकसित करना

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक नवाचार:
    • क्वांटाइल फ़ंक्शन रूपांतरण का चतुर अनुप्रयोग जटिल समस्या के विघटन को प्राप्त करता है
    • इष्टतम परिवहन और इष्टतम नियंत्रण के बीच नया संबंध स्थापित किया
    • दुर्लभ स्पष्ट विश्लेषणात्मक समाधान प्रदान किया
  2. गणितीय कठोरता:
    • पूर्ण सैद्धांतिक व्युत्पत्ति और प्रमाण
    • समस्या रूपांतरण श्रृंखला स्पष्ट है
    • कठोर बाधा हैंडलिंग
  3. अंतर्दृष्टि की गहराई:
    • समस्या की ज्यामितीय प्रकृति का खुलासा किया
    • प्रदर्शन सीमाओं का स्पष्ट लक्षण वर्णन प्रदान किया
    • आवृत्ति डोमेन व्याख्या स्थापित की
  4. अनुप्रयोग प्रासंगिकता:
    • समस्या मॉडलिंग वास्तविक अनुप्रयोग परिदृश्यों के करीब है
    • किनारे कंप्यूटिंग जैसे उभरते क्षेत्रों के लिए सैद्धांतिक आधार प्रदान करता है

कमियां

  1. सीमित प्रयोज्यता:
    • केवल एक-आयामी स्थिति तक सीमित, उच्च-आयामी सामान्यीकरण गैर-तुच्छ है
    • मांग सिग्नल को पहले से जानने की आवश्यकता है, व्यावहारिकता सीमित है
  2. अपर्याप्त प्रायोगिक सत्यापन:
    • वास्तविक बेंचमार्क विधियों के साथ तुलना की कमी
    • संख्यात्मक उदाहरण छोटे पैमाने पर हैं
    • बड़े पैमाने पर परिदृश्यों में कम्प्यूटेशनल दक्षता सत्यापित नहीं की गई
  3. कार्यान्वयन विवरण की कमी:
    • वितरित कार्यान्वयन योजना स्पष्ट नहीं है
    • संचार जटिलता विश्लेषण अनुपस्थित है
    • मजबूती विश्लेषण अपर्याप्त है

प्रभाव मूल्यांकन

  1. सैद्धांतिक योगदान: सातत्य्य झुंड नियंत्रण क्षेत्र के लिए महत्वपूर्ण सैद्धांतिक उपकरण प्रदान करता है
  2. पद्धति मूल्य: क्वांटाइल फ़ंक्शन रूपांतरण तकनीक अन्य संबंधित समस्याओं के समाधान को प्रेरित कर सकती है
  3. अनुप्रयोग संभावना: ड्रोन झुंड, रोबोट झुंड आदि वास्तविक प्रणालियों के लिए नियंत्रण सिद्धांत आधार प्रदान करता है
  4. अनुवर्ती अनुसंधान: उच्च-आयामी स्थितियों और वास्तविक समय एल्गोरिदम के अनुसंधान के लिए आधार स्थापित करता है

लागू परिदृश्य

  1. एक-आयामी तैनाती: राजमार्गों, सीमा रेखाओं के साथ एजेंट तैनाती
  2. ऑफलाइन योजना: मांग पैटर्न ज्ञात दीर्घकालीन योजना समस्याएं
  3. सैद्धांतिक विश्लेषण: अधिक जटिल एल्गोरिदम के प्रदर्शन बेंचमार्क के रूप में
  4. शिक्षण अनुसंधान: इष्टतम नियंत्रण और इष्टतम परिवहन सिद्धांत के अंतर-अनुशासनात्मक अनुसंधान

संदर्भ

पेपर 41 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं:

  • इष्टतम परिवहन सिद्धांत की शास्त्रीय साहित्य (Santambrogio, Benamou-Brenier आदि)
  • झुंड नियंत्रण संबंधित कार्य (Fornasier, Bonnet आदि)
  • बहु-एजेंट प्रणाली साहित्य (Bandyopadhyay, Krishnan आदि)
  • किनारे कंप्यूटिंग अनुप्रयोग साहित्य (He, Yang आदि)

समग्र मूल्यांकन: यह एक सैद्धांतिक रूप से महत्वपूर्ण योगदान वाला पेपर है, जो चतुर गणितीय रूपांतरण के माध्यम से एक चुनौतीपूर्ण अनंत-आयामी इष्टतम नियंत्रण समस्या को हल करता है। हालांकि आयाम और व्यावहारिकता के मामले में सीमाएं हैं, यह संबंधित क्षेत्रों के सैद्धांतिक विकास के लिए महत्वपूर्ण आधार प्रदान करता है, उच्च शैक्षणिक मूल्य और संभावित अनुप्रयोग संभावनाएं रखता है।