2025-11-24T03:04:18.080955

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

Emerick, Patterson, Bamieh

We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.

academic

Optimale Zuordnung und Bewegungssteuerung in Zwei-Klassen-Kontinuum-Schwärmen

Grundinformationen

Paper-ID: 2407.18159
Titel: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
Autoren: Max Emerick, Stacy Patterson, Bassam Bamieh
Klassifizierung: eess.SY (Systeme und Steuerung), cs.SY (Systeme und Steuerung), math.OC (Optimierung und Steuerung)
Einreichungs-/Veröffentlichungsdatum: Eingereicht am 24. Juli 2024, überarbeitet am 10. Oktober 2025
Paper-Link: https://arxiv.org/abs/2407.18159

Zusammenfassung

Dieses Paper untersucht das Problem der optimalen Schwarmsteuerung mit zwei verschiedenen Agenten-Klassen. Es wird ein Kontinuum-Idealisierungsmodell für großflächige Schwärme verwendet, wobei die Dynamik die Entwicklung der räumlichen Verteilungsdichte jeder Agenten-Klasse beschreibt. Die Problemmodellierung wird durch Anwendungsszenarien motiviert, in denen eine Agenten-Klasse einer anderen Agenten-Klasse zugeordnet werden muss, bezeichnet als Nachfrage-Agenten bzw. Ressourcen-Agenten. Die Zuordnungskosten hängen vom Abstand zwischen gegenseitig zugeordneten Agenten ab, und die Gesamtzuordnungskosten werden durch die Wasserstein-Distanz zwischen den Dichten der beiden Agenten-Klassen quantifiziert. Wenn Agenten sich bewegen können, können die Zuordnungskosten reduziert werden, erfordern aber physische Bewegungskosten. Dieser Kompromiss führt zu einem nichtlinearen unendlich-dimensionalen optimalen Steuerungsproblem. Die Forschung zeigt, dass im eindimensionalen Fall das Problem in ein unendlich-dimensionales, aber entkoppeltes lineares quadratisches (LQ) Verfolgungsproblem umgewandelt werden kann, wenn es durch Quantilfunktionen der Agenten-Dichten ausgedrückt wird. Es werden Lösungen für den allgemeinen eindimensionalen Fall sowie für Spezialfälle mit konstanter und periodisch zeitveränderlicher Nachfrage angegeben.

Forschungshintergrund und Motivation

Problemhintergrund

Mit der Entwicklung kostengünstiger Sensor-, Verarbeitungs- und Kommunikationshardware finden autonome Roboterschwärme in vielen Bereichen Anwendung, darunter Notfallreaktion, Transport, Logistik, Datenerfassung und Verteidigung. Großflächige Schwärme bieten erhebliche Vorteile in Effizienz und Robustheit, aber mit zunehmender Schwarmgröße werden Bewegungsplanung und Koordination zwischen Agenten zunehmend schwierig.

Anwendungsszenarien

Die mathematische Modellierung des Papers wird durch Anwendungen im Edge Computing und Mobile Cloud Computing motiviert:

Nachfrage-Agenten: Leichte Geräte (z.B. mit Kameras ausgestattete Drohnen) mit begrenzter Rechen- und Speicherkapazität, aber hoher Mobilität
Ressourcen-Agenten: Schwere Geräte (z.B. mobile Edge-Computing-Server) mit starker Rechenleistung, aber geringerer Mobilität
Typische Anwendung: Videoüberwachung bei Katastrophenhilfe, wobei Nachfrage-Agenten für Datenerfassung und Ressourcen-Agenten für Datenverarbeitung zuständig sind

Forschungsmotivation

Skalierungsherausforderung: Traditionelle diskrete Agenten-Modellierung hat zu hohe Rechenkomplexität bei großflächigen Schwärmen
Kontinuum-Vorteile: Die Modellierung von Schwärmen als Dichteverteilungen kann die Modellkomplexität erheblich reduzieren und makroskopische Verhaltenseinsichten bieten
Gekoppelte Zuordnung und Bewegung: Gleichzeitige Optimierung von Aufgabenzuordnung und physischer Bewegung mit wesentlichen Kompromissen
Theoretische Lücke: Bestehende Forschung mangelt es an systematischer theoretischer Analyse solcher gekoppelter Probleme

Kernbeiträge

Neuartige Problemmodellierung: Erstmalige Kombination von dynamischem Matching und raum-zeitlicher Steuerung mit Aufbau eines optimalen Steuerungsmodells für Kontinuum-Schwärme mit zwei Agenten-Klassen
Mathematischer Transformationsdurchbruch: Entdeckung, dass das nichtlineare unendlich-dimensionale Problem im eindimensionalen Fall durch Quantilfunktions-Transformation in ein entkoppeltes lineares quadratisches Verfolgungsproblem umgewandelt werden kann
Konstruktion analytischer Lösungen: Bereitstellung expliziter analytischer Lösungen für den allgemeinen eindimensionalen Fall, was in solchen Problemen äußerst selten ist
Tiefgehende Analyse von Spezialfällen:
- Statische Nachfrage: Lösungen folgen Wasserstein-Geodäten, aber die Zeitplanung wird durch das optimale Steuerungsproblem bestimmt
- Periodische Nachfrage: Lösungen können als gefilterte Version des Nachfragesignals ausgedrückt werden
Theoretische Einsichten: Offenlegung der geometrischen Struktur optimaler Lösungen und des Wesens von Leistungsgrenzen

Methodische Details

Aufgabendefinition

Gegeben die anfängliche Ressourcenverteilung $R_0$ und die zeitveränderliche Nachfrageverteilung $D_t$ , löse auf dem Zeitintervall $[0,T]$ : $\min_{R,V} \int_0^T \left( W_2^2(R_t, D_t) + \alpha^2 \int_\Omega \|V_t(x)\|_2^2 R_t(x) dx \right) dt$ unter der Nebenbedingung: $\partial_t R_t(x) = -\nabla \cdot (R_t(x)V_t(x))$

Wobei:

$W_2^2(R_t, D_t)$ : Quadrat der 2-Wasserstein-Distanz, quantifiziert Zuordnungskosten
$V_t(x)$ : Geschwindigkeitsfeld (Steuervariable)
$\alpha > 0$ : Gewichtungsparameter

Modellarchitektur

1. Fünf Kernkomponenten

Nachfrageverteilung $D_t(x)$ : Enthält kontinuierliche und diskrete Teile
Ressourcenverteilung $R_t(x)$ : Enthält ebenfalls kontinuierliche und diskrete Teile
Zuordnungsplan $K_t(x,y)$ : Zweidimensionale Verteilung, erfüllt Marginalitätsbeschränkungen
Ressourcendynamik: Kontinuitätspartielle Differentialgleichung
Leistungsziel: Kompromiss zwischen Zuordnungskosten und Bewegungskosten

2. Wichtige mathematische Transformation

Quantilfunktions-Transformation: Für eine eindimensionale Dichte $\mu$ definiere

Kumulative Verteilungsfunktion: $F_\mu(x) = \int_{-\infty}^x \mu(\xi) d\xi$
Quantilfunktion: $Q_\mu(z) = \inf\{x : F_\mu(x) \geq z\}$

Kernlemma: Im eindimensionalen Fall kann die 2-Wasserstein-Distanz ausgedrückt werden als $W_2^2(\mu, \nu) = \int_0^1 (Q_\nu(z) - Q_\mu(z))^2 dz$

3. Dynamik-Transformation

Ursprüngliche bilineare Dynamik: $\partial_t R(x,t) = -\partial_x(V(x,t)R(x,t))$

Äquivalente Quantilfunktions-Dynamik: $\partial_t Q_R(z,t) = U(z,t)$ wobei $U(z,t) = V(Q_R(z,t), t)$

Technische Innovationen

1. Isometrie im Quantilfunktionsraum

Entdeckung einer isometrischen Abbildung zwischen dem $L^2$ -Quantilfunktionsraum und dem 2-Wasserstein-Dichteraum, die komplexe optimale Transportprobleme im Quantilfunktionsraum in einfache $L^2$ -Probleme umwandelt.

2. Entkopplung des unendlich-dimensionalen Problems

Durch Höhenliniensegmentierungstechnik wird das unendlich-dimensionale LQ-Verfolgungsproblem in unendlich viele unabhängige skalare LQ-Verfolgungsprobleme zerlegt: $\min_{r_i,u_i} \int_0^T \left( (r_i(t) - d_i(t))^2 + \alpha^2 u_i^2(t) \right) dt$ unter der Nebenbedingung: $\dot{r}_i(t) = u_i(t)$

3. Konstruktion expliziter Lösungen

Die optimale Steuerung des Skalarproblems hat eine Rückkopplungs-Vorwärts-Struktur: $u_i(t) = -\frac{1}{\alpha^2}(p(t)r_i(t) + y_i(t))$

Wobei:

Rückkopplungsverstärkung: $p(t) = \alpha \tanh((T-t)/\alpha)$
Vorwärtsterm: $y_i(t) = \int_t^T \phi_y(t,\tau) d_i(\tau) d\tau$

Experimentelle Einrichtung

Numerische Verifizierungsszenarien

Das Paper verifiziert die Methodeneffektivität hauptsächlich durch theoretische Analyse und numerische Beispiele statt großflächiger experimenteller Bewertung.

Statische Nachfrage-Fall

Ressourcenverteilung: 11 diskrete Agenten mit ungleicher Masse
Nachfrageverteilung: Kontinuierliche statische Verteilung
Parametereinstellung: $\alpha = 2$ , $T = 10$

Periodische Nachfrage-Fall

Nachfragefunktion: Gaußsche Mischverteilung $D(x,t) = (1 + \sin(2\pi t))\mathcal{N}(2.5, 1) + (1 - \sin(2\pi t))\mathcal{N}(7.5, 1)$
Parametervariation: $\alpha \in \{0.08, 1, >1\}$

Bewertungsmetriken

Optimale Kostenfunktionswert
Trajektorien-Konvergenz: Grad der Annäherung der Ressourcenverteilung an die Nachfrageverteilung
Geometrische Eigenschaften: Verifikation, ob die Lösung Wasserstein-Geodäten folgt

Experimentelle Ergebnisse

Hauptergebnisse

Statische Nachfrage-Situation

Geometrische Struktur: Optimale Trajektorie ist im Quantilfunktionsraum eine Gerade, entspricht Wasserstein-Geodäten im Dichteraum
Zeitplanung: Anders als konstante Geschwindigkeit in klassischer dynamischer optimaler Transporttheorie wird die Geschwindigkeit hier durch $\phi_r(t,0)$ bestimmt
Kostenzerlegung: $J = W_2^2(R_0, \bar{D}) \alpha \tanh(T/\alpha) + T W_2^2(D, \bar{D})$

Periodische Nachfrage-Situation

Frequenzbereichs-Interpretation: Optimale Lösung kann als Nachfragesignal interpretiert werden, das durch einen Tiefpassfilter mit Grenzfrequenz $1/\alpha$ gefiltert wird
Phasengang: Aufgrund des nicht-kausalen Vorwärtsterms ist der Zustand vollständig in Phase mit dem Referenzsignal
Frequenzselektivität: Wenn $\alpha$ zunimmt, verfolgt das System hauptsächlich die niederfrequenten Komponenten der Nachfrage

Wichtige Erkenntnisse

Leistungsgrenzen: Es existiert eine fundamentale Leistungsuntergrenze $K$ , die nur von Problemparametern abhängt
Erreichbarkeit: $\bar{D}$ stellt die von der Anfangsbedingung $R_0$ erreichbare Verteilung dar, die $D$ am nächsten kommt
Kompromissmechanismus: Der Parameter $\alpha$ steuert effektiv den Kompromiss zwischen Verfolgungsgenauigkeit und Bewegungskosten

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Theoretischer Durchbruch: Erstmalige analytische Lösung des optimalen Steuerungsproblems für Zwei-Klassen-Kontinuum-Schwärme
Geometrische Einsichten: Offenlegung der Wasserstein-geometrischen Struktur optimaler Lösungen
Rechenvorteil: Quantilfunktions-Transformation vereinfacht die Rechenkomplexität erheblich

Einschränkungen

Dimensionsbeschränkung: Aktuelle Ergebnisse gelten nur für eindimensionale Räume
Kausalität: Erfordert Vorwissen des gesamten Nachfragesignals, begrenzt Echtzeitanwendungen
Massenerhaltung: Annahme konstanter Gesamtmasse, möglicherweise müssen Annahmen in praktischen Anwendungen gelockert werden
Zentralisierte Steuerung: Berücksichtigung von Kommunikations- und Rechenbeschränkungen bei verteilter Implementierung nicht vorhanden

Zukünftige Richtungen

Hochdimensionale Verallgemeinerung: Erweiterung auf zwei- und dreidimensionale Räume
Kausalisierung: Entwicklung kausaler Lösungen basierend auf modellprädiktiver Steuerung
Unausgeglichener Transport: Berücksichtigung von Fällen mit variabler Masse
Verteilte Implementierung: Entwurf kommunikationseffizienter verteilter Algorithmen
Numerische Methoden: Entwicklung von Lösern für hochdimensionale Fälle

Tiefgehende Bewertung

Stärken

Theoretische Innovativität:
- Geschickte Anwendung der Quantilfunktions-Transformation zur Entkopplung komplexer Probleme
- Etablierung neuer Verbindungen zwischen optimalem Transport und optimaler Steuerung
- Bereitstellung seltener expliziter analytischer Lösungen
Mathematische Strenge:
- Vollständige theoretische Ableitungen und Beweise
- Klare Problemtransformationsketten
- Strikte Nebenbedingungsbehandlung
Einsichtstiefe:
- Offenlegung der geometrischen Natur des Problems
- Klare Charakterisierung von Leistungsgrenzen
- Etablierung von Frequenzbereichs-Interpretationen
Anwendungsrelevanz:
- Problemmodellierung nah an praktischen Anwendungsszenarien
- Bereitstellung theoretischer Grundlagen für aufstrebende Bereiche wie Edge Computing

Mängel

Begrenzte Anwendbarkeit:
- Beschränkung auf eindimensionale Fälle, hochdimensionale Verallgemeinerung ist nicht trivial
- Erfordert Vorwissen des Nachfragesignals, praktische Anwendbarkeit begrenzt
Unzureichende experimentelle Verifikation:
- Mangel an Vergleichen mit praktischen Benchmark-Methoden
- Numerische Beispiele in kleinerem Maßstab
- Keine Verifikation der Recheneffizienz in großflächigen Szenarien
Fehlende Implementierungsdetails:
- Verteilte Implementierungspläne unklar
- Kommunikationskomplexitätsanalyse fehlt
- Robustheitsanalyse unzureichend

Einflussbeurteilung

Theoretischer Beitrag: Bereitstellung wichtiger theoretischer Werkzeuge für das Feld der Kontinuum-Schwarmsteuerung
Methodologischer Wert: Quantilfunktions-Transformationstechnik könnte Lösungen für andere verwandte Probleme inspirieren
Anwendungspotenzial: Bereitstellung theoretischer Grundlagen für Steuerung für praktische Systeme wie Drohnenschwärme und Roboterschwärme
Nachfolgeforschung: Grundlegung für Forschung zu hochdimensionalen Fällen und Echtzeitalgoritmen

Anwendbare Szenarien

Eindimensionale Bereitstellung: Agenten-Bereitstellung entlang von Autobahnen oder Grenzlinien
Offline-Planung: Langzeitplanungsprobleme mit bekannten Nachfragemustern
Theoretische Analyse: Als Leistungs-Benchmark für komplexere Algorithmen
Lehr- und Forschung: Interdisziplinäre Forschung zwischen optimaler Steuerung und optimaler Transporttheorie

Literaturverzeichnis

Das Paper zitiert 41 verwandte Literaturquellen, hauptsächlich einschließlich:

Klassische Literatur zur optimalen Transporttheorie (Santambrogio, Benamou-Brenier, etc.)
Verwandte Arbeiten zur Schwarmsteuerung (Fornasier, Bonnet, etc.)
Literatur zu Multi-Agenten-Systemen (Bandyopadhyaay, Krishnan, etc.)
Anwendungsliteratur zu Edge Computing (He, Yang, etc.)

Gesamtbewertung: Dies ist ein Paper mit wichtigen theoretischen Beiträgen, das durch geschickte mathematische Transformation ein herausforderndes unendlich-dimensionales optimales Steuerungsproblem löst. Obwohl es Einschränkungen in Dimensionalität und Praktikabilität gibt, bietet es wichtige Grundlagen für die theoretische Entwicklung verwandter Bereiche und hat hohen akademischen Wert sowie potenzielles Anwendungspotenzial.