2025-11-24T03:04:18.080955

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

Emerick, Patterson, Bamieh

We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.

academic

Affectation Optimale et Contrôle du Mouvement dans les Essaims Continus à Deux Classes

Informations Fondamentales

ID de l'article: 2407.18159
Titre: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
Auteurs: Max Emerick, Stacy Patterson, Bassam Bamieh
Classification: eess.SY (Systèmes et Contrôle), cs.SY (Systèmes et Contrôle), math.OC (Optimisation et Contrôle)
Date de soumission/Conférence: Soumis le 24 juillet 2024, révisé le 10 octobre 2025
Lien de l'article: https://arxiv.org/abs/2407.18159

Résumé

Cet article étudie le problème du contrôle optimal d'essaims contenant deux classes d'agents distincts. En utilisant une idéalisation continue pour les essaims de grande taille, dont la dynamique décrit l'évolution de la distribution spatiale de la densité de chaque classe d'agents. La formulation du problème s'inspire de scénarios d'application où une classe d'agents doit être affectée à une autre classe, désignées respectivement comme agents de demande et agents de ressource. Le coût d'affectation dépend de la distance entre les agents affectés mutuellement, et le coût d'affectation total est quantifié par la distance de Wasserstein entre les densités des deux classes d'agents. Lorsque les agents peuvent se déplacer, le coût d'affectation peut être réduit, mais cela entraîne un coût de mouvement physique, établissant ainsi un problème de contrôle optimal non linéaire de dimension infinie. L'étude montre que dans le cas unidimensionnel, lorsqu'il est exprimé en termes de fonctions quantiles des densités d'agents, le problème peut être transformé en un problème de suivi linéaire-quadratique (LQ) de dimension infinie mais découplé. Des solutions sont fournies pour le cas unidimensionnel général ainsi que pour des cas particuliers avec demande constante et demande périodique variant dans le temps.

Contexte et Motivation de la Recherche

Contexte du Problème

Avec le développement de matériel de détection, de traitement et de communication à faible coût, les essaims de robots autonomes trouvent des applications généralisées dans plusieurs domaines tels que la réponse aux urgences, le transport, la logistique, la collecte de données et la défense. Les essaims de grande taille présentent des avantages significatifs en termes d'efficacité et de robustesse, mais à mesure que la taille de l'essaim augmente, la planification des mouvements et la coordination entre agents deviennent de plus en plus difficiles.

Scénarios d'Application

Le modèle mathématique de l'article s'inspire d'applications en informatique en périphérie et en informatique en nuage mobile:

Agents de demande: Appareils légers (par exemple, drones équipés de caméras) avec des capacités de calcul et de stockage limitées, mais une mobilité élevée
Agents de ressource: Appareils lourds (par exemple, serveurs informatiques en périphérie mobile) avec une puissance de calcul puissante mais une mobilité réduite
Application typique: Surveillance vidéo lors de secours en cas de catastrophe, où les agents de demande sont responsables de la collecte de données et les agents de ressource du traitement des données

Motivation de la Recherche

Défi d'échelle: La modélisation traditionnelle d'agents discrets présente une complexité computationnelle trop élevée pour les essaims de grande taille
Avantages du continuum: La modélisation d'un essaim comme une distribution de densité réduit considérablement la complexité du modèle et fournit des perspectives sur le comportement macroscopique
Couplage affectation-mouvement: Nécessité d'optimiser simultanément l'affectation des tâches et le mouvement physique, avec un compromis fondamental
Lacune théorique: Les recherches existantes manquent d'analyse théorique systématique de tels problèmes couplés

Contributions Principales

Modélisation novatrice du problème: Première combinaison d'appariement dynamique et de contrôle spatio-temporel, établissant un modèle de contrôle optimal d'essaim continu avec deux classes d'agents
Percée mathématique: Découverte que dans le cas unidimensionnel, le problème non linéaire de dimension infinie peut être transformé en un problème de suivi linéaire-quadratique découplé via une transformation de fonction quantile
Construction de solutions analytiques: Fourniture de solutions analytiques explicites pour le cas unidimensionnel général, ce qui est extrêmement rare dans ce type de problème
Analyse approfondie des cas particuliers:
- Demande statique: La solution suit la géodésique de Wasserstein mais l'ordonnancement temporel est déterminé par le problème de contrôle optimal
- Demande périodique: La solution peut être exprimée comme une version filtrée du signal de suivi
Perspectives théoriques: Révélation de la structure géométrique de la solution optimale et de la nature des limites de performance

Détails de la Méthode

Définition de la Tâche

Étant donnée la distribution initiale de ressources $R_0$ et la distribution de demande variant dans le temps $D_t$ , résoudre sur l'intervalle de temps $[0,T]$ : $\min_{R,V} \int_0^T \left( W_2^2(R_t, D_t) + \alpha^2 \int_\Omega \|V_t(x)\|_2^2 R_t(x) dx \right) dt$ Sous la contrainte: $\partial_t R_t(x) = -\nabla \cdot (R_t(x)V_t(x))$

Où:

$W_2^2(R_t, D_t)$ : Carré de la distance 2-Wasserstein, quantifiant le coût d'affectation
$V_t(x)$ : Champ de vitesse (variable de contrôle)
$\alpha > 0$ : Paramètre de pondération

Architecture du Modèle

1. Cinq Composants Fondamentaux

Distribution de demande $D_t(x)$ : Contient des parties continues et discrètes
Distribution de ressources $R_t(x)$ : Contient également des parties continues et discrètes
Plan d'affectation $K_t(x,y)$ : Distribution bidimensionnelle satisfaisant les contraintes marginales
Dynamique des ressources: Équation aux dérivées partielles de continuité
Objectif de performance: Compromis entre coût d'affectation et coût de mouvement

2. Transformation Mathématique Clé

Transformation de fonction quantile: Pour une densité unidimensionnelle $\mu$ , définir

Fonction de distribution cumulative: $F_\mu(x) = \int_{-\infty}^x \mu(\xi) d\xi$
Fonction quantile: $Q_\mu(z) = \inf\{x : F_\mu(x) \geq z\}$

Lemme fondamental: Dans le cas unidimensionnel, la distance 2-Wasserstein peut être exprimée comme $W_2^2(\mu, \nu) = \int_0^1 (Q_\nu(z) - Q_\mu(z))^2 dz$

3. Transformation de la Dynamique

Dynamique bilinéaire originale: $\partial_t R(x,t) = -\partial_x(V(x,t)R(x,t))$

Dynamique de fonction quantile équivalente: $\partial_t Q_R(z,t) = U(z,t)$ où $U(z,t) = V(Q_R(z,t), t)$

Points d'Innovation Technique

1. Isométrie dans l'Espace des Fonctions Quantiles

Découverte d'une application isométrique entre l'espace $L^2$ des fonctions quantiles et l'espace de densité 2-Wasserstein, transformant le problème complexe de transport optimal en un simple problème $L^2$ dans l'espace des fonctions quantiles.

2. Découplage du Problème de Dimension Infinie

Par la technique de partitionnement des ensembles de niveaux, le problème de suivi LQ de dimension infinie est décomposé en une infinité de problèmes de suivi LQ scalaires indépendants: $\min_{r_i,u_i} \int_0^T \left( (r_i(t) - d_i(t))^2 + \alpha^2 u_i^2(t) \right) dt$ Sous la contrainte: $\dot{r}_i(t) = u_i(t)$

3. Construction de Solution Explicite

Le contrôle optimal du problème scalaire possède une structure rétroaction-anticipation: $u_i(t) = -\frac{1}{\alpha^2}(p(t)r_i(t) + y_i(t))$

Où:

Gain de rétroaction: $p(t) = \alpha \tanh((T-t)/\alpha)$
Terme d'anticipation: $y_i(t) = \int_t^T \phi_y(t,\tau) d_i(\tau) d\tau$

Configuration Expérimentale

Scénarios de Vérification Numérique

L'article valide principalement l'efficacité de la méthode par analyse théorique et exemples numériques, plutôt que par une évaluation expérimentale à grande échelle.

Cas de Demande Statique

Distribution de ressources: 11 agents discrets de masses inégales
Distribution de demande: Distribution statique continue
Paramètres: $\alpha = 2$ , $T = 10$

Cas de Demande Périodique

Fonction de demande: Modèle de mélange gaussien $D(x,t) = (1 + \sin(2\pi t))\mathcal{N}(2.5, 1) + (1 - \sin(2\pi t))\mathcal{N}(7.5, 1)$
Variation des paramètres: $\alpha \in \{0.08, 1, >1\}$

Métriques d'Évaluation

Valeur de la fonction de coût optimal
Convergence des trajectoires: Degré d'approximation de la distribution de ressources vers la distribution de demande
Propriétés géométriques: Vérification que la solution suit la géodésique de Wasserstein

Résultats Expérimentaux

Résultats Principaux

Cas de Demande Statique

Structure géométrique: La trajectoire optimale est une ligne droite dans l'espace des fonctions quantiles, correspondant à une géodésique de Wasserstein dans l'espace de densité
Ordonnancement temporel: Contrairement au taux constant du transport optimal dynamique classique, le taux ici est déterminé par $\phi_r(t,0)$
Décomposition du coût: $J = W_2^2(R_0, \bar{D}) \alpha \tanh(T/\alpha) + T W_2^2(D, \bar{D})$

Cas de Demande Périodique

Interprétation fréquentielle: La solution optimale peut être interprétée comme le signal de demande passant par un filtre passe-bas avec fréquence de coupure $1/\alpha$
Réponse de phase: En raison du terme d'anticipation non-causal, l'état et le signal de référence sont parfaitement en phase
Sélectivité en fréquence: Lorsque $\alpha$ augmente, le système suit principalement les composantes basse fréquence de la demande

Découvertes Clés

Limites de performance: Il existe une limite de performance fondamentale $K$ dépendant uniquement des paramètres du problème
Accessibilité: $\bar{D}$ représente la distribution la plus proche de $D$ accessible à partir de la condition initiale $R_0$
Mécanisme de compromis: Le paramètre $\alpha$ contrôle efficacement le compromis entre précision de suivi et coût de mouvement

Travaux Connexes

Théorie du Transport Optimal

Formule de Benamou-Brenier: Résolution en mécanique des fluides computationnelle du transport optimal dynamique
Distinction: Cet article traite un problème de contrôle de suivi, non un problème de transfert d'état

Contrôle d'Essaims

Contrôle de couverture: Méthodes distribuées basées sur les diagrammes de Voronoi
Contrôle de formation: Contrôle géométrique de systèmes multi-agents
Systèmes auto-interactifs: Application de la théorie du champ moyen au contrôle d'essaims

Affectation Multi-Agents

Appariement spatio-temporel: Algorithmes d'affectation en ligne dans des environnements dynamiques
Prise de décision distribuée: Méthodes d'affectation de tâches décentralisées

Conclusion et Discussion

Conclusions Principales

Percée théorique: Première résolution analytique d'un problème de contrôle optimal d'essaim continu à deux classes
Perspectives géométriques: Révélation de la structure géométrique de Wasserstein de la solution optimale
Avantages computationnels: La transformation de fonction quantile simplifie considérablement la complexité computationnelle

Limitations

Restriction dimensionnelle: Les résultats actuels s'appliquent uniquement au cas unidimensionnel
Causalité: Nécessite de connaître le signal de demande entier, limitant les applications en temps réel
Conservation de masse: Suppose que la masse totale est constante, ce qui peut nécessiter d'être assoupli dans les applications réelles
Contrôle centralisé: Ne considère pas les contraintes de communication et de calcul de la mise en œuvre distribuée

Directions Futures

Généralisation en haute dimension: Extension aux cas bidimensionnel et tridimensionnel
Causalisation: Développement de solutions causales basées sur le contrôle prédictif de modèle
Transport non-équilibré: Considération de cas avec masse variable
Mise en œuvre distribuée: Conception d'algorithmes distribués efficaces en communication
Méthodes numériques: Développement de solveurs numériques pour les cas haute dimension

Évaluation Approfondie

Points Forts

Innovativité théorique:
- Application ingénieuse de la transformation de fonction quantile pour découpler un problème complexe
- Établissement de nouvelles connexions entre transport optimal et contrôle optimal
- Fourniture de solutions analytiques explicites, ce qui est rare
Rigueur mathématique:
- Dérivations théoriques complètes et preuves
- Chaîne de transformation de problème claire
- Traitement rigoureux des contraintes
Profondeur des Perspectives:
- Révélation de la nature géométrique du problème
- Caractérisation claire des limites de performance
- Interprétation en domaine fréquentiel
Pertinence pour les Applications:
- Modélisation du problème proche des scénarios d'application réels
- Fourniture de fondations théoriques pour les domaines émergents comme l'informatique en périphérie

Insuffisances

Portée d'application limitée:
- Restriction au cas unidimensionnel, généralisation haute dimension non triviale
- Nécessité de connaître le signal de demande, utilité pratique limitée
Validation expérimentale insuffisante:
- Manque de comparaison avec des méthodes de référence réelles
- Exemples numériques de petite taille
- Pas de vérification de l'efficacité computationnelle à grande échelle
Détails d'implémentation manquants:
- Plan de mise en œuvre distribuée peu clair
- Analyse de complexité de communication absente
- Analyse de robustesse insuffisante

Évaluation de l'Impact

Contribution théorique: Fourniture d'outils théoriques importants pour le domaine du contrôle d'essaims continus
Valeur méthodologique: La technique de transformation de fonction quantile peut inspirer la résolution d'autres problèmes connexes
Potentiel d'application: Fourniture de fondations théoriques de contrôle pour les systèmes réels tels que les essaims de drones et les essaims de robots
Recherche ultérieure: Établissement de bases pour la recherche sur les cas haute dimension et les algorithmes en temps réel

Scénarios d'Application Appropriés

Déploiement unidimensionnel: Déploiement d'agents le long d'autoroutes ou de lignes frontalières
Planification hors ligne: Problèmes de planification à long terme avec modèles de demande connus
Analyse théorique: Comme référence de performance pour des algorithmes plus complexes
Recherche pédagogique: Recherche interdisciplinaire en théorie du contrôle optimal et transport optimal

Références

L'article cite 41 références connexes, incluant principalement:

Littérature classique en théorie du transport optimal (Santambrogio, Benamou-Brenier, etc.)
Travaux connexes en contrôle d'essaims (Fornasier, Bonnet, etc.)
Littérature sur les systèmes multi-agents (Bandyopadhyaay, Krishnan, etc.)
Littérature d'application en informatique en périphérie (He, Yang, etc.)

Évaluation Générale: Cet article constitue une contribution théorique importante, résolvant par une transformation mathématique ingénieuse un problème de contrôle optimal de dimension infinie complexe. Bien qu'il présente des limitations en termes de dimensionnalité et d'applicabilité pratique, il fournit une base théorique importante pour le développement du domaine connexe, possédant une valeur académique élevée et des perspectives d'application potentielles significatives.