2025-11-24T03:04:18.080955

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

Emerick, Patterson, Bamieh

We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.

academic

Asignación Óptima y Control de Movimiento en Enjambres Continuos de Dos Clases

Información Básica

ID del Artículo: 2407.18159
Título: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
Autores: Max Emerick, Stacy Patterson, Bassam Bamieh
Clasificación: eess.SY (Sistemas y Control), cs.SY (Sistemas y Control), math.OC (Optimización y Control)
Fecha de Presentación/Conferencia: Presentado el 24 de julio de 2024, revisado el 10 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2407.18159

Resumen

Este artículo estudia el problema del control óptimo de enjambres que contienen dos clases de agentes distintos. Se adopta una idealización de continuo para enjambres a gran escala, donde la dinámica describe la evolución de la densidad espacial de distribución de cada clase de agente. El modelado del problema está inspirado en escenarios de aplicación donde una clase de agentes debe asignarse a otra clase de agentes, denominados respectivamente agentes de demanda y agentes de recursos. El costo de asignación está relacionado con la distancia entre los agentes asignados mutuamente, y el costo total de asignación se cuantifica mediante la distancia de Wasserstein entre las densidades de las dos clases de agentes. Cuando los agentes pueden moverse, el costo de asignación puede reducirse, pero incurre en un costo de movimiento físico, estableciendo un equilibrio que formula un problema de control óptimo no lineal de dimensión infinita. Se demuestra que en el caso unidimensional, cuando se expresa mediante funciones cuantiles de las densidades de agentes, el problema puede transformarse en un problema de seguimiento lineal-cuadrático (LQ) de dimensión infinita pero desacoplado. Se proporcionan soluciones para el caso general unidimensional así como para casos especiales de demanda constante y variante en el tiempo periódico.

Antecedentes y Motivación de la Investigación

Contexto del Problema

Con el desarrollo de hardware de sensores, procesamiento y comunicación de bajo costo, los enjambres de robots autónomos han encontrado aplicaciones generalizadas en múltiples campos como respuesta a emergencias, transporte, logística, recopilación de datos y defensa. Los enjambres a gran escala presentan ventajas significativas en eficiencia y robustez, pero a medida que aumenta el tamaño del enjambre, la planificación de movimiento y coordinación entre agentes se vuelve cada vez más difícil.

Escenarios de Aplicación

El modelado matemático del artículo está inspirado en aplicaciones de computación perimetral y computación en la nube móvil:

Agentes de Demanda: Dispositivos ligeros (como drones equipados con cámaras), con capacidad de cómputo y almacenamiento limitados, pero alta movilidad
Agentes de Recursos: Equipos pesados (como servidores de computación perimetral móvil), con potente capacidad de cómputo pero baja movilidad
Aplicación Típica: Vigilancia por video en rescate de desastres, donde los agentes de demanda se encargan de la recopilación de datos y los agentes de recursos del procesamiento de datos

Motivación de la Investigación

Desafío de Escala: El modelado tradicional de agentes discretos tiene una complejidad computacional demasiado alta en enjambres a gran escala
Ventajas del Continuo: Modelar el enjambre como una distribución de densidad puede reducir significativamente la complejidad del modelo y proporcionar información sobre el comportamiento macroscópico
Acoplamiento de Asignación y Movimiento: Es necesario optimizar simultáneamente la asignación de tareas y el movimiento físico, existiendo un equilibrio esencial
Vacío Teórico: La investigación existente carece de análisis teórico sistemático de tales problemas acoplados

Contribuciones Principales

Modelado Novedoso del Problema: Primera combinación de coincidencia dinámica y control espacio-temporal, estableciendo un modelo de control óptimo de enjambre continuo que contiene dos clases de agentes
Avance en Transformación Matemática: Descubrimiento de que en el caso unidimensional, el problema no lineal de dimensión infinita puede transformarse en un problema de seguimiento lineal-cuadrático desacoplado mediante transformación de funciones cuantiles
Construcción de Soluciones Analíticas: Provisión de soluciones analíticas explícitas para el caso general unidimensional, extremadamente raro en este tipo de problemas
Análisis Profundo de Casos Especiales:
- Demanda Estática: La solución sigue geodésicas de Wasserstein pero el cronograma temporal está determinado por el problema de control óptimo
- Demanda Periódica: La solución puede expresarse como una versión filtrada de la señal de seguimiento
Perspectivas Teóricas: Revelación de la estructura geométrica de la solución óptima y la naturaleza de los límites de rendimiento

Explicación Detallada de Métodos

Definición de Tareas

Dada la distribución inicial de recursos $R_0$ y la distribución de demanda variante en el tiempo $D_t$ , resolver en el intervalo de tiempo $[0,T]$ : $\min_{R,V} \int_0^T \left( W_2^2(R_t, D_t) + \alpha^2 \int_\Omega \|V_t(x)\|_2^2 R_t(x) dx \right) dt$ Sujeto a: $\partial_t R_t(x) = -\nabla \cdot (R_t(x)V_t(x))$

Donde:

$W_2^2(R_t, D_t)$ : Cuadrado de la distancia 2-Wasserstein, cuantificando el costo de asignación
$V_t(x)$ : Campo de velocidad (variable de control)
$\alpha > 0$ : Parámetro de equilibrio

Arquitectura del Modelo

1. Cinco Componentes Principales

Distribución de Demanda $D_t(x)$ : Contiene partes continuas y discretas
Distribución de Recursos $R_t(x)$ : Igualmente contiene partes continuas y discretas
Plan de Asignación $K_t(x,y)$ : Distribución bidimensional, satisfaciendo restricciones marginales
Dinámica de Recursos: Ecuación diferencial parcial de continuidad
Objetivo de Rendimiento: Equilibrio entre costo de asignación y costo de movimiento

2. Transformación Matemática Clave

Transformación de Función Cuantil: Para una densidad unidimensional $\mu$ , definir

Función de distribución acumulada: $F_\mu(x) = \int_{-\infty}^x \mu(\xi) d\xi$
Función cuantil: $Q_\mu(z) = \inf\{x : F_\mu(x) \geq z\}$

Lema Principal: En el caso unidimensional, la distancia 2-Wasserstein puede expresarse como $W_2^2(\mu, \nu) = \int_0^1 (Q_\nu(z) - Q_\mu(z))^2 dz$

3. Transformación de Dinámica

Dinámica bilineal original: $\partial_t R(x,t) = -\partial_x(V(x,t)R(x,t))$

Dinámica equivalente de función cuantil: $\partial_t Q_R(z,t) = U(z,t)$ donde $U(z,t) = V(Q_R(z,t), t)$

Puntos de Innovación Técnica

1. Isometría en el Espacio de Funciones Cuantiles

Descubrimiento de que existe un mapeo isométrico entre el espacio de funciones cuantiles $L^2$ y el espacio de densidad 2-Wasserstein, lo que hace que el complejo problema de transporte óptimo se convierta en un simple problema $L^2$ en el espacio de funciones cuantiles.

2. Desacoplamiento de Problemas de Dimensión Infinita

Mediante técnica de partición de conjuntos de nivel, descomponer el problema de seguimiento LQ de dimensión infinita en infinitos problemas escalares de seguimiento LQ independientes: $\min_{r_i,u_i} \int_0^T \left( (r_i(t) - d_i(t))^2 + \alpha^2 u_i^2(t) \right) dt$ Sujeto a: $\dot{r}_i(t) = u_i(t)$

3. Construcción de Solución Explícita

El control óptimo del problema escalar tiene estructura de retroalimentación-prealimentación: $u_i(t) = -\frac{1}{\alpha^2}(p(t)r_i(t) + y_i(t))$

Donde:

Ganancia de retroalimentación: $p(t) = \alpha \tanh((T-t)/\alpha)$
Término de prealimentación: $y_i(t) = \int_t^T \phi_y(t,\tau) d_i(\tau) d\tau$

Configuración Experimental

Escenarios de Verificación Numérica

El artículo verifica principalmente la efectividad del método mediante análisis teórico y ejemplos numéricos, en lugar de evaluación experimental a gran escala.

Caso de Demanda Estática

Distribución de Recursos: 11 agentes discretos con masas desiguales
Distribución de Demanda: Distribución estática continua
Configuración de Parámetros: $\alpha = 2$ , $T = 10$

Caso de Demanda Periódica

Función de Demanda: Modelo de mezcla gaussiana $D(x,t) = (1 + \sin(2\pi t))\mathcal{N}(2.5, 1) + (1 - \sin(2\pi t))\mathcal{N}(7.5, 1)$
Variación de Parámetros: $\alpha \in \{0.08, 1, >1\}$

Indicadores de Evaluación

Valor de Función de Costo Óptimo
Convergencia de Trayectoria: Grado de aproximación de la distribución de recursos a la distribución de demanda
Características Geométricas: Verificación de si la solución sigue geodésicas de Wasserstein

Resultados Experimentales

Resultados Principales

Caso de Demanda Estática

Estructura Geométrica: La trayectoria óptima en el espacio de funciones cuantiles es una línea recta, correspondiente a una geodésica de Wasserstein en el espacio de densidad
Cronograma Temporal: A diferencia del transporte óptimo dinámico clásico con velocidad constante, aquí la velocidad está determinada por $\phi_r(t,0)$
Descomposición de Costo: $J = W_2^2(R_0, \bar{D}) \alpha \tanh(T/\alpha) + T W_2^2(D, \bar{D})$

Caso de Demanda Periódica

Interpretación en Dominio de Frecuencia: La solución óptima puede interpretarse como la señal de demanda pasada a través de un filtro paso-bajo con frecuencia de corte $1/\alpha$
Respuesta de Fase: Debido al término de prealimentación no causal, el estado está completamente en fase con la señal de referencia
Selectividad de Frecuencia: Cuando $\alpha$ aumenta, el sistema principalmente sigue componentes de baja frecuencia de la demanda

Hallazgos Clave

Límites de Rendimiento: Existe un límite fundamental de rendimiento $K$ , que depende únicamente de los parámetros del problema
Alcanzabilidad: $\bar{D}$ representa la distribución más cercana a $D$ alcanzable desde la condición inicial $R_0$
Mecanismo de Equilibrio: El parámetro $\alpha$ controla efectivamente el equilibrio entre precisión de seguimiento y costo de movimiento

Trabajo Relacionado

Teoría de Transporte Óptimo

Fórmula de Benamou-Brenier: Solución de dinámica de fluidos computacional para transporte óptimo dinámico
Distinción: Este artículo es un problema de control de seguimiento, no un problema de transferencia de estado

Control de Enjambres

Control de Cobertura: Métodos distribuidos basados en diagramas de Voronoi
Control de Forma: Control geométrico de sistemas multiagente
Sistemas Autointeractuantes: Aplicación de teoría de campo medio en control de enjambres

Asignación Multiagente

Coincidencia Espacio-Temporal: Algoritmos de asignación en línea en entornos dinámicos
Toma de Decisiones Distribuida: Métodos de asignación de tareas descentralizados

Conclusiones y Discusión

Conclusiones Principales

Avance Teórico: Primera solución analítica de un problema de control óptimo de enjambre continuo de dos clases
Perspectivas Geométricas: Revelación de la estructura geométrica de Wasserstein de la solución óptima
Ventajas Computacionales: La transformación de función cuantil simplifica significativamente la complejidad computacional

Limitaciones

Restricción de Dimensionalidad: Los resultados actuales solo se aplican a espacios unidimensionales
Causalidad: Requiere conocimiento previo de toda la señal de demanda, limitando aplicaciones en tiempo real
Conservación de Masa: Asume que la masa total es constante, posiblemente requiriendo relajación en aplicaciones prácticas
Control Centralizado: No considera restricciones de comunicación y cómputo de implementación distribuida

Direcciones Futuras

Generalización a Dimensiones Superiores: Extensión a espacios bidimensionales y tridimensionales
Causalización: Desarrollo de soluciones causales basadas en control predictivo de modelos
Transporte No Equilibrado: Consideración de casos con masa variable
Implementación Distribuida: Diseño de algoritmos distribuidos eficientes en comunicación
Métodos Numéricos: Desarrollo de solucionadores numéricos para casos de dimensión superior

Evaluación Profunda

Fortalezas

Innovación Teórica:
- Aplicación ingeniosa de transformación de función cuantil para desacoplamiento de problemas complejos
- Establecimiento de nuevas conexiones entre transporte óptimo y control óptimo
- Provisión de soluciones analíticas explícitas, extremadamente raras
Rigor Matemático:
- Derivaciones teóricas completas y pruebas
- Cadena clara de transformación de problemas
- Manejo riguroso de restricciones
Profundidad de Perspectivas:
- Revelación de la naturaleza geométrica del problema
- Caracterización clara de límites de rendimiento
- Interpretación en dominio de frecuencia
Relevancia de Aplicación:
- Modelado de problemas cercano a escenarios de aplicación práctica
- Provisión de base teórica para campos emergentes como computación perimetral

Deficiencias

Rango de Aplicabilidad Limitado:
- Limitado a casos unidimensionales, generalización a dimensiones superiores no trivial
- Requiere conocimiento previo de señal de demanda, utilidad práctica limitada
Verificación Experimental Insuficiente:
- Falta de comparación con métodos de referencia establecidos
- Ejemplos numéricos de escala pequeña
- Sin verificación de eficiencia computacional en escenarios a gran escala
Detalles de Implementación Faltantes:
- Esquema de implementación distribuida poco claro
- Análisis de complejidad de comunicación ausente
- Análisis de robustez insuficiente

Evaluación de Impacto

Contribución Teórica: Provisión de herramientas teóricas importantes para el campo del control de enjambres continuos
Valor Metodológico: La técnica de transformación de función cuantil puede inspirar soluciones para otros problemas relacionados
Potencial de Aplicación: Provisión de base teórica de control para sistemas prácticos como enjambres de drones y robots
Investigación Posterior: Establecimiento de base para investigación de casos de dimensión superior y algoritmos en tiempo real

Escenarios de Aplicabilidad

Despliegue Unidimensional: Despliegue de agentes a lo largo de carreteras o líneas fronterizas
Planificación Fuera de Línea: Problemas de planificación a largo plazo con patrones de demanda conocidos
Análisis Teórico: Uso como referencia de rendimiento para algoritmos más complejos
Investigación Educativa: Investigación interdisciplinaria de teoría de control óptimo y transporte óptimo

Referencias Bibliográficas

El artículo cita 41 referencias relacionadas, incluyendo principalmente:

Literatura clásica en teoría de transporte óptimo (Santambrogio, Benamou-Brenier, etc.)
Trabajos relacionados con control de enjambres (Fornasier, Bonnet, etc.)
Literatura de sistemas multiagente (Bandyopadhyay, Krishnan, etc.)
Literatura de aplicaciones de computación perimetral (He, Yang, etc.)

Evaluación General: Este es un artículo con contribuciones teóricas importantes que resuelve un problema de control óptimo de dimensión infinita desafiante mediante transformación matemática ingeniosa. Aunque presenta limitaciones en dimensionalidad y practicidad, proporciona una base teórica importante para el desarrollo del campo relacionado, con valor académico significativo y perspectivas de aplicación potencial.