2025-11-24T03:04:18.080955

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

Emerick, Patterson, Bamieh
We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.
academic

Asignación Óptima y Control de Movimiento en Enjambres Continuos de Dos Clases

Información Básica

  • ID del Artículo: 2407.18159
  • Título: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
  • Autores: Max Emerick, Stacy Patterson, Bassam Bamieh
  • Clasificación: eess.SY (Sistemas y Control), cs.SY (Sistemas y Control), math.OC (Optimización y Control)
  • Fecha de Presentación/Conferencia: Presentado el 24 de julio de 2024, revisado el 10 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2407.18159

Resumen

Este artículo estudia el problema del control óptimo de enjambres que contienen dos clases de agentes distintos. Se adopta una idealización de continuo para enjambres a gran escala, donde la dinámica describe la evolución de la densidad espacial de distribución de cada clase de agente. El modelado del problema está inspirado en escenarios de aplicación donde una clase de agentes debe asignarse a otra clase de agentes, denominados respectivamente agentes de demanda y agentes de recursos. El costo de asignación está relacionado con la distancia entre los agentes asignados mutuamente, y el costo total de asignación se cuantifica mediante la distancia de Wasserstein entre las densidades de las dos clases de agentes. Cuando los agentes pueden moverse, el costo de asignación puede reducirse, pero incurre en un costo de movimiento físico, estableciendo un equilibrio que formula un problema de control óptimo no lineal de dimensión infinita. Se demuestra que en el caso unidimensional, cuando se expresa mediante funciones cuantiles de las densidades de agentes, el problema puede transformarse en un problema de seguimiento lineal-cuadrático (LQ) de dimensión infinita pero desacoplado. Se proporcionan soluciones para el caso general unidimensional así como para casos especiales de demanda constante y variante en el tiempo periódico.

Antecedentes y Motivación de la Investigación

Contexto del Problema

Con el desarrollo de hardware de sensores, procesamiento y comunicación de bajo costo, los enjambres de robots autónomos han encontrado aplicaciones generalizadas en múltiples campos como respuesta a emergencias, transporte, logística, recopilación de datos y defensa. Los enjambres a gran escala presentan ventajas significativas en eficiencia y robustez, pero a medida que aumenta el tamaño del enjambre, la planificación de movimiento y coordinación entre agentes se vuelve cada vez más difícil.

Escenarios de Aplicación

El modelado matemático del artículo está inspirado en aplicaciones de computación perimetral y computación en la nube móvil:

  • Agentes de Demanda: Dispositivos ligeros (como drones equipados con cámaras), con capacidad de cómputo y almacenamiento limitados, pero alta movilidad
  • Agentes de Recursos: Equipos pesados (como servidores de computación perimetral móvil), con potente capacidad de cómputo pero baja movilidad
  • Aplicación Típica: Vigilancia por video en rescate de desastres, donde los agentes de demanda se encargan de la recopilación de datos y los agentes de recursos del procesamiento de datos

Motivación de la Investigación

  1. Desafío de Escala: El modelado tradicional de agentes discretos tiene una complejidad computacional demasiado alta en enjambres a gran escala
  2. Ventajas del Continuo: Modelar el enjambre como una distribución de densidad puede reducir significativamente la complejidad del modelo y proporcionar información sobre el comportamiento macroscópico
  3. Acoplamiento de Asignación y Movimiento: Es necesario optimizar simultáneamente la asignación de tareas y el movimiento físico, existiendo un equilibrio esencial
  4. Vacío Teórico: La investigación existente carece de análisis teórico sistemático de tales problemas acoplados

Contribuciones Principales

  1. Modelado Novedoso del Problema: Primera combinación de coincidencia dinámica y control espacio-temporal, estableciendo un modelo de control óptimo de enjambre continuo que contiene dos clases de agentes
  2. Avance en Transformación Matemática: Descubrimiento de que en el caso unidimensional, el problema no lineal de dimensión infinita puede transformarse en un problema de seguimiento lineal-cuadrático desacoplado mediante transformación de funciones cuantiles
  3. Construcción de Soluciones Analíticas: Provisión de soluciones analíticas explícitas para el caso general unidimensional, extremadamente raro en este tipo de problemas
  4. Análisis Profundo de Casos Especiales:
    • Demanda Estática: La solución sigue geodésicas de Wasserstein pero el cronograma temporal está determinado por el problema de control óptimo
    • Demanda Periódica: La solución puede expresarse como una versión filtrada de la señal de seguimiento
  5. Perspectivas Teóricas: Revelación de la estructura geométrica de la solución óptima y la naturaleza de los límites de rendimiento

Explicación Detallada de Métodos

Definición de Tareas

Dada la distribución inicial de recursos R0R_0 y la distribución de demanda variante en el tiempo DtD_t, resolver en el intervalo de tiempo [0,T][0,T]: minR,V0T(W22(Rt,Dt)+α2ΩVt(x)22Rt(x)dx)dt\min_{R,V} \int_0^T \left( W_2^2(R_t, D_t) + \alpha^2 \int_\Omega \|V_t(x)\|_2^2 R_t(x) dx \right) dt Sujeto a: tRt(x)=(Rt(x)Vt(x))\partial_t R_t(x) = -\nabla \cdot (R_t(x)V_t(x))

Donde:

  • W22(Rt,Dt)W_2^2(R_t, D_t): Cuadrado de la distancia 2-Wasserstein, cuantificando el costo de asignación
  • Vt(x)V_t(x): Campo de velocidad (variable de control)
  • α>0\alpha > 0: Parámetro de equilibrio

Arquitectura del Modelo

1. Cinco Componentes Principales

  1. Distribución de Demanda Dt(x)D_t(x): Contiene partes continuas y discretas
  2. Distribución de Recursos Rt(x)R_t(x): Igualmente contiene partes continuas y discretas
  3. Plan de Asignación Kt(x,y)K_t(x,y): Distribución bidimensional, satisfaciendo restricciones marginales
  4. Dinámica de Recursos: Ecuación diferencial parcial de continuidad
  5. Objetivo de Rendimiento: Equilibrio entre costo de asignación y costo de movimiento

2. Transformación Matemática Clave

Transformación de Función Cuantil: Para una densidad unidimensional μ\mu, definir

  • Función de distribución acumulada: Fμ(x)=xμ(ξ)dξF_\mu(x) = \int_{-\infty}^x \mu(\xi) d\xi
  • Función cuantil: Qμ(z)=inf{x:Fμ(x)z}Q_\mu(z) = \inf\{x : F_\mu(x) \geq z\}

Lema Principal: En el caso unidimensional, la distancia 2-Wasserstein puede expresarse como W22(μ,ν)=01(Qν(z)Qμ(z))2dzW_2^2(\mu, \nu) = \int_0^1 (Q_\nu(z) - Q_\mu(z))^2 dz

3. Transformación de Dinámica

Dinámica bilineal original: tR(x,t)=x(V(x,t)R(x,t))\partial_t R(x,t) = -\partial_x(V(x,t)R(x,t))

Dinámica equivalente de función cuantil: tQR(z,t)=U(z,t)\partial_t Q_R(z,t) = U(z,t) donde U(z,t)=V(QR(z,t),t)U(z,t) = V(Q_R(z,t), t)

Puntos de Innovación Técnica

1. Isometría en el Espacio de Funciones Cuantiles

Descubrimiento de que existe un mapeo isométrico entre el espacio de funciones cuantiles L2L^2 y el espacio de densidad 2-Wasserstein, lo que hace que el complejo problema de transporte óptimo se convierta en un simple problema L2L^2 en el espacio de funciones cuantiles.

2. Desacoplamiento de Problemas de Dimensión Infinita

Mediante técnica de partición de conjuntos de nivel, descomponer el problema de seguimiento LQ de dimensión infinita en infinitos problemas escalares de seguimiento LQ independientes: minri,ui0T((ri(t)di(t))2+α2ui2(t))dt\min_{r_i,u_i} \int_0^T \left( (r_i(t) - d_i(t))^2 + \alpha^2 u_i^2(t) \right) dt Sujeto a: r˙i(t)=ui(t)\dot{r}_i(t) = u_i(t)

3. Construcción de Solución Explícita

El control óptimo del problema escalar tiene estructura de retroalimentación-prealimentación: ui(t)=1α2(p(t)ri(t)+yi(t))u_i(t) = -\frac{1}{\alpha^2}(p(t)r_i(t) + y_i(t))

Donde:

  • Ganancia de retroalimentación: p(t)=αtanh((Tt)/α)p(t) = \alpha \tanh((T-t)/\alpha)
  • Término de prealimentación: yi(t)=tTϕy(t,τ)di(τ)dτy_i(t) = \int_t^T \phi_y(t,\tau) d_i(\tau) d\tau

Configuración Experimental

Escenarios de Verificación Numérica

El artículo verifica principalmente la efectividad del método mediante análisis teórico y ejemplos numéricos, en lugar de evaluación experimental a gran escala.

Caso de Demanda Estática

  • Distribución de Recursos: 11 agentes discretos con masas desiguales
  • Distribución de Demanda: Distribución estática continua
  • Configuración de Parámetros: α=2\alpha = 2, T=10T = 10

Caso de Demanda Periódica

  • Función de Demanda: Modelo de mezcla gaussiana D(x,t)=(1+sin(2πt))N(2.5,1)+(1sin(2πt))N(7.5,1)D(x,t) = (1 + \sin(2\pi t))\mathcal{N}(2.5, 1) + (1 - \sin(2\pi t))\mathcal{N}(7.5, 1)
  • Variación de Parámetros: α{0.08,1,>1}\alpha \in \{0.08, 1, >1\}

Indicadores de Evaluación

  1. Valor de Función de Costo Óptimo
  2. Convergencia de Trayectoria: Grado de aproximación de la distribución de recursos a la distribución de demanda
  3. Características Geométricas: Verificación de si la solución sigue geodésicas de Wasserstein

Resultados Experimentales

Resultados Principales

Caso de Demanda Estática

  1. Estructura Geométrica: La trayectoria óptima en el espacio de funciones cuantiles es una línea recta, correspondiente a una geodésica de Wasserstein en el espacio de densidad
  2. Cronograma Temporal: A diferencia del transporte óptimo dinámico clásico con velocidad constante, aquí la velocidad está determinada por ϕr(t,0)\phi_r(t,0)
  3. Descomposición de Costo: J=W22(R0,Dˉ)αtanh(T/α)+TW22(D,Dˉ)J = W_2^2(R_0, \bar{D}) \alpha \tanh(T/\alpha) + T W_2^2(D, \bar{D})

Caso de Demanda Periódica

  1. Interpretación en Dominio de Frecuencia: La solución óptima puede interpretarse como la señal de demanda pasada a través de un filtro paso-bajo con frecuencia de corte 1/α1/\alpha
  2. Respuesta de Fase: Debido al término de prealimentación no causal, el estado está completamente en fase con la señal de referencia
  3. Selectividad de Frecuencia: Cuando α\alpha aumenta, el sistema principalmente sigue componentes de baja frecuencia de la demanda

Hallazgos Clave

  1. Límites de Rendimiento: Existe un límite fundamental de rendimiento KK, que depende únicamente de los parámetros del problema
  2. Alcanzabilidad: Dˉ\bar{D} representa la distribución más cercana a DD alcanzable desde la condición inicial R0R_0
  3. Mecanismo de Equilibrio: El parámetro α\alpha controla efectivamente el equilibrio entre precisión de seguimiento y costo de movimiento

Trabajo Relacionado

Teoría de Transporte Óptimo

  • Fórmula de Benamou-Brenier: Solución de dinámica de fluidos computacional para transporte óptimo dinámico
  • Distinción: Este artículo es un problema de control de seguimiento, no un problema de transferencia de estado

Control de Enjambres

  • Control de Cobertura: Métodos distribuidos basados en diagramas de Voronoi
  • Control de Forma: Control geométrico de sistemas multiagente
  • Sistemas Autointeractuantes: Aplicación de teoría de campo medio en control de enjambres

Asignación Multiagente

  • Coincidencia Espacio-Temporal: Algoritmos de asignación en línea en entornos dinámicos
  • Toma de Decisiones Distribuida: Métodos de asignación de tareas descentralizados

Conclusiones y Discusión

Conclusiones Principales

  1. Avance Teórico: Primera solución analítica de un problema de control óptimo de enjambre continuo de dos clases
  2. Perspectivas Geométricas: Revelación de la estructura geométrica de Wasserstein de la solución óptima
  3. Ventajas Computacionales: La transformación de función cuantil simplifica significativamente la complejidad computacional

Limitaciones

  1. Restricción de Dimensionalidad: Los resultados actuales solo se aplican a espacios unidimensionales
  2. Causalidad: Requiere conocimiento previo de toda la señal de demanda, limitando aplicaciones en tiempo real
  3. Conservación de Masa: Asume que la masa total es constante, posiblemente requiriendo relajación en aplicaciones prácticas
  4. Control Centralizado: No considera restricciones de comunicación y cómputo de implementación distribuida

Direcciones Futuras

  1. Generalización a Dimensiones Superiores: Extensión a espacios bidimensionales y tridimensionales
  2. Causalización: Desarrollo de soluciones causales basadas en control predictivo de modelos
  3. Transporte No Equilibrado: Consideración de casos con masa variable
  4. Implementación Distribuida: Diseño de algoritmos distribuidos eficientes en comunicación
  5. Métodos Numéricos: Desarrollo de solucionadores numéricos para casos de dimensión superior

Evaluación Profunda

Fortalezas

  1. Innovación Teórica:
    • Aplicación ingeniosa de transformación de función cuantil para desacoplamiento de problemas complejos
    • Establecimiento de nuevas conexiones entre transporte óptimo y control óptimo
    • Provisión de soluciones analíticas explícitas, extremadamente raras
  2. Rigor Matemático:
    • Derivaciones teóricas completas y pruebas
    • Cadena clara de transformación de problemas
    • Manejo riguroso de restricciones
  3. Profundidad de Perspectivas:
    • Revelación de la naturaleza geométrica del problema
    • Caracterización clara de límites de rendimiento
    • Interpretación en dominio de frecuencia
  4. Relevancia de Aplicación:
    • Modelado de problemas cercano a escenarios de aplicación práctica
    • Provisión de base teórica para campos emergentes como computación perimetral

Deficiencias

  1. Rango de Aplicabilidad Limitado:
    • Limitado a casos unidimensionales, generalización a dimensiones superiores no trivial
    • Requiere conocimiento previo de señal de demanda, utilidad práctica limitada
  2. Verificación Experimental Insuficiente:
    • Falta de comparación con métodos de referencia establecidos
    • Ejemplos numéricos de escala pequeña
    • Sin verificación de eficiencia computacional en escenarios a gran escala
  3. Detalles de Implementación Faltantes:
    • Esquema de implementación distribuida poco claro
    • Análisis de complejidad de comunicación ausente
    • Análisis de robustez insuficiente

Evaluación de Impacto

  1. Contribución Teórica: Provisión de herramientas teóricas importantes para el campo del control de enjambres continuos
  2. Valor Metodológico: La técnica de transformación de función cuantil puede inspirar soluciones para otros problemas relacionados
  3. Potencial de Aplicación: Provisión de base teórica de control para sistemas prácticos como enjambres de drones y robots
  4. Investigación Posterior: Establecimiento de base para investigación de casos de dimensión superior y algoritmos en tiempo real

Escenarios de Aplicabilidad

  1. Despliegue Unidimensional: Despliegue de agentes a lo largo de carreteras o líneas fronterizas
  2. Planificación Fuera de Línea: Problemas de planificación a largo plazo con patrones de demanda conocidos
  3. Análisis Teórico: Uso como referencia de rendimiento para algoritmos más complejos
  4. Investigación Educativa: Investigación interdisciplinaria de teoría de control óptimo y transporte óptimo

Referencias Bibliográficas

El artículo cita 41 referencias relacionadas, incluyendo principalmente:

  • Literatura clásica en teoría de transporte óptimo (Santambrogio, Benamou-Brenier, etc.)
  • Trabajos relacionados con control de enjambres (Fornasier, Bonnet, etc.)
  • Literatura de sistemas multiagente (Bandyopadhyay, Krishnan, etc.)
  • Literatura de aplicaciones de computación perimetral (He, Yang, etc.)

Evaluación General: Este es un artículo con contribuciones teóricas importantes que resuelve un problema de control óptimo de dimensión infinita desafiante mediante transformación matemática ingeniosa. Aunque presenta limitaciones en dimensionalidad y practicidad, proporciona una base teórica importante para el desarrollo del campo relacionado, con valor académico significativo y perspectivas de aplicación potencial.