2025-11-24T03:04:18.080955

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

Emerick, Patterson, Bamieh
We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.
academic

Optimal Assignment and Motion Control in Two-Class Continuum Swarms

基本信息

  • 论文ID: 2407.18159
  • 标题: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
  • 作者: Max Emerick, Stacy Patterson, Bassam Bamieh
  • 分类: eess.SY (系统与控制), cs.SY (系统与控制), math.OC (最优化与控制)
  • 发表时间/会议: 提交于2024年7月24日,修订于2025年10月10日
  • 论文链接: https://arxiv.org/abs/2407.18159

摘要

本文研究包含两类不同智能体的最优群体控制问题。采用大规模群体的连续体理想化模型,其中动力学描述每类智能体空间分布密度的演化。问题建模受到一类智能体需要分配给另一类智能体的应用场景启发,分别称为需求智能体和资源智能体。分配成本与相互分配智能体之间的距离相关,总分配成本通过两类智能体密度之间的Wasserstein距离量化。当智能体可以移动时,分配成本可以降低,但需要付出物理运动成本,这种权衡建立了一个非线性无穷维最优控制问题。研究表明,在一维空间情况下,当用各智能体密度的分位函数表示时,该问题可以转换为无穷维但解耦的线性二次(LQ)跟踪问题。给出了一般一维情况以及常数和周期时变需求特殊情况的解。

研究背景与动机

问题背景

随着低成本传感、处理和通信硬件的发展,自主机器人群体在应急响应、运输、物流、数据收集和国防等多个领域得到广泛应用。大规模群体在效率和鲁棒性方面具有显著优势,但随着群体规模的增大,智能体间的运动规划和协调变得越来越困难。

应用场景

论文的数学模型部分受到边缘计算和移动云计算应用的启发:

  • 需求智能体:轻量级设备(如配备摄像头的无人机),计算和存储能力有限,但机动性强
  • 资源智能体:重型设备(如移动边缘计算服务器),具有强大的计算能力但机动性较差
  • 典型应用:灾难救援中的视频监控,需求智能体负责数据采集,资源智能体负责数据处理

研究动机

  1. 规模挑战:传统离散智能体建模在大规模群体中计算复杂度过高
  2. 连续体优势:将群体建模为密度分布可显著降低模型复杂度并提供宏观行为洞察
  3. 分配与运动耦合:需要同时优化任务分配和物理运动,存在本质的权衡关系
  4. 理论空白:现有研究缺乏对此类耦合问题的系统性理论分析

核心贡献

  1. 新颖问题建模:首次将动态匹配和时空控制结合,建立了包含两类智能体的连续体群体最优控制模型
  2. 数学变换突破:发现在一维情况下,可通过分位函数变换将非线性无穷维问题转化为解耦的线性二次跟踪问题
  3. 解析解构造:为一般一维情况提供了显式解析解,这在此类问题中极为罕见
  4. 特殊情况深入分析
    • 静态需求:解遵循Wasserstein测地线但时间调度由最优控制问题确定
    • 周期需求:解可表示为跟踪信号的滤波版本
  5. 理论洞察:揭示了最优解的几何结构和性能限制的本质

方法详解

任务定义

给定初始资源分布R0R_0和时变需求分布DtD_t,在时间区间[0,T][0,T]上求解: minR,V0T(W22(Rt,Dt)+α2ΩVt(x)22Rt(x)dx)dt\min_{R,V} \int_0^T \left( W_2^2(R_t, D_t) + \alpha^2 \int_\Omega \|V_t(x)\|_2^2 R_t(x) dx \right) dt 约束条件:tRt(x)=(Rt(x)Vt(x))\partial_t R_t(x) = -\nabla \cdot (R_t(x)V_t(x))

其中:

  • W22(Rt,Dt)W_2^2(R_t, D_t):2-Wasserstein距离的平方,量化分配成本
  • Vt(x)V_t(x):速度场(控制变量)
  • α>0\alpha > 0:权衡参数

模型架构

1. 五个核心组件

  1. 需求分布 Dt(x)D_t(x):包含连续和离散部分
  2. 资源分布 Rt(x)R_t(x):同样包含连续和离散部分
  3. 分配计划 Kt(x,y)K_t(x,y):二维分布,满足边际化约束
  4. 资源动力学:连续性偏微分方程
  5. 性能目标:分配成本与运动成本的权衡

2. 关键数学变换

分位函数变换:对于一维密度μ\mu,定义

  • 累积分布函数:Fμ(x)=xμ(ξ)dξF_\mu(x) = \int_{-\infty}^x \mu(\xi) d\xi
  • 分位函数:Qμ(z)=inf{x:Fμ(x)z}Q_\mu(z) = \inf\{x : F_\mu(x) \geq z\}

核心引理:一维情况下,2-Wasserstein距离可表示为 W22(μ,ν)=01(Qν(z)Qμ(z))2dzW_2^2(\mu, \nu) = \int_0^1 (Q_\nu(z) - Q_\mu(z))^2 dz

3. 动力学变换

原始双线性动力学: tR(x,t)=x(V(x,t)R(x,t))\partial_t R(x,t) = -\partial_x(V(x,t)R(x,t))

等价的分位函数动力学: tQR(z,t)=U(z,t)\partial_t Q_R(z,t) = U(z,t) 其中U(z,t)=V(QR(z,t),t)U(z,t) = V(Q_R(z,t), t)

技术创新点

1. 分位函数空间的等距性

发现L2L^2分位函数空间与2-Wasserstein密度空间之间存在等距映射,这使得复杂的最优传输问题在分位函数空间中变为简单的L2L^2问题。

2. 无穷维问题的解耦

通过水平集分割技术,将无穷维LQ跟踪问题分解为无穷个独立的标量LQ跟踪问题: minri,ui0T((ri(t)di(t))2+α2ui2(t))dt\min_{r_i,u_i} \int_0^T \left( (r_i(t) - d_i(t))^2 + \alpha^2 u_i^2(t) \right) dt 约束:r˙i(t)=ui(t)\dot{r}_i(t) = u_i(t)

3. 显式解构造

标量问题的最优控制具有反馈-前馈结构: ui(t)=1α2(p(t)ri(t)+yi(t))u_i(t) = -\frac{1}{\alpha^2}(p(t)r_i(t) + y_i(t))

其中:

  • 反馈增益:p(t)=αtanh((Tt)/α)p(t) = \alpha \tanh((T-t)/\alpha)
  • 前馈项:yi(t)=tTϕy(t,τ)di(τ)dτy_i(t) = \int_t^T \phi_y(t,\tau) d_i(\tau) d\tau

实验设置

数值验证场景

论文主要通过理论分析和数值示例验证方法有效性,而非大规模实验评估。

静态需求案例

  • 资源分布:11个不等质量的离散智能体
  • 需求分布:连续静态分布
  • 参数设置α=2\alpha = 2, T=10T = 10

周期需求案例

  • 需求函数:高斯混合模型 D(x,t)=(1+sin(2πt))N(2.5,1)+(1sin(2πt))N(7.5,1)D(x,t) = (1 + \sin(2\pi t))\mathcal{N}(2.5, 1) + (1 - \sin(2\pi t))\mathcal{N}(7.5, 1)
  • 参数变化α{0.08,1,>1}\alpha \in \{0.08, 1, >1\}

评价指标

  1. 最优成本函数值
  2. 轨迹收敛性:资源分布向需求分布的逼近程度
  3. 几何特性:验证解是否遵循Wasserstein测地线

实验结果

主要结果

静态需求情况

  1. 几何结构:最优轨迹在分位函数空间中为直线,对应密度空间中的Wasserstein测地线
  2. 时间调度:不同于经典动态最优传输的恒定速率,这里的速率由ϕr(t,0)\phi_r(t,0)确定
  3. 成本分解J=W22(R0,Dˉ)αtanh(T/α)+TW22(D,Dˉ)J = W_2^2(R_0, \bar{D}) \alpha \tanh(T/\alpha) + T W_2^2(D, \bar{D})

周期需求情况

  1. 频域解释:最优解可解释为需求信号经过截止频率为1/α1/\alpha的低通滤波器
  2. 相位响应:由于非因果前馈项,状态与参考信号完全同相
  3. 频率选择性:当α\alpha增大时,系统主要跟踪需求的低频分量

关键发现

  1. 性能限制:存在基本性能下界KK,仅依赖于问题参数
  2. 可达性Dˉ\bar{D}代表从初始条件R0R_0可达的最接近DD的分布
  3. 权衡机制α\alpha参数有效控制跟踪精度与运动成本的权衡

相关工作

最优传输理论

  • Benamou-Brenier公式:动态最优传输的计算流体力学解法
  • 区别:本文是跟踪控制问题,而非状态转移问题

群体控制

  • 覆盖控制:基于Voronoi图的分布式方法
  • 形状控制:多智能体系统的几何控制
  • 自交互系统:平均场理论在群体控制中的应用

多智能体分配

  • 时空匹配:动态环境中的在线分配算法
  • 分布式决策:去中心化的任务分配方法

结论与讨论

主要结论

  1. 理论突破:首次实现了二类连续体群体最优控制问题的解析求解
  2. 几何洞察:揭示了最优解的Wasserstein几何结构
  3. 计算优势:分位函数变换显著简化了计算复杂度

局限性

  1. 维数限制:当前结果仅适用于一维空间
  2. 因果性:需要预知整个需求信号,限制了实时应用
  3. 质量守恒:假设总质量恒定,实际应用中可能需要放宽
  4. 集中式控制:未考虑分布式实现的通信和计算约束

未来方向

  1. 高维推广:扩展到二维和三维空间
  2. 因果化:开发基于模型预测控制的因果解
  3. 非平衡传输:考虑质量可变的情况
  4. 分布式实现:设计通信高效的分布式算法
  5. 数值方法:开发针对高维情况的数值求解器

深度评价

优点

  1. 理论创新性
    • 分位函数变换的巧妙应用实现了复杂问题的解耦
    • 建立了最优传输与最优控制的新联系
    • 提供了罕见的显式解析解
  2. 数学严谨性
    • 完整的理论推导和证明
    • 清晰的问题变换链条
    • 严格的约束处理
  3. 洞察深度
    • 揭示了问题的几何本质
    • 提供了性能限制的清晰刻画
    • 建立了频域解释
  4. 应用相关性
    • 问题建模贴近实际应用场景
    • 为边缘计算等新兴领域提供理论基础

不足

  1. 适用范围有限
    • 仅限于一维情况,高维推广非平凡
    • 需要预知需求信号,实用性受限
  2. 实验验证不足
    • 缺乏与实际基准方法的对比
    • 数值示例规模较小
    • 未验证大规模场景的计算效率
  3. 实现细节缺失
    • 分布式实现方案不明确
    • 通信复杂度分析缺失
    • 鲁棒性分析不足

影响力评估

  1. 理论贡献:为连续体群体控制领域提供了重要的理论工具
  2. 方法论价值:分位函数变换技术可能启发其他相关问题的求解
  3. 应用潜力:为无人机群、机器人群等实际系统提供控制理论基础
  4. 后续研究:为高维情况和实时算法的研究奠定基础

适用场景

  1. 一维部署:沿高速公路、边界线的智能体部署
  2. 离线规划:需求模式已知的长期规划问题
  3. 理论分析:作为更复杂算法的性能基准
  4. 教学研究:最优控制与最优传输理论的交叉研究

参考文献

论文引用了41篇相关文献,主要包括:

  • 最优传输理论经典文献(Santambrogio, Benamou-Brenier等)
  • 群体控制相关工作(Fornasier, Bonnet等)
  • 多智能体系统文献(Bandyopadhyaay, Krishnan等)
  • 边缘计算应用文献(He, Yang等)

总体评价:这是一篇在理论上具有重要贡献的论文,通过巧妙的数学变换解决了一个具有挑战性的无穷维最优控制问题。虽然在维数和实用性方面存在限制,但为相关领域的理论发展提供了重要基础,具有较高的学术价值和潜在应用前景。