We consider optimal swarm control problems where two different classes of agents are present. Continuum idealizations of large-scale swarms are used where the dynamics describe the evolution of the spatially-distributed densities of each agent class. The problem formulation we adopt is motivated by applications where agents of one class are assigned to agents of the other class, which we refer to as demand and resource agents respectively. Assignments have costs related to the distances between mutually assigned agents, and the overall cost of an assignment is quantified by a Wasserstein distance between the densities of the two agent classes. When agents can move, the assignment cost can decrease at the expense of a physical motion cost, and this tradeoff sets up a nonlinear infinite-dimensional optimal control problem. We show that in one spatial dimension, this problem can be converted to an infinite-dimensional, but decoupled, linear-quadratic (LQ) tracking problem when expressed in terms of the quantile functions of the respective agent densities. Solutions are given in the general one-dimensional case, as well as in the special cases of constant and periodically time-varying demands.
- ID статьи: 2407.18159
- Название: Optimal Assignment and Motion Control in Two-Class Continuum Swarms
- Авторы: Max Emerick, Stacy Patterson, Bassam Bamieh
- Классификация: eess.SY (системы и управление), cs.SY (системы и управление), math.OC (оптимизация и управление)
- Дата публикации/конференция: Подана 24 июля 2024 г., пересмотрена 10 октября 2025 г.
- Ссылка на статью: https://arxiv.org/abs/2407.18159
В данной работе исследуется задача оптимального управления роем, содержащим два класса различных агентов. Используется континуальная идеализация крупномасштабного роя, где динамика описывает эволюцию пространственного распределения плотности каждого класса агентов. Постановка задачи вдохновлена приложениями, в которых один класс агентов должен быть распределен другому классу, называемых соответственно агентами спроса и агентами ресурсов. Стоимость распределения связана с расстоянием между взаимно распределяемыми агентами, а общая стоимость распределения квантифицируется расстоянием Вассерштейна между плотностями двух классов агентов. Когда агенты могут двигаться, стоимость распределения может быть снижена, но за счет физических затрат на движение, что создает нелинейную бесконечномерную задачу оптимального управления. Показано, что в одномерном случае задача может быть преобразована в бесконечномерную, но разделяемую линейно-квадратичную (LQ) задачу отслеживания при выражении через квантильные функции плотностей агентов. Приводятся решения для общего одномерного случая, а также для частных случаев постоянного и периодически изменяющегося спроса.
С развитием недорогих датчиков, вычислительных и коммуникационных устройств автономные робототехнические рои находят широкое применение в экстренном реагировании, транспортировке, логистике, сборе данных и обороне. Крупномасштабные рои обладают значительными преимуществами в эффективности и надежности, однако с увеличением размера роя планирование движения и координация между агентами становятся все более сложными.
Математическая модель в статье вдохновлена приложениями в области периферийных вычислений и мобильных облачных вычислений:
- Агенты спроса: легкие устройства (например, беспилотные летательные аппараты с камерами), с ограниченными вычислительными и запоминающими возможностями, но высокой мобильностью
- Агенты ресурсов: тяжелое оборудование (например, серверы мобильных периферийных вычислений), с мощными вычислительными возможностями, но низкой мобильностью
- Типичное применение: видеомониторинг при ликвидации стихийных бедствий, где агенты спроса отвечают за сбор данных, а агенты ресурсов — за обработку данных
- Проблемы масштабируемости: традиционное дискретное моделирование агентов имеет чрезмерную вычислительную сложность в крупномасштабных роях
- Преимущества континуума: моделирование роя как распределения плотности значительно снижает сложность модели и обеспечивает макроскопическое понимание поведения
- Связь распределения и движения: необходимо одновременно оптимизировать распределение задач и физическое движение, что создает фундаментальный компромисс
- Теоретический пробел: существующие исследования не содержат систематического теоретического анализа таких связанных задач
- Новая постановка задачи: впервые объединены динамическое согласование и пространственно-временное управление, установлена модель оптимального управления континуальным роем с двумя классами агентов
- Прорыв в математическом преобразовании: обнаружено, что в одномерном случае нелинейная бесконечномерная задача может быть преобразована в разделяемую линейно-квадратичную задачу отслеживания через преобразование квантильных функций
- Построение аналитического решения: предоставлены явные аналитические решения для общего одномерного случая, что крайне редко встречается в таких задачах
- Углубленный анализ частных случаев:
- Статический спрос: решение следует геодезической Вассерштейна, но временное расписание определяется задачей оптимального управления
- Периодический спрос: решение может быть представлено как отфильтрованная версия сигнала отслеживания
- Теоретические прозрения: раскрыта геометрическая структура оптимального решения и сущность ограничений производительности
Для заданного начального распределения ресурсов R0 и временно-зависимого распределения спроса Dt, решить на временном интервале [0,T]:
minR,V∫0T(W22(Rt,Dt)+α2∫Ω∥Vt(x)∥22Rt(x)dx)dt
при ограничении: ∂tRt(x)=−∇⋅(Rt(x)Vt(x))
где:
- W22(Rt,Dt): квадрат 2-расстояния Вассерштейна, квантифицирующее стоимость распределения
- Vt(x): поле скоростей (переменная управления)
- α>0: параметр компромисса
- Распределение спроса Dt(x): содержит непрерывную и дискретную части
- Распределение ресурсов Rt(x): также содержит непрерывную и дискретную части
- План распределения Kt(x,y): двумерное распределение, удовлетворяющее маргинальным ограничениям
- Динамика ресурсов: уравнение непрерывности в частных производных
- Целевая функция производительности: компромисс между стоимостью распределения и стоимостью движения
Преобразование квантильной функции: для одномерной плотности μ определяется
- Функция кумулятивного распределения: Fμ(x)=∫−∞xμ(ξ)dξ
- Квантильная функция: Qμ(z)=inf{x:Fμ(x)≥z}
Ключевая лемма: в одномерном случае 2-расстояние Вассерштейна может быть представлено как
W22(μ,ν)=∫01(Qν(z)−Qμ(z))2dz
Исходная билинейная динамика:
∂tR(x,t)=−∂x(V(x,t)R(x,t))
Эквивалентная динамика квантильной функции:
∂tQR(z,t)=U(z,t)
где U(z,t)=V(QR(z,t),t)
Обнаружено существование изометрического отображения между пространством квантильных функций L2 и пространством плотностей 2-Вассерштейна, что превращает сложную задачу оптимального транспорта в простую задачу L2 в пространстве квантильных функций.
Посредством техники разбиения множеств уровня бесконечномерная LQ-задача отслеживания разлагается на бесконечное число независимых скалярных LQ-задач отслеживания:
minri,ui∫0T((ri(t)−di(t))2+α2ui2(t))dt
при ограничении: r˙i(t)=ui(t)
Оптимальное управление для скалярной задачи имеет структуру обратной связи-прямой передачи:
ui(t)=−α21(p(t)ri(t)+yi(t))
где:
- Коэффициент обратной связи: p(t)=αtanh((T−t)/α)
- Компонента прямой передачи: yi(t)=∫tTϕy(t,τ)di(τ)dτ
Статья в основном использует теоретический анализ и численные примеры для проверки эффективности метода, а не крупномасштабную экспериментальную оценку.
- Распределение ресурсов: 11 дискретных агентов с неравными массами
- Распределение спроса: непрерывное статическое распределение
- Параметры: α=2, T=10
- Функция спроса: гауссова смешанная модель
D(x,t)=(1+sin(2πt))N(2.5,1)+(1−sin(2πt))N(7.5,1)
- Вариация параметров: α∈{0.08,1,>1}
- Значение оптимальной целевой функции
- Сходимость траектории: степень приближения распределения ресурсов к распределению спроса
- Геометрические свойства: проверка того, следует ли решение геодезической Вассерштейна
- Геометрическая структура: оптимальная траектория в пространстве квантильных функций является прямой линией, соответствующей геодезической Вассерштейна в пространстве плотностей
- Временное расписание: в отличие от классического динамического оптимального транспорта с постоянной скоростью, здесь скорость определяется ϕr(t,0)
- Разложение стоимости:
J=W22(R0,Dˉ)αtanh(T/α)+TW22(D,Dˉ)
- Интерпретация в частотной области: оптимальное решение может быть интерпретировано как сигнал спроса, пропущенный через фильтр нижних частот с частотой среза 1/α
- Фазовый отклик: благодаря некаузальному компоненту прямой передачи состояние полностью синфазно с опорным сигналом
- Частотная селективность: при увеличении α система в основном отслеживает низкочастотные компоненты спроса
- Ограничения производительности: существует фундаментальный нижний предел производительности K, зависящий только от параметров задачи
- Достижимость: Dˉ представляет распределение, ближайшее к D, достижимое из начального условия R0
- Механизм компромисса: параметр α эффективно управляет компромиссом между точностью отслеживания и стоимостью движения
- Формула Бенаму-Бренье: вычислительный метод гидродинамики для динамического оптимального транспорта
- Отличие: данная работа является задачей управления отслеживанием, а не задачей передачи состояния
- Управление покрытием: распределенные методы на основе диаграмм Вороного
- Управление формой: геометрическое управление многоагентными системами
- Самовзаимодействующие системы: применение теории среднего поля в управлении роями
- Пространственно-временное согласование: алгоритмы онлайн-распределения в динамических средах
- Распределенное принятие решений: децентрализованные методы распределения задач
- Теоретический прорыв: впервые достигнуто аналитическое решение задачи оптимального управления двухклассным континуальным роем
- Геометрические прозрения: раскрыта геометрическая структура оптимального решения в смысле Вассерштейна
- Вычислительные преимущества: преобразование квантильных функций значительно упрощает вычислительную сложность
- Ограничение по размерности: текущие результаты применимы только к одномерному пространству
- Причинность: требуется предварительное знание всего сигнала спроса, что ограничивает приложения в реальном времени
- Сохранение массы: предполагается постоянство общей массы, что может потребовать ослабления в практических приложениях
- Централизованное управление: не рассматриваются ограничения связи и вычислений при распределенной реализации
- Обобщение на высшие размерности: расширение на двумерное и трехмерное пространство
- Причинность: разработка причинных решений на основе модельного прогностического управления
- Несбалансированный транспорт: рассмотрение случаев с переменной массой
- Распределенная реализация: разработка алгоритмов с эффективной коммуникацией
- Численные методы: разработка численных решателей для высокомерных случаев
- Теоретическая инновативность:
- Умелое применение преобразования квантильных функций для разделения сложной задачи
- Установление новой связи между оптимальным транспортом и оптимальным управлением
- Предоставление редких явных аналитических решений
- Математическая строгость:
- Полные теоретические выводы и доказательства
- Четкая цепочка преобразований задачи
- Строгая обработка ограничений
- Глубина прозрений:
- Раскрытие геометрической сущности задачи
- Четкая характеристика ограничений производительности
- Установление частотной интерпретации
- Релевантность приложений:
- Постановка задачи близка к практическим сценариям
- Предоставление теоретической основы для новых областей, таких как периферийные вычисления
- Ограниченная область применения:
- Ограничение одномерным случаем, обобщение на высшие размерности нетривиально
- Требование предварительного знания сигнала спроса ограничивает практическую применимость
- Недостаточная экспериментальная верификация:
- Отсутствие сравнения с практическими эталонными методами
- Небольшой масштаб численных примеров
- Отсутствие верификации вычислительной эффективности в крупномасштабных сценариях
- Отсутствие деталей реализации:
- Неясны схемы распределенной реализации
- Отсутствует анализ сложности коммуникации
- Недостаточен анализ робастности
- Теоретический вклад: предоставление важного теоретического инструмента для области управления континуальными роями
- Методологическая ценность: техника преобразования квантильных функций может вдохновить решение других связанных задач
- Потенциал приложений: предоставление теоретической основы управления для практических систем, таких как рои беспилотников и робототехнические рои
- Последующие исследования: создание основы для исследований высокомерных случаев и алгоритмов реального времени
- Одномерное развертывание: развертывание агентов вдоль автомагистралей, границ
- Автономное планирование: долгосрочные задачи планирования с известными моделями спроса
- Теоретический анализ: использование в качестве эталона производительности для более сложных алгоритмов
- Преподавание и исследования: междисциплинарные исследования теории оптимального управления и оптимального транспорта
Статья цитирует 41 связанную работу, включая в основном:
- Классические работы по теории оптимального транспорта (Santambrogio, Benamou-Brenier и др.)
- Связанные работы по управлению роями (Fornasier, Bonnet и др.)
- Литературу по многоагентным системам (Bandyopadhyaay, Krishnan и др.)
- Литературу по приложениям периферийных вычислений (He, Yang и др.)
Общая оценка: Это статья с важным теоретическим вкладом, которая посредством умелого математического преобразования решает сложную бесконечномерную задачу оптимального управления. Хотя существуют ограничения по размерности и практической применимости, она предоставляет важную основу для теоретического развития соответствующих областей и обладает высокой академической ценностью и потенциалом приложений.