Optimal Control with Lyapunov Stability Guarantees for Space Applications
Abhijeet, Mohamed, Sharma et al.
This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.
academic
Оптимальное управление с гарантиями устойчивости Ляпунова для космических приложений
В данной работе исследуется задача оптимального управления (ОУ) на бесконечном временном горизонте для нелинейных динамических систем в космических приложениях. Предложенный метод разделяет задачу на два этапа: конечный горизонт ОУ с регуляризованной терминальной стоимостью, направляющий систему в терминальное множество, и бесконечный горизонт линейного регулирования внутри этого множества. Стратегия гарантирует глобальную асимптотическую устойчивость при определённых предположениях. Метод сохраняет полностью нелинейную динамику системы до достижения терминального множества, а затем линеаризует динамику. По мере сходимости терминального множества к началу координат разность оптимальных стоимостей стремится к нулю, гарантируя эффективное и устойчивое решение. Метод верифицирован на трёх задачах моделирования: управление ориентацией космического аппарата, манёвры сближения и мягкая посадка.
Задачи управления в космических миссиях: Космические исследования требуют передовых стратегий управления для обеспечения успеха миссии, от точной ориентации космического аппарата до тонких манёвров стыковки и посадки, требующих преодоления присущих вызовов космической среды.
Ограничения традиционных методов:
Метод стрельбы (Shooting Method): Эффективен в управлении ориентацией и оптимизации траектории, но обладает низкой адаптивностью и чувствителен к начальному приближению
Прямые методы (SQP, метод внутренней точки): Могут обрабатывать ограничения, но не гарантируют глобальную асимптотическую устойчивость или обратную связь
Обучение с подкреплением (RL): Зависит от данных, результаты непостоянны
Требование долгосрочной устойчивости: Космические миссии требуют, чтобы система могла переходить из произвольного начального состояния в определённое терминальное состояние, что делает глобальную асимптотическую устойчивость особенно ценной для космических задач.
В ответ на ограничения существующих методов при решении задач оптимального управления и требование долгосрочной устойчивости, в данной работе задача переформулируется как ОУ на бесконечном горизонте с применением управляемого подхода, обеспечивающего обратную связь и гарантирующего глобальную асимптотическую устойчивость.
Предложена новая схема решения нелинейного оптимального управления на бесконечном горизонте: Разложение задачи на бесконечного горизонта на конечный горизонт нелинейного ОУ и линейное регулирование
Установлены теоретические гарантии: Доказано, что предложенный метод удовлетворяет уравнению Беллмана, предоставляет функцию Ляпунова управления (CLF) и гарантирует глобальную асимптотическую устойчивость
Разработан практический алгоритм: Гибридный метод, сочетающий итеративный линейно-квадратичный регулятор (iLQR) и линейно-квадратичный регулятор (LQR)
Верифицирована эффективность метода: На трёх ключевых космических приложениях: управление ориентацией космического аппарата, манёвры сближения и мягкая посадка
Предоставлен анализ сходимости: Доказано, что при M→0 стоимость альтернативной конструкции ОУ (AC-OCP) сходится к стоимости истинного ОУ на бесконечном горизонте
Снижение стоимости с увеличением времени переходного процесса: Более длительное время переходного процесса приводит к более низкой стоимости и меньшей ошибке
Сравнение терминального состояния:
600 секунд: ошибка положения ~1400 км, ошибка скорости ~5000 м/с
2400 секунд: ошибка положения ~1 м, ошибка скорости ~2 м/с
Важность оптимизации времени переходного процесса: Более длительное время переходного процесса позволяет системе линеаризоваться ближе к началу координат, значительно снижая стоимость регулирования
Плавный переход: Надлежащее время переходного процесса избегает резких изменений управляющего воздействия
Робастность: Метод демонстрирует хорошие результаты при различных начальных условиях и параметрах системы
Статья цитирует 23 связанные работы, охватывающие теорию оптимального управления, управление космическими аппаратами, методы численной оптимизации и другие важные работы в этих областях, обеспечивая прочную теоретическую основу для исследования.
Общая оценка: Это высококачественная статья с важными вкладами как в теорию, так и в приложения. Авторы умело преобразовали задачу на бесконечном горизонте в управляемую задачу на конечном горизонте, сохраняя гарантии устойчивости. Верификация на трёх важных космических приложениях демонстрирует практическую ценность метода. Несмотря на некоторые ограничения, работа в целом предоставляет ценные теоретические инструменты и практические методы для области управления космическими аппаратами.