Optimal Control with Lyapunov Stability Guarantees for Space Applications
Abhijeet, Mohamed, Sharma et al.
This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.
academic
Control Óptimo con Garantías de Estabilidad de Lyapunov para Aplicaciones Espaciales
Este artículo investiga el problema de control óptimo en horizonte infinito (OCP) para aplicaciones espaciales con dinámicas no lineales. El método propuesto descompone el problema en dos fases: un OCP en horizonte finito con costo terminal regularizado que guía el sistema hacia un conjunto terminal, y una fase de regulación lineal en horizonte infinito dentro de ese conjunto. La estrategia garantiza estabilidad asintótica global bajo ciertos supuestos. El método mantiene la dinámica completamente no lineal del sistema antes de alcanzar el conjunto terminal, y luego linealiza la dinámica del sistema. Conforme el conjunto terminal converge al origen, la diferencia de costo óptimo resultante tiende a cero, garantizando una solución eficiente y estable. El método se valida mediante simulaciones de tres problemas: control de actitud de naves espaciales, maniobras de encuentro y aterrizaje suave.
Desafíos de Control en Misiones Espaciales: La exploración espacial requiere estrategias de control avanzadas para garantizar el éxito de las misiones, desde la orientación precisa de naves espaciales hasta maniobras finas de acoplamiento y aterrizaje, superando los desafíos inherentes del entorno espacial.
Limitaciones de Métodos Tradicionales:
Método de Disparo (Shooting Method): Efectivo en control de actitud y optimización de trayectorias, pero con poca adaptabilidad y sensibilidad a conjeturas iniciales
Métodos Directos (SQP, Punto Interior): Pueden manejar restricciones, pero no garantizan estabilidad asintótica global ni proporcionan retroalimentación
Aprendizaje por Refuerzo (RL): Alta dependencia de datos, resultados inconsistentes
Requisitos de Estabilidad a Largo Plazo: Las misiones espaciales requieren que el sistema pueda alcanzar un estado terminal específico desde cualquier estado inicial arbitrario, lo que hace que la estabilidad asintótica global sea particularmente valiosa para misiones espaciales.
Ante las limitaciones de los métodos existentes para resolver problemas de control óptimo y la necesidad de estabilidad a largo plazo, este artículo reformula el problema como un OCP en horizonte infinito, adoptando un enfoque manejable que asegure retroalimentación y garantice estabilidad asintótica global.
Propone un nuevo marco de resolución para control óptimo no lineal en horizonte infinito: Descompone el problema en horizonte infinito en un OCP no lineal en horizonte finito y regulación lineal en dos fases
Establece garantías teóricas: Demuestra que el método propuesto satisface la ecuación de Bellman, proporciona una función de Lyapunov de control (CLF) y garantiza estabilidad asintótica global
Desarrolla un algoritmo práctico: Método híbrido que combina el regulador lineal cuadrático iterativo (iLQR) y el regulador lineal cuadrático (LQR)
Valida la efectividad del método: Verifica el método en tres aplicaciones espaciales clave: control de actitud de naves espaciales, maniobras de encuentro y aterrizaje suave
Proporciona análisis de convergencia: Demuestra que cuando el parámetro del conjunto terminal M→0, el costo del OCP de construcción alternativa (AC-OCP) converge al costo real del OCP en horizonte infinito
Optimización de Tiempo Terminal Libre: Optimiza el tiempo de transferencia T para asegurar una transición suave al conjunto terminal
Optimalidad Asintótica: Demuestra que limM→0 JM∞(x) = J*∞(x)
Garantía de Estabilidad: La función de costo del AC-OCP satisface la ecuación de Bellman, actuando como CLF para garantizar estabilidad asintótica global
Manejo de Dinámicas Híbridas: Mantiene la dinámica completamente no lineal fuera del conjunto terminal, con linealización dentro del conjunto terminal
Importancia de la Optimización del Tiempo de Transferencia: Tiempos de transferencia más largos permiten que el sistema se linealice más cerca del origen, reduciendo significativamente el costo de regulación
Transición Suave: Un tiempo de transferencia apropiado evita cambios abruptos en la entrada de control
Robustez: El método muestra buen desempeño bajo diferentes condiciones iniciales y parámetros del sistema
El artículo cita 23 referencias relacionadas, abarcando trabajos importantes en teoría de control óptimo, control de naves espaciales, métodos de optimización numérica y otros campos, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo de alta calidad con contribuciones importantes tanto en teoría como en aplicaciones. Los autores convierten ingeniosamente el problema en horizonte infinito en un problema manejable en horizonte finito, mientras garantizan estabilidad. La validación en tres aplicaciones espaciales importantes demuestra el valor práctico del método. A pesar de algunas limitaciones, en general proporciona herramientas teóricas y métodos prácticos valiosos para el campo del control espacial.