Optimal Control with Lyapunov Stability Guarantees for Space Applications
Abhijeet, Mohamed, Sharma et al.
This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.
academic
Controllo Ottimale con Garanzie di Stabilità di Lyapunov per Applicazioni Spaziali
Questo articolo affronta il problema del controllo ottimale (OCP) su orizzonte temporale infinito per applicazioni spaziali con dinamiche non lineari. Il metodo proposto decompone il problema in due fasi: un OCP su orizzonte finito con costo terminale regolarizzato, che guida il sistema verso un insieme terminale; e una fase di regolazione lineare su orizzonte infinito all'interno di tale insieme. La strategia garantisce la stabilità asintotica globale sotto specifiche ipotesi. Il metodo mantiene la dinamica completamente non lineare del sistema prima di raggiungere l'insieme terminale, quindi linearizza la dinamica del sistema. Con la convergenza dell'insieme terminale all'origine, la differenza di costo ottimale risultante tende a zero, garantendo una soluzione efficiente e stabile. Il metodo è verificato mediante simulazioni di tre problemi: controllo dell'assetto di veicoli spaziali, manovre di rendezvous e allunaggio controllato.
Sfide di controllo nelle missioni spaziali: L'esplorazione spaziale richiede strategie di controllo avanzate per garantire il successo della missione, dall'orientamento preciso del veicolo spaziale alle manovre delicate di attracco e allunaggio, superando le sfide intrinseche dell'ambiente spaziale.
Limitazioni dei metodi tradizionali:
Metodo del Tiro (Shooting Method): Efficace nel controllo dell'assetto e nell'ottimizzazione di traiettorie, ma poco adattabile e sensibile alle ipotesi iniziali
Metodi Diretti (SQP, Punto Interno): Capaci di gestire vincoli, ma non garantiscono stabilità asintotica globale né forniscono retroazione
Apprendimento per Rinforzo (RL): Fortemente dipendente dai dati, con risultati incoerenti
Esigenza di stabilità a lungo termine: Le missioni spaziali richiedono che il sistema possa raggiungere uno stato terminale specifico da qualsiasi condizione iniziale, rendendo la stabilità asintotica globale particolarmente preziosa per le missioni spaziali.
Affrontando le limitazioni dei metodi esistenti nella risoluzione di problemi di controllo ottimale e la necessità di stabilità a lungo termine, questo articolo riformula il problema come OCP su orizzonte infinito, adottando un approccio trattabile che garantisce retroazione e stabilità asintotica globale.
Propone un nuovo framework per la risoluzione del controllo ottimale non lineare su orizzonte infinito: Decompone il problema su orizzonte infinito in un OCP non lineare su orizzonte finito e regolazione lineare in due fasi
Stabilisce garanzie teoriche: Dimostra che il metodo proposto soddisfa l'equazione di Bellman, fornisce una funzione di Lyapunov di controllo (CLF) e garantisce la stabilità asintotica globale
Sviluppa algoritmi pratici: Combina il metodo ibrido del Regolatore Lineare Quadratico Iterativo (iLQR) e del Regolatore Lineare Quadratico (LQR)
Verifica l'efficacia del metodo: Convalida il metodo in tre applicazioni spaziali critiche: controllo dell'assetto di veicoli spaziali, manovre di rendezvous e allunaggio controllato
Fornisce analisi di convergenza: Dimostra che quando il parametro dell'insieme terminale M→0, il costo dell'OCP di costruzione alternativa (AC-OCP) converge al costo reale dell'OCP su orizzonte infinito
Ottimizzazione del Tempo Terminale Libero: Ottimizza il tempo di trasferimento T per garantire una transizione fluida verso l'insieme terminale
Optimalità Asintotica: Dimostra che limM→0 JM∞(x) = J*∞(x)
Garanzie di Stabilità: La funzione di costo dell'AC-OCP soddisfa l'equazione di Bellman, fungendo da CLF per garantire la stabilità asintotica globale
Gestione della Dinamica Ibrida: Mantiene la dinamica completamente non lineare al di fuori dell'insieme terminale, linearizza all'interno dell'insieme terminale
Importanza dell'Ottimizzazione del Tempo di Trasferimento: Tempi di trasferimento più lunghi consentono al sistema di linearizzarsi più vicino all'origine, riducendo significativamente il costo di regolazione
Transizione Fluida: Un tempo di trasferimento appropriato evita cambiamenti bruschi negli ingressi di controllo
Robustezza: Il metodo funziona bene in diverse condizioni iniziali e parametri di sistema
L'articolo cita 23 riferimenti correlati, coprendo importanti lavori nei campi della teoria del controllo ottimale, controllo di veicoli spaziali e metodi di ottimizzazione numerica, fornendo una base teorica solida per la ricerca.
Valutazione Complessiva: Questo è un articolo di alta qualità con importanti contributi sia dal punto di vista teorico che applicativo. Gli autori convertono abilmente il problema su orizzonte infinito in un problema trattabile su orizzonte finito, mantenendo al contempo le garanzie di stabilità. La verifica in tre importanti applicazioni spaziali dimostra il valore pratico del metodo. Nonostante alcune limitazioni, nel complesso fornisce strumenti teorici e metodi pratici preziosi per il campo del controllo spaziale.