2025-11-13T08:28:10.831761

Optimal Control with Lyapunov Stability Guarantees for Space Applications

Abhijeet, Mohamed, Sharma et al.

This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.

academic

Controllo Ottimale con Garanzie di Stabilità di Lyapunov per Applicazioni Spaziali

Informazioni Fondamentali

ID Articolo: 2510.08854
Titolo: Optimal Control with Lyapunov Stability Guarantees for Space Applications
Autori: Abhijeet, Mohamed Naveed Gul Mohamed, Aayushman Sharma, Suman Chakravorty (Texas A&M University)
Classificazione: math.OC (Ottimizzazione e Controllo), cs.SY (Sistemi e Controllo), eess.SY (Sistemi e Controllo)
Data di Pubblicazione: 9 ottobre 2025
Link Articolo: https://arxiv.org/abs/2510.08854v1

Riassunto

Questo articolo affronta il problema del controllo ottimale (OCP) su orizzonte temporale infinito per applicazioni spaziali con dinamiche non lineari. Il metodo proposto decompone il problema in due fasi: un OCP su orizzonte finito con costo terminale regolarizzato, che guida il sistema verso un insieme terminale; e una fase di regolazione lineare su orizzonte infinito all'interno di tale insieme. La strategia garantisce la stabilità asintotica globale sotto specifiche ipotesi. Il metodo mantiene la dinamica completamente non lineare del sistema prima di raggiungere l'insieme terminale, quindi linearizza la dinamica del sistema. Con la convergenza dell'insieme terminale all'origine, la differenza di costo ottimale risultante tende a zero, garantendo una soluzione efficiente e stabile. Il metodo è verificato mediante simulazioni di tre problemi: controllo dell'assetto di veicoli spaziali, manovre di rendezvous e allunaggio controllato.

Contesto di Ricerca e Motivazione

Contesto del Problema

Sfide di controllo nelle missioni spaziali: L'esplorazione spaziale richiede strategie di controllo avanzate per garantire il successo della missione, dall'orientamento preciso del veicolo spaziale alle manovre delicate di attracco e allunaggio, superando le sfide intrinseche dell'ambiente spaziale.
Limitazioni dei metodi tradizionali:
- Metodo del Tiro (Shooting Method): Efficace nel controllo dell'assetto e nell'ottimizzazione di traiettorie, ma poco adattabile e sensibile alle ipotesi iniziali
- Metodi Diretti (SQP, Punto Interno): Capaci di gestire vincoli, ma non garantiscono stabilità asintotica globale né forniscono retroazione
- Apprendimento per Rinforzo (RL): Fortemente dipendente dai dati, con risultati incoerenti
Esigenza di stabilità a lungo termine: Le missioni spaziali richiedono che il sistema possa raggiungere uno stato terminale specifico da qualsiasi condizione iniziale, rendendo la stabilità asintotica globale particolarmente preziosa per le missioni spaziali.

Motivazione della Ricerca

Affrontando le limitazioni dei metodi esistenti nella risoluzione di problemi di controllo ottimale e la necessità di stabilità a lungo termine, questo articolo riformula il problema come OCP su orizzonte infinito, adottando un approccio trattabile che garantisce retroazione e stabilità asintotica globale.

Contributi Principali

Propone un nuovo framework per la risoluzione del controllo ottimale non lineare su orizzonte infinito: Decompone il problema su orizzonte infinito in un OCP non lineare su orizzonte finito e regolazione lineare in due fasi
Stabilisce garanzie teoriche: Dimostra che il metodo proposto soddisfa l'equazione di Bellman, fornisce una funzione di Lyapunov di controllo (CLF) e garantisce la stabilità asintotica globale
Sviluppa algoritmi pratici: Combina il metodo ibrido del Regolatore Lineare Quadratico Iterativo (iLQR) e del Regolatore Lineare Quadratico (LQR)
Verifica l'efficacia del metodo: Convalida il metodo in tre applicazioni spaziali critiche: controllo dell'assetto di veicoli spaziali, manovre di rendezvous e allunaggio controllato
Fornisce analisi di convergenza: Dimostra che quando il parametro dell'insieme terminale M→0, il costo dell'OCP di costruzione alternativa (AC-OCP) converge al costo reale dell'OCP su orizzonte infinito

Dettagli del Metodo

Definizione del Compito

Problema di controllo ottimale su orizzonte infinito definito come:

J*∞(x) = min{ut} Σ(t=0 to ∞) c(xt, ut); dato x0 = x
soggetto a: xt+1 = f(xt, ut)

dove:

xt ∈ Rn: vettore di stato del sistema
ut ∈ Rp: ingresso di controllo
c(xt, ut): funzione di costo incrementale

Architettura del Modello

1. Problema di Controllo Ottimale di Costruzione Alternativa (AC-OCP)

Converte il problema su orizzonte infinito in:

JM∞(x) = min{ut}(T-1, t=0), T [Σ(t=0 to T-1) c(xt, ut) + max(J̄∞(xT), M)]
soggetto a: xt+1 = f(xt, ut), xT ∈ ΩM

dove ΩM = {x | J̄∞(x) ≤ M} è l'insieme terminale.

2. Strategia di Risoluzione in Due Fasi

Prima Fase: OCP Non Lineare su Orizzonte Finito

Utilizza iLQR per risolvere il problema su orizzonte finito:

JT∞(x) = min{ut}(T-1, t=0) [Σ(t=0 to T-1) c(xt, ut) + J̄∞(xT)]

Seconda Fase: Regolazione Lineare

Utilizza il controllore LQR all'interno dell'insieme terminale ΩM
Linearizza il sistema: J̄∞(x) = xTP∞x, dove P∞ è la soluzione dell'equazione di Riccati in stato stazionario

3. Implementazione dell'Algoritmo iLQR

Propagazione in Avanti:

uk+1_t = uk_t + αkt + Kt(xk+1_t - xk_t)
xk+1_t+1 = f(xk+1_t, uk+1_t)

Propagazione all'Indietro: Calcola le derivate parziali della funzione Q e aggiorna i guadagni:

kt = -Q^(-1)_utut * Qut
Kt = -Q^(-1)_utut * Qutxt

Punti di Innovazione Tecnica

Ottimizzazione del Tempo Terminale Libero: Ottimizza il tempo di trasferimento T per garantire una transizione fluida verso l'insieme terminale
Optimalità Asintotica: Dimostra che limM→0 JM∞(x) = J*∞(x)
Garanzie di Stabilità: La funzione di costo dell'AC-OCP soddisfa l'equazione di Bellman, fungendo da CLF per garantire la stabilità asintotica globale
Gestione della Dinamica Ibrida: Mantiene la dinamica completamente non lineare al di fuori dell'insieme terminale, linearizza all'interno dell'insieme terminale

Configurazione Sperimentale

Scenari di Applicazione

L'articolo verifica il metodo in tre applicazioni spaziali critiche:

Controllo dell'Assetto di Veicoli Spaziali
Manovre di Rendezvous
Allunaggio Controllato

Dinamica del Sistema

1. Controllo dell'Assetto

Vettore di stato: ψ, θ, φ, ω1, ω2, ω3T

Dinamica degli angoli di Eulero e dinamica della velocità angolare
Matrice dei momenti di inerzia: J = diag4500, 2000, 7500
Orizzonte temporale: 200 secondi, passo di discretizzazione: 0,1 secondi

2. Manovre di Rendezvous

Lo stato include errore di posizione relativa er, errore di velocità relativa ev e massa m

Dinamica orbitale ellittica
Orizzonte temporale: 6000 secondi, passo di discretizzazione: 2 secondi

3. Allunaggio Controllato

Combina dinamica dell'assetto e della posizione

Gravità marziana: gref = 0, 0, -3.7114T
Include variazione di massa e vincoli di spinta
Orizzonte temporale: 30 secondi, passo di discretizzazione: 0,2 secondi

Metriche di Valutazione

Funzione di costo totale: costo quadratico c(x,u) = ½(xTQx + uTRu)
Errore di stato terminale
Fluidità dell'ingresso di controllo
Analisi di convergenza

Risultati Sperimentali

Risultati Principali

1. Controllo dell'Assetto

Effetto del Tempo di Trasferimento: Da 10 secondi a 80 secondi, il costo totale diminuisce da 6,45×10^5 a 5,20×10^5
Convergenza dello Stato:
- Trasferimento di 10 secondi: errore terminale 34,86°, -33,19°, -36,71°, 2,79°/s, 6,02°/s, 0,97°/s
- Trasferimento di 80 secondi: errore terminale -0,77°, -0,15°, 0,55°, -0,05°/s, 0,02°/s, -0,05°/s

2. Manovre di Rendezvous

Riduzione del Costo con Tempo di Trasferimento: Tempi di trasferimento più lunghi determinano costi inferiori e errori più piccoli
Confronto dello Stato Terminale:
- 600 secondi: errore di posizione ~1400 km, errore di velocità ~5000 m/s
- 2400 secondi: errore di posizione ~1 m, errore di velocità ~2 m/s

3. Allunaggio Controllato

Allunaggio Riuscito: r3=0 (allunaggio) a 29,9 secondi
Precisione Terminale: errore di posizione -0,06 m, -0,03 m, 1,09 m, errore di velocità -0,007 m/s, -0,008 m/s, -0,99 m/s
Gestione dei Vincoli: Gestisce i vincoli di altitudine attraverso funzioni di penalità esponenziale

Risultati Chiave

Importanza dell'Ottimizzazione del Tempo di Trasferimento: Tempi di trasferimento più lunghi consentono al sistema di linearizzarsi più vicino all'origine, riducendo significativamente il costo di regolazione
Transizione Fluida: Un tempo di trasferimento appropriato evita cambiamenti bruschi negli ingressi di controllo
Robustezza: Il metodo funziona bene in diverse condizioni iniziali e parametri di sistema

Lavori Correlati

Principali Direzioni di Ricerca

Metodi di Controllo Ottimale Tradizionali: Metodo del tiro, metodi diretti (SQP, metodo del punto interno)
Metodi Moderni: Apprendimento per rinforzo, controllo predittivo del modello
Teoria della Stabilità: Metodo di Lyapunov, funzioni di Lyapunov di controllo

Vantaggi di Questo Articolo

Rispetto al metodo del tiro: fornisce controllo con retroazione e migliore robustezza
Rispetto ai metodi diretti: garantisce stabilità asintotica globale
Rispetto all'apprendimento per rinforzo: garanzie teoriche e risultati deterministici

Conclusioni e Discussione

Conclusioni Principali

Contributo Teorico: Stabilisce un framework trattabile per la risoluzione dell'OCP non lineare su orizzonte infinito
Valore Pratico: Verifica l'efficacia del metodo in applicazioni spaziali critiche
Garanzie di Stabilità: Fornisce garanzie teoriche di stabilità asintotica globale

Limitazioni

Limitazioni della Linearizzazione: La linearizzazione di alcuni sistemi (come i sistemi non olonomi) potrebbe non essere controllabile
Gestione dei Vincoli: I vincoli rigidi devono essere convertiti in vincoli morbidi (come il vincolo di altitudine nell'allunaggio controllato)
Complessità Computazionale: Richiede l'ottimizzazione del tempo di trasferimento, aumentando l'onere computazionale

Direzioni Future

Estensione a Vincoli Più Complessi: Gestire vincoli di percorso e sistemi ibridi
Implementazione in Tempo Reale: Sviluppare algoritmi veloci adatti per applicazioni online
Miglioramento della Robustezza: Considerare incertezze di modello e perturbazioni esterne

Valutazione Approfondita

Punti di Forza

Rigore Teorico: Fornisce un framework matematico completo e prove di convergenza
Forte Praticità: Verifica il metodo in tre diverse applicazioni spaziali
Innovatività: Combina abilmente i vantaggi dei metodi su orizzonte finito e infinito
Garanzie di Stabilità: Garantisce la stabilità asintotica globale attraverso CLF

Insufficienze

Condizioni di Ipotesi: Dipende dalla controllabilità del sistema e da proprietà specifiche della funzione di costo
Regolazione dei Parametri: La scelta del parametro dell'insieme terminale M manca di linee guida esplicite
Efficienza Computazionale: L'ottimizzazione del tempo di trasferimento potrebbe richiedere più iterazioni di risoluzione

Impatto

Valore Accademico: Fornisce un nuovo framework teorico per il controllo non lineare su orizzonte infinito
Significato Ingegneristico: Fornisce un metodo di progettazione pratico per il controllo di missioni spaziali
Estensibilità: Il metodo può essere generalizzato ad altri problemi di controllo che richiedono stabilità a lungo termine

Scenari Applicabili

Missioni spaziali di lunga durata
Sistemi di controllo che richiedono garanzie di stabilità globale
Sistemi complessi con dinamiche non lineari
Missioni critiche con requisiti di sicurezza estremi

Bibliografia

L'articolo cita 23 riferimenti correlati, coprendo importanti lavori nei campi della teoria del controllo ottimale, controllo di veicoli spaziali e metodi di ottimizzazione numerica, fornendo una base teorica solida per la ricerca.

Valutazione Complessiva: Questo è un articolo di alta qualità con importanti contributi sia dal punto di vista teorico che applicativo. Gli autori convertono abilmente il problema su orizzonte infinito in un problema trattabile su orizzonte finito, mantenendo al contempo le garanzie di stabilità. La verifica in tre importanti applicazioni spaziali dimostra il valore pratico del metodo. Nonostante alcune limitazioni, nel complesso fornisce strumenti teorici e metodi pratici preziosi per il campo del controllo spaziale.