2025-11-13T08:28:10.831761

Optimal Control with Lyapunov Stability Guarantees for Space Applications

Abhijeet, Mohamed, Sharma et al.
This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.
academic

Controllo Ottimale con Garanzie di Stabilità di Lyapunov per Applicazioni Spaziali

Informazioni Fondamentali

  • ID Articolo: 2510.08854
  • Titolo: Optimal Control with Lyapunov Stability Guarantees for Space Applications
  • Autori: Abhijeet, Mohamed Naveed Gul Mohamed, Aayushman Sharma, Suman Chakravorty (Texas A&M University)
  • Classificazione: math.OC (Ottimizzazione e Controllo), cs.SY (Sistemi e Controllo), eess.SY (Sistemi e Controllo)
  • Data di Pubblicazione: 9 ottobre 2025
  • Link Articolo: https://arxiv.org/abs/2510.08854v1

Riassunto

Questo articolo affronta il problema del controllo ottimale (OCP) su orizzonte temporale infinito per applicazioni spaziali con dinamiche non lineari. Il metodo proposto decompone il problema in due fasi: un OCP su orizzonte finito con costo terminale regolarizzato, che guida il sistema verso un insieme terminale; e una fase di regolazione lineare su orizzonte infinito all'interno di tale insieme. La strategia garantisce la stabilità asintotica globale sotto specifiche ipotesi. Il metodo mantiene la dinamica completamente non lineare del sistema prima di raggiungere l'insieme terminale, quindi linearizza la dinamica del sistema. Con la convergenza dell'insieme terminale all'origine, la differenza di costo ottimale risultante tende a zero, garantendo una soluzione efficiente e stabile. Il metodo è verificato mediante simulazioni di tre problemi: controllo dell'assetto di veicoli spaziali, manovre di rendezvous e allunaggio controllato.

Contesto di Ricerca e Motivazione

Contesto del Problema

  1. Sfide di controllo nelle missioni spaziali: L'esplorazione spaziale richiede strategie di controllo avanzate per garantire il successo della missione, dall'orientamento preciso del veicolo spaziale alle manovre delicate di attracco e allunaggio, superando le sfide intrinseche dell'ambiente spaziale.
  2. Limitazioni dei metodi tradizionali:
    • Metodo del Tiro (Shooting Method): Efficace nel controllo dell'assetto e nell'ottimizzazione di traiettorie, ma poco adattabile e sensibile alle ipotesi iniziali
    • Metodi Diretti (SQP, Punto Interno): Capaci di gestire vincoli, ma non garantiscono stabilità asintotica globale né forniscono retroazione
    • Apprendimento per Rinforzo (RL): Fortemente dipendente dai dati, con risultati incoerenti
  3. Esigenza di stabilità a lungo termine: Le missioni spaziali richiedono che il sistema possa raggiungere uno stato terminale specifico da qualsiasi condizione iniziale, rendendo la stabilità asintotica globale particolarmente preziosa per le missioni spaziali.

Motivazione della Ricerca

Affrontando le limitazioni dei metodi esistenti nella risoluzione di problemi di controllo ottimale e la necessità di stabilità a lungo termine, questo articolo riformula il problema come OCP su orizzonte infinito, adottando un approccio trattabile che garantisce retroazione e stabilità asintotica globale.

Contributi Principali

  1. Propone un nuovo framework per la risoluzione del controllo ottimale non lineare su orizzonte infinito: Decompone il problema su orizzonte infinito in un OCP non lineare su orizzonte finito e regolazione lineare in due fasi
  2. Stabilisce garanzie teoriche: Dimostra che il metodo proposto soddisfa l'equazione di Bellman, fornisce una funzione di Lyapunov di controllo (CLF) e garantisce la stabilità asintotica globale
  3. Sviluppa algoritmi pratici: Combina il metodo ibrido del Regolatore Lineare Quadratico Iterativo (iLQR) e del Regolatore Lineare Quadratico (LQR)
  4. Verifica l'efficacia del metodo: Convalida il metodo in tre applicazioni spaziali critiche: controllo dell'assetto di veicoli spaziali, manovre di rendezvous e allunaggio controllato
  5. Fornisce analisi di convergenza: Dimostra che quando il parametro dell'insieme terminale M→0, il costo dell'OCP di costruzione alternativa (AC-OCP) converge al costo reale dell'OCP su orizzonte infinito

Dettagli del Metodo

Definizione del Compito

Problema di controllo ottimale su orizzonte infinito definito come:

J*∞(x) = min{ut} Σ(t=0 to ∞) c(xt, ut); dato x0 = x
soggetto a: xt+1 = f(xt, ut)

dove:

  • xt ∈ Rn: vettore di stato del sistema
  • ut ∈ Rp: ingresso di controllo
  • c(xt, ut): funzione di costo incrementale

Architettura del Modello

1. Problema di Controllo Ottimale di Costruzione Alternativa (AC-OCP)

Converte il problema su orizzonte infinito in:

JM∞(x) = min{ut}(T-1, t=0), T [Σ(t=0 to T-1) c(xt, ut) + max(J̄∞(xT), M)]
soggetto a: xt+1 = f(xt, ut), xT ∈ ΩM

dove ΩM = {x | J̄∞(x) ≤ M} è l'insieme terminale.

2. Strategia di Risoluzione in Due Fasi

Prima Fase: OCP Non Lineare su Orizzonte Finito

  • Utilizza iLQR per risolvere il problema su orizzonte finito:
JT∞(x) = min{ut}(T-1, t=0) [Σ(t=0 to T-1) c(xt, ut) + J̄∞(xT)]

Seconda Fase: Regolazione Lineare

  • Utilizza il controllore LQR all'interno dell'insieme terminale ΩM
  • Linearizza il sistema: J̄∞(x) = xTP∞x, dove P∞ è la soluzione dell'equazione di Riccati in stato stazionario

3. Implementazione dell'Algoritmo iLQR

Propagazione in Avanti:

uk+1_t = uk_t + αkt + Kt(xk+1_t - xk_t)
xk+1_t+1 = f(xk+1_t, uk+1_t)

Propagazione all'Indietro: Calcola le derivate parziali della funzione Q e aggiorna i guadagni:

kt = -Q^(-1)_utut * Qut
Kt = -Q^(-1)_utut * Qutxt

Punti di Innovazione Tecnica

  1. Ottimizzazione del Tempo Terminale Libero: Ottimizza il tempo di trasferimento T per garantire una transizione fluida verso l'insieme terminale
  2. Optimalità Asintotica: Dimostra che limM→0 JM∞(x) = J*∞(x)
  3. Garanzie di Stabilità: La funzione di costo dell'AC-OCP soddisfa l'equazione di Bellman, fungendo da CLF per garantire la stabilità asintotica globale
  4. Gestione della Dinamica Ibrida: Mantiene la dinamica completamente non lineare al di fuori dell'insieme terminale, linearizza all'interno dell'insieme terminale

Configurazione Sperimentale

Scenari di Applicazione

L'articolo verifica il metodo in tre applicazioni spaziali critiche:

  1. Controllo dell'Assetto di Veicoli Spaziali
  2. Manovre di Rendezvous
  3. Allunaggio Controllato

Dinamica del Sistema

1. Controllo dell'Assetto

Vettore di stato: ψ, θ, φ, ω1, ω2, ω3T

  • Dinamica degli angoli di Eulero e dinamica della velocità angolare
  • Matrice dei momenti di inerzia: J = diag4500, 2000, 7500
  • Orizzonte temporale: 200 secondi, passo di discretizzazione: 0,1 secondi

2. Manovre di Rendezvous

Lo stato include errore di posizione relativa er, errore di velocità relativa ev e massa m

  • Dinamica orbitale ellittica
  • Orizzonte temporale: 6000 secondi, passo di discretizzazione: 2 secondi

3. Allunaggio Controllato

Combina dinamica dell'assetto e della posizione

  • Gravità marziana: gref = 0, 0, -3.7114T
  • Include variazione di massa e vincoli di spinta
  • Orizzonte temporale: 30 secondi, passo di discretizzazione: 0,2 secondi

Metriche di Valutazione

  • Funzione di costo totale: costo quadratico c(x,u) = ½(xTQx + uTRu)
  • Errore di stato terminale
  • Fluidità dell'ingresso di controllo
  • Analisi di convergenza

Risultati Sperimentali

Risultati Principali

1. Controllo dell'Assetto

  • Effetto del Tempo di Trasferimento: Da 10 secondi a 80 secondi, il costo totale diminuisce da 6,45×10^5 a 5,20×10^5
  • Convergenza dello Stato:
    • Trasferimento di 10 secondi: errore terminale 34,86°, -33,19°, -36,71°, 2,79°/s, 6,02°/s, 0,97°/s
    • Trasferimento di 80 secondi: errore terminale -0,77°, -0,15°, 0,55°, -0,05°/s, 0,02°/s, -0,05°/s

2. Manovre di Rendezvous

  • Riduzione del Costo con Tempo di Trasferimento: Tempi di trasferimento più lunghi determinano costi inferiori e errori più piccoli
  • Confronto dello Stato Terminale:
    • 600 secondi: errore di posizione ~1400 km, errore di velocità ~5000 m/s
    • 2400 secondi: errore di posizione ~1 m, errore di velocità ~2 m/s

3. Allunaggio Controllato

  • Allunaggio Riuscito: r3=0 (allunaggio) a 29,9 secondi
  • Precisione Terminale: errore di posizione -0,06 m, -0,03 m, 1,09 m, errore di velocità -0,007 m/s, -0,008 m/s, -0,99 m/s
  • Gestione dei Vincoli: Gestisce i vincoli di altitudine attraverso funzioni di penalità esponenziale

Risultati Chiave

  1. Importanza dell'Ottimizzazione del Tempo di Trasferimento: Tempi di trasferimento più lunghi consentono al sistema di linearizzarsi più vicino all'origine, riducendo significativamente il costo di regolazione
  2. Transizione Fluida: Un tempo di trasferimento appropriato evita cambiamenti bruschi negli ingressi di controllo
  3. Robustezza: Il metodo funziona bene in diverse condizioni iniziali e parametri di sistema

Lavori Correlati

Principali Direzioni di Ricerca

  1. Metodi di Controllo Ottimale Tradizionali: Metodo del tiro, metodi diretti (SQP, metodo del punto interno)
  2. Metodi Moderni: Apprendimento per rinforzo, controllo predittivo del modello
  3. Teoria della Stabilità: Metodo di Lyapunov, funzioni di Lyapunov di controllo

Vantaggi di Questo Articolo

  • Rispetto al metodo del tiro: fornisce controllo con retroazione e migliore robustezza
  • Rispetto ai metodi diretti: garantisce stabilità asintotica globale
  • Rispetto all'apprendimento per rinforzo: garanzie teoriche e risultati deterministici

Conclusioni e Discussione

Conclusioni Principali

  1. Contributo Teorico: Stabilisce un framework trattabile per la risoluzione dell'OCP non lineare su orizzonte infinito
  2. Valore Pratico: Verifica l'efficacia del metodo in applicazioni spaziali critiche
  3. Garanzie di Stabilità: Fornisce garanzie teoriche di stabilità asintotica globale

Limitazioni

  1. Limitazioni della Linearizzazione: La linearizzazione di alcuni sistemi (come i sistemi non olonomi) potrebbe non essere controllabile
  2. Gestione dei Vincoli: I vincoli rigidi devono essere convertiti in vincoli morbidi (come il vincolo di altitudine nell'allunaggio controllato)
  3. Complessità Computazionale: Richiede l'ottimizzazione del tempo di trasferimento, aumentando l'onere computazionale

Direzioni Future

  1. Estensione a Vincoli Più Complessi: Gestire vincoli di percorso e sistemi ibridi
  2. Implementazione in Tempo Reale: Sviluppare algoritmi veloci adatti per applicazioni online
  3. Miglioramento della Robustezza: Considerare incertezze di modello e perturbazioni esterne

Valutazione Approfondita

Punti di Forza

  1. Rigore Teorico: Fornisce un framework matematico completo e prove di convergenza
  2. Forte Praticità: Verifica il metodo in tre diverse applicazioni spaziali
  3. Innovatività: Combina abilmente i vantaggi dei metodi su orizzonte finito e infinito
  4. Garanzie di Stabilità: Garantisce la stabilità asintotica globale attraverso CLF

Insufficienze

  1. Condizioni di Ipotesi: Dipende dalla controllabilità del sistema e da proprietà specifiche della funzione di costo
  2. Regolazione dei Parametri: La scelta del parametro dell'insieme terminale M manca di linee guida esplicite
  3. Efficienza Computazionale: L'ottimizzazione del tempo di trasferimento potrebbe richiedere più iterazioni di risoluzione

Impatto

  1. Valore Accademico: Fornisce un nuovo framework teorico per il controllo non lineare su orizzonte infinito
  2. Significato Ingegneristico: Fornisce un metodo di progettazione pratico per il controllo di missioni spaziali
  3. Estensibilità: Il metodo può essere generalizzato ad altri problemi di controllo che richiedono stabilità a lungo termine

Scenari Applicabili

  • Missioni spaziali di lunga durata
  • Sistemi di controllo che richiedono garanzie di stabilità globale
  • Sistemi complessi con dinamiche non lineari
  • Missioni critiche con requisiti di sicurezza estremi

Bibliografia

L'articolo cita 23 riferimenti correlati, coprendo importanti lavori nei campi della teoria del controllo ottimale, controllo di veicoli spaziali e metodi di ottimizzazione numerica, fornendo una base teorica solida per la ricerca.


Valutazione Complessiva: Questo è un articolo di alta qualità con importanti contributi sia dal punto di vista teorico che applicativo. Gli autori convertono abilmente il problema su orizzonte infinito in un problema trattabile su orizzonte finito, mantenendo al contempo le garanzie di stabilità. La verifica in tre importanti applicazioni spaziali dimostra il valore pratico del metodo. Nonostante alcune limitazioni, nel complesso fornisce strumenti teorici e metodi pratici preziosi per il campo del controllo spaziale.