Optimal Control with Lyapunov Stability Guarantees for Space Applications
Abhijeet, Mohamed, Sharma et al.
This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.
academic
Optimale Steuerung mit Lyapunov-Stabilitätsgarantien für Weltraumanwendungen
Dieses Papier untersucht das Problem der optimalen Steuerung mit unendlichem Zeithorizont (OCP) für Weltraumanwendungen mit nichtlinearen Dynamiken. Der vorgeschlagene Ansatz zerlegt das Problem in zwei Phasen: ein endliches OCP mit regularisierter Terminalkosten, das das System zu einer Terminalmengen führt, sowie eine unendliche Regelungsphase innerhalb dieser Menge. Die Strategie garantiert unter bestimmten Annahmen globale asymptotische Stabilität. Das Verfahren behält die vollständig nichtlinearen Dynamiken bei, bevor die Terminalmengen erreicht werden, und linearisiert dann die Systemdynamiken. Mit der Konvergenz der Terminalmengen gegen den Ursprung konvergiert die resultierende optimale Kostenabweichung gegen Null und garantiert eine effiziente und stabile Lösung. Das Verfahren wird durch Simulationen von drei Problemen validiert: Raumfahrzeug-Lageregelung, Rendezvous-Manöver und Weichlandung.
Steuerungsherausforderungen bei Weltraummissionen: Die Weltraumforschung erfordert fortschrittliche Steuerungsstrategien, um den Missionserfolg zu gewährleisten. Von der präzisen Ausrichtung von Raumfahrzeugen bis zu feinen Manövern beim Andocken und Landen müssen inhärente Herausforderungen der Weltraumumgebung überwunden werden.
Einschränkungen traditioneller Methoden:
Schießverfahren (Shooting Method): Wirksam bei Lageregelung und Bahnoptimierung, aber schlecht adaptierbar und empfindlich gegenüber Anfangsschätzungen
Direkte Methoden (SQP, Interior Point): Können Nebenbedingungen handhaben, garantieren aber keine globale asymptotische Stabilität oder Rückkopplung
Verstärkungslernen (RL): Stark datenabhängig mit inkonsistenten Ergebnissen
Anforderungen an Langzeitstabilität: Weltraummissionen erfordern, dass Systeme von beliebigen Anfangszuständen zu spezifischen Terminalzuständen gelangen können, was globale asymptotische Stabilität für Weltraummissionen besonders wertvoll macht.
Angesichts der Einschränkungen bestehender Methoden bei der Lösung von Optimalsteuerungsproblemen und der Anforderung an Langzeitstabilität formuliert dieses Papier das Problem als unendliches OCP neu und wendet einen handhabbaren Ansatz an, um Rückkopplung zu gewährleisten und globale asymptotische Stabilität zu garantieren.
Vorschlag eines neuen Lösungsrahmens für nichtlineare Optimalsteuerung mit unendlichem Zeithorizont: Zerlegung des unendlichen Problems in ein endliches nichtlineares OCP und eine lineare Regelungsphase
Etablierung theoretischer Garantien: Nachweis, dass die vorgeschlagene Methode die Bellman-Gleichung erfüllt, Bereitstellung einer Steuerungs-Lyapunov-Funktion (CLF) und Gewährleistung globaler asymptotischer Stabilität
Entwicklung eines praktischen Algorithmus: Hybridmethode, die iterativen linearen quadratischen Regler (iLQR) und linearen quadratischen Regler (LQR) kombiniert
Validierung der Methodeneffektivität: Verifikation in drei kritischen Weltraumanwendungen: Raumfahrzeug-Lageregelung, Rendezvous-Manöver und Weichlandung
Bereitstellung von Konvergenzanalyse: Nachweis, dass die Kosten des Ersatzkonstruktions-OCP (AC-OCP) gegen die Kosten des echten unendlichen OCP konvergieren, wenn der Terminalmengen-Parameter M→0
Optimierung der freien Endzeit: Optimierung der Übergangsdauer T zur Gewährleistung eines sanften Übergangs zur Terminalmengen
Asymptotische Optimalität: Nachweis, dass limM→0 JM∞(x) = J*∞(x)
Stabilitätsgarantie: Die Kostenfunktion des AC-OCP erfüllt die Bellman-Gleichung und fungiert als CLF zur Gewährleistung globaler asymptotischer Stabilität
Behandlung hybrider Dynamiken: Beibehaltung vollständig nichtlinearer Dynamiken außerhalb der Terminalmengen und Linearisierung innerhalb der Terminalmengen
Bedeutung der Übergangszeitoptimierung: Längere Übergangsdauern ermöglichen es dem System, näher am Ursprung linearisiert zu werden, was die Regelungskosten erheblich reduziert
Sanfter Übergang: Angemessene Übergangsdauern vermeiden abrupte Änderungen der Steuereingaben
Robustheit: Das Verfahren zeigt gute Leistung unter verschiedenen Anfangsbedingungen und Systemparametern
Linearisierungsbeschränkungen: Die Linearisierung bestimmter Systeme (wie nichtholonomer Systeme) kann unkontrollierbar sein
Nebenbedingungsbehandlung: Harte Nebenbedingungen müssen in weiche Nebenbedingungen umgewandelt werden (wie die Höhenbeschränkung bei der Weichlandung)
Rechenkomplexität: Die Optimierung der Übergangsdauer erhöht die Rechenlast
Das Papier zitiert 23 relevante Arbeiten, die wichtige Werke in den Bereichen Optimalsteuerungstheorie, Raumfahrzeugsteuerung und numerische Optimierungsmethoden abdecken und eine solide theoretische Grundlage für die Forschung bieten.
Gesamtbewertung: Dies ist ein hochqualitatives Papier mit wichtigen Beiträgen sowohl in Theorie als auch in Anwendung. Die Autoren wandeln das unendliche Zeithorizont-Problem geschickt in ein handhabbares endliches Problem um, während gleichzeitig Stabilität gewährleistet wird. Die Validierung in drei wichtigen Weltraumanwendungen demonstriert den praktischen Wert der Methode. Trotz einiger Einschränkungen bietet das Papier insgesamt wertvolle theoretische Werkzeuge und praktische Methoden für das Feld der Weltraumsteuerung.