2025-11-13T08:28:10.831761

Optimal Control with Lyapunov Stability Guarantees for Space Applications

Abhijeet, Mohamed, Sharma et al.

This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.

academic

宇宙応用のためのリアプノフ安定性保証を伴う最適制御

基本情報

論文ID: 2510.08854
タイトル: Optimal Control with Lyapunov Stability Guarantees for Space Applications
著者: Abhijeet、Mohamed Naveed Gul Mohamed、Aayushman Sharma、Suman Chakravorty（テキサスA&M大学）
分類: math.OC（最適化と制御）、cs.SY（システムと制御）、eess.SY（システムと制御）
発表日: 2025年10月9日
論文リンク: https://arxiv.org/abs/2510.08854v1

概要

本論文は、非線形動力学を有する宇宙応用における無限時間域最適制御問題（OCP）を研究している。提案手法は問題を2つの段階に分解する：正則化終端コスト関数を伴う有限時間域OCP（システムを終端集合に導く）、および当該集合内での無限時間域線形調節段階。当該戦略は特定の仮定の下で大域漸近安定性を保証する。本手法は終端集合到達前にシステムの完全な非線形動力学を保持し、その後システム動力学を線形化する。終端集合が原点に収束するにつれて、生成される最適コストの差異はゼロに収束し、効率的で安定した解を保証する。本手法は3つの問題のシミュレーションにより検証される：宇宙機姿勢制御、ランデブー機動、および軟着陸。

研究背景と動機

問題背景

宇宙ミッションの制御課題：宇宙探査は先進的な制御戦略を必要とし、宇宙機の精密な方向制御から対接近および着陸の精密な機動まで、宇宙環境の固有の課題を克服する必要がある。
従来手法の限界：
- シューティング法（Shooting Method）：姿勢制御と軌跡最適化に有効だが、適応性に欠け、初期推定値に敏感である
- 直接法（SQP、内点法）：制約を扱えるが、大域漸近安定性を保証できず、フィードバックを提供しない
- 強化学習（RL）：データ依存性が強く、結果が一貫しない
長期安定性の必要性：宇宙ミッションは任意の初期状態から特定の終端状態に到達できるシステムを必要とし、大域漸近安定性は宇宙ミッションに特に価値がある。

研究動機

既存手法が最適制御問題を解く際の限界および長期安定性の必要性に対応するため、本論文は問題を無限時間域OCPとして再定式化し、処理可能な手法を採用してフィードバックを確保し、大域漸近安定性を保証する。

核心的貢献

新しい無限時間域非線形最適制御求解フレームワークの提案：無限時間域問題を有限時間域非線形OCPと線形調節の2つの段階に分解
理論的保証の確立：提案手法がベルマン方程式を満たすことを証明し、制御リアプノフ関数（CLF）を提供して大域漸近安定性を確保
実用的アルゴリズムの開発：反復線形二次調節器（iLQR）と線形二次調節器（LQR）の混合手法を結合
手法の有効性検証：3つの主要な宇宙応用で検証：宇宙機姿勢制御、ランデブー機動、軟着陸
収束性分析の提供：終端集合パラメータM→0のとき、代替構成OCP（AC-OCP）のコストが真の無限時間域OCPコストに収束することを証明

手法の詳細

タスク定義

無限時間域最適制御問題は以下のように定義される：

J*∞(x) = min{ut} Σ(t=0 to ∞) c(xt, ut); given x0 = x
subject to: xt+1 = f(xt, ut)

ここで：

xt ∈ Rn：システム状態ベクトル
ut ∈ Rp：制御入力
c(xt, ut)：段階的コスト関数

モデルアーキテクチャ

1. 代替構成最適制御問題（AC-OCP）

無限時間域問題を以下に変換：

JM∞(x) = min{ut}(T-1, t=0), T [Σ(t=0 to T-1) c(xt, ut) + max(J̄∞(xT), M)]
subject to: xt+1 = f(xt, ut), xT ∈ ΩM

ここでΩM = {x | J̄∞(x) ≤ M}は終端集合である。

2. 2段階求解戦略

第1段階：非線形有限時間域OCP

iLQRを用いて有限時間域問題を求解：

JT∞(x) = min{ut}(T-1, t=0) [Σ(t=0 to T-1) c(xt, ut) + J̄∞(xT)]

第2段階：線形調節

終端集合ΩM内でLQRコントローラを使用
システムを線形化：J̄∞(x) = xTP∞x、ここでP∞は定常リッカチ方程式の解

3. iLQRアルゴリズム実装

前進伝播：

uk+1_t = uk_t + αkt + Kt(xk+1_t - xk_t)
xk+1_t+1 = f(xk+1_t, uk+1_t)

後進伝播： Q関数の偏導数を計算し、ゲインを更新：

kt = -Q^(-1)_utut * Qut
Kt = -Q^(-1)_utut * Qutxt

技術的革新点

自由終端時間最適化：転移時間Tを最適化して終端集合への平滑な遷移を確保
漸進最適性：limM→0 JM∞(x) = J*∞(x)を証明
安定性保証：AC-OCPのコスト関数はベルマン方程式を満たし、CLFとして大域漸近安定性を確保
混合動力学処理：終端集合外では完全な非線形動力学を保持、終端集合内では線形化

実験設定

応用シナリオ

本論文は3つの主要な宇宙応用で手法を検証：

宇宙機姿勢制御
ランデブー機動
軟着陸

システム動力学

1. 姿勢制御

状態ベクトル：ψ, θ, φ, ω1, ω2, ω3T

オイラー角動力学と角速度動力学
慣性モーメント行列：J = diag4500, 2000, 7500
時間領域：200秒、離散化ステップ：0.1秒

2. ランデブー機動

状態は相対位置誤差er、相対速度誤差ev、質量mを含む

楕円軌道動力学
時間領域：6000秒、離散化ステップ：2秒

3. 軟着陸

姿勢と位置動力学を結合

火星重力：gref = 0, 0, -3.7114T
質量変化と推力制約を含む
時間領域：30秒、離散化ステップ：0.2秒

評価指標

総コスト関数：二次形式コストc(x,u) = ½(xTQx + uTRu)
終端状態誤差
制御入力の平滑性
収束性分析

実験結果

主要結果

1. 姿勢制御

転移時間の影響：10秒から80秒に変更すると、総コストは6.45×10^5から5.20×10^5に低下
状態収束：
- 10秒転移：終端誤差34.86°、-33.19°、-36.71°、2.79°/s、6.02°/s、0.97°/s
- 80秒転移：終端誤差-0.77°、-0.15°、0.55°、-0.05°/s、0.02°/s、-0.05°/s

2. ランデブー機動

転移時間の減少に伴うコストの低下：より長い転移時間はより低いコストと小さい誤差をもたらす
終端状態の比較：
- 600秒：位置誤差～1400km級、速度誤差～5000m/s級
- 2400秒：位置誤差～1m級、速度誤差～2m/s級

3. 軟着陸

着陸成功：29.9秒時にr3=0（着陸）
終端精度：位置誤差-0.06m、-0.03m、1.09m、速度誤差-0.007m/s、-0.008m/s、-0.99m/s
制約処理：指数ペナルティ関数により高度制約を処理

主要な知見

転移時間最適化の重要性：より長い転移時間により、システムはより原点に近い位置で線形化でき、調節コストを大幅に削減
平滑な遷移：適切な転移時間は制御入力の急激な変化を回避
ロバスト性：手法は異なる初期条件とシステムパラメータの下で良好に機能

結論と考察

主要な結論

理論的貢献：無限時間域非線形OCPの処理可能な求解フレームワークを確立
実用的価値：主要な宇宙応用での手法の有効性を検証
安定性保証：大域漸近安定性の理論的保証を提供

限界

線形化の限界：非ホロノミックシステムなど、一部のシステムの線形化は制御不可能な場合がある
制約処理：硬制約をソフト制約に変換する必要がある（例：軟着陸の高度制約）
計算複雑性：転移時間の最適化により計算負担が増加

今後の方向性

より複雑な制約への拡張：経路制約とハイブリッドシステムの処理
リアルタイム実装：オンライン応用に適した高速アルゴリズムの開発
ロバスト性の強化：モデル不確実性と外部擾動の考慮

深層的評価

利点

理論的厳密性：完全な数学的フレームワークと収束性証明を提供
実用性：3つの異なる宇宙応用で手法を検証
革新性：有限時間域と無限時間域手法の利点を巧妙に結合
安定性保証：CLFを通じて大域漸近安定性を確保

不足点

仮定条件：システムの制御可能性とコスト関数の特定の性質に依存
パラメータ調整：終端集合パラメータMの選択に明確な指針がない
計算効率：転移時間最適化は複数回の反復求解を必要とする可能性がある

影響力

学術的価値：無限時間域非線形制御に新しい理論的フレームワークを提供
工学的意義：宇宙ミッション制御に実用的な設計手法を提供
拡張性：長期安定性を必要とする他の制御問題に推広可能

適用シナリオ

長期運用の宇宙ミッション
大域安定性保証が必要な制御システム
非線形動力学を有する複雑なシステム
安全性要件が極めて高い重要ミッション

参考文献

論文は最適制御理論、宇宙機制御、数値最適化手法などの分野における重要な研究を含む23篇の関連文献を引用し、研究に堅実な理論的基礎を提供している。

総合評価：これは理論と応用の両面で重要な貢献を有する高品質な論文である。著者は無限時間域問題を処理可能な有限時間域問題に巧妙に変換しながら、安定性を保証している。3つの重要な宇宙応用での検証は手法の実用的価値を示している。いくつかの限界があるものの、全体的には宇宙制御分野に価値のある理論的ツールと実用的手法を提供している。