2025-11-13T08:28:10.831761

Optimal Control with Lyapunov Stability Guarantees for Space Applications

Abhijeet, Mohamed, Sharma et al.
This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.
academic

अंतरिक्ष अनुप्रयोगों के लिए लायपुनोव स्थिरता गारंटी के साथ इष्टतम नियंत्रण

मूल जानकारी

  • पेपर ID: 2510.08854
  • शीर्षक: अंतरिक्ष अनुप्रयोगों के लिए लायपुनोव स्थिरता गारंटी के साथ इष्टतम नियंत्रण
  • लेखक: अभिजीत, मोहम्मद नवीद गुल मोहम्मद, आयुषमान शर्मा, सुमन चक्रवर्ती (टेक्सास ए एंड एम विश्वविद्यालय)
  • वर्गीकरण: math.OC (अनुकूलन और नियंत्रण), cs.SY (प्रणाली और नियंत्रण), eess.SY (प्रणाली और नियंत्रण)
  • प्रकाशन तिथि: 9 अक्टूबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.08854v1

सारांश

यह पेपर अंतरिक्ष अनुप्रयोगों में अरैखिक गतिशीलता वाली अनंत समय क्षितिज इष्टतम नियंत्रण समस्या (OCP) का अध्ययन करता है। प्रस्तावित विधि समस्या को दो चरणों में विभाजित करती है: नियमितकृत टर्मिनल लागत के साथ परिमित समय क्षितिज OCP, जो प्रणाली को टर्मिनल सेट तक ले जाता है; और उस सेट के भीतर अनंत समय क्षितिज रैखिक नियंत्रण चरण। यह रणनीति विशिष्ट मान्यताओं के तहत वैश्विक स्पर्शोन्मुख स्थिरता की गारंटी देती है। विधि टर्मिनल सेट तक पहुंचने से पहले प्रणाली की पूर्ण अरैखिक गतिशीलता को बनाए रखती है, फिर प्रणाली गतिशीलता को रैखिक करती है। जैसे-जैसे टर्मिनल सेट मूल बिंदु पर अभिसरित होता है, परिणामी इष्टतम लागत अंतर शून्य की ओर प्रवृत्त होता है, जो कुशल स्थिर समाधान की गारंटी देता है। विधि तीन समस्याओं के अनुकरण द्वारा सत्यापित है: अंतरिक्ष यान मुद्रा नियंत्रण, मिलन पैंतरेबाज़ी और नरम लैंडिंग।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

  1. अंतरिक्ष मिशन के नियंत्रण चुनौतियाँ: अंतरिक्ष अन्वेषण को मिशन की सफलता सुनिश्चित करने के लिए उन्नत नियंत्रण रणनीतियों की आवश्यकता है, अंतरिक्ष यान के सटीक अभिविन्यास से लेकर डॉकिंग और लैंडिंग के सूक्ष्म पैंतरेबाज़ी तक सभी को अंतरिक्ष वातावरण की अंतर्निहित चुनौतियों को दूर करना होगा।
  2. पारंपरिक विधियों की सीमाएं:
    • शूटिंग विधि (Shooting Method): मुद्रा नियंत्रण और प्रक्षेपवक्र अनुकूलन में प्रभावी, लेकिन कम अनुकूलनीय, प्रारंभिक अनुमान के प्रति संवेदनशील
    • प्रत्यक्ष विधियां (SQP, आंतरिक बिंदु): बाधाओं को संभाल सकती हैं, लेकिन वैश्विक स्पर्शोन्मुख स्थिरता या प्रतिक्रिया की गारंटी नहीं दे सकतीं
    • सुदृढ़ीकरण सीखना (RL): डेटा पर निर्भर, असंगत परिणाम
  3. दीर्घकालीन स्थिरता की आवश्यकता: अंतरिक्ष मिशन को सिस्टम को किसी भी प्रारंभिक स्थिति से विशिष्ट टर्मिनल स्थिति तक पहुंचने में सक्षम होना चाहिए, जिससे वैश्विक स्पर्शोन्मुख स्थिरता अंतरिक्ष मिशन के लिए विशेष रूप से मूल्यवान हो जाती है।

अनुसंधान प्रेरणा

मौजूदा विधियों की सीमाओं और दीर्घकालीन स्थिरता की आवश्यकता को संबोधित करते हुए, यह पेपर समस्या को अनंत समय क्षितिज OCP के रूप में पुनः तैयार करता है, एक सुगम विधि अपनाता है जो प्रतिक्रिया सुनिश्चित करती है और वैश्विक स्पर्शोन्मुख स्थिरता की गारंटी देती है।

मुख्य योगदान

  1. अनंत समय क्षितिज अरैखिक इष्टतम नियंत्रण के लिए एक नई समाधान रूपरेखा प्रस्तावित की: अनंत समय क्षितिज समस्या को परिमित समय क्षितिज अरैखिक OCP और रैखिक नियंत्रण के दो चरणों में विभाजित किया
  2. सैद्धांतिक गारंटियां स्थापित कीं: साबित किया कि प्रस्तावित विधि बेलमैन समीकरण को संतुष्ट करती है, नियंत्रण लायपुनोव फलन (CLF) प्रदान करती है, वैश्विक स्पर्शोन्मुख स्थिरता सुनिश्चित करती है
  3. व्यावहारिक एल्गोरिथ्म विकसित किया: पुनरावृत्तिमूलक रैखिक द्विघात नियंत्रक (iLQR) और रैखिक द्विघात नियंत्रक (LQR) की संकर विधि को जोड़ा
  4. विधि की प्रभावशीलता सत्यापित की: तीन महत्वपूर्ण अंतरिक्ष अनुप्रयोगों में सत्यापन: अंतरिक्ष यान मुद्रा नियंत्रण, मिलन पैंतरेबाज़ी और नरम लैंडिंग
  5. अभिसरण विश्लेषण प्रदान किया: साबित किया कि जब टर्मिनल सेट पैरामीटर M→0 होता है, तो विकल्प निर्माण OCP (AC-OCP) की लागत वास्तविक अनंत समय क्षितिज OCP लागत में अभिसरित होती है

विधि विवरण

कार्य परिभाषा

अनंत समय क्षितिज इष्टतम नियंत्रण समस्या को इस प्रकार परिभाषित किया गया है:

J*∞(x) = min{ut} Σ(t=0 to ∞) c(xt, ut); दिया गया x0 = x
विषय: xt+1 = f(xt, ut)

जहां:

  • xt ∈ Rn: प्रणाली स्थिति सदिश
  • ut ∈ Rp: नियंत्रण इनपुट
  • c(xt, ut): वर्धनशील लागत फलन

मॉडल आर्किटेक्चर

1. विकल्प निर्माण इष्टतम नियंत्रण समस्या (AC-OCP)

अनंत समय क्षितिज समस्या को रूपांतरित करता है:

JM∞(x) = min{ut}(T-1, t=0), T [Σ(t=0 to T-1) c(xt, ut) + max(J̄∞(xT), M)]
विषय: xt+1 = f(xt, ut), xT ∈ ΩM

जहां ΩM = {x | J̄∞(x) ≤ M} टर्मिनल सेट है।

2. दो-चरण समाधान रणनीति

प्रथम चरण: अरैखिक परिमित समय क्षितिज OCP

  • परिमित समय क्षितिज समस्या को हल करने के लिए iLQR का उपयोग:
JT∞(x) = min{ut}(T-1, t=0) [Σ(t=0 to T-1) c(xt, ut) + J̄∞(xT)]

द्वितीय चरण: रैखिक नियंत्रण

  • टर्मिनल सेट ΩM के भीतर LQR नियंत्रक का उपयोग
  • रैखिक प्रणाली: J̄∞(x) = xTP∞x, जहां P∞ स्थिर-अवस्था रिक्काती समीकरण का समाधान है

3. iLQR एल्गोरिथ्म कार्यान्वयन

अग्र प्रसार:

uk+1_t = uk_t + αkt + Kt(xk+1_t - xk_t)
xk+1_t+1 = f(xk+1_t, uk+1_t)

पश्च प्रसार: Q फलन के आंशिक व्युत्पन्न की गणना करें और लाभ अपडेट करें:

kt = -Q^(-1)_utut * Qut
Kt = -Q^(-1)_utut * Qutxt

तकनीकी नवाचार

  1. मुक्त टर्मिनल समय अनुकूलन: टर्मिनल सेट में सुचारु संक्रमण सुनिश्चित करने के लिए स्थानांतरण समय T को अनुकूलित करना
  2. क्रमिक इष्टतमता: साबित किया कि limM→0 JM∞(x) = J*∞(x)
  3. स्थिरता गारंटी: AC-OCP की लागत फलन बेलमैन समीकरण को संतुष्ट करती है, CLF के रूप में कार्य करती है और वैश्विक स्पर्शोन्मुख स्थिरता सुनिश्चित करती है
  4. संकर गतिशीलता हैंडलिंग: टर्मिनल सेट के बाहर पूर्ण अरैखिक गतिशीलता बनाए रखता है, टर्मिनल सेट के भीतर रैखिकीकरण करता है

प्रायोगिक सेटअप

अनुप्रयोग परिदृश्य

यह पेपर तीन महत्वपूर्ण अंतरिक्ष अनुप्रयोगों में विधि को सत्यापित करता है:

  1. अंतरिक्ष यान मुद्रा नियंत्रण
  2. मिलन पैंतरेबाज़ी
  3. नरम लैंडिंग

प्रणाली गतिशीलता

1. मुद्रा नियंत्रण

स्थिति सदिश: ψ, θ, φ, ω1, ω2, ω3T

  • यूलर कोण गतिशीलता और कोणीय वेग गतिशीलता
  • जड़त्व मैट्रिक्स: J = diag4500, 2000, 7500
  • समय क्षेत्र: 200 सेकंड, विवेकीकरण चरण: 0.1 सेकंड

2. मिलन पैंतरेबाज़ी

स्थिति में सापेक्ष स्थिति त्रुटि er, सापेक्ष वेग त्रुटि ev और द्रव्यमान m शामिल है

  • अण्डाकार कक्षा गतिशीलता
  • समय क्षेत्र: 6000 सेकंड, विवेकीकरण चरण: 2 सेकंड

3. नरम लैंडिंग

मुद्रा और स्थिति गतिशीलता को जोड़ता है

  • मंगल गुरुत्वाकर्षण: gref = 0, 0, -3.7114T
  • द्रव्यमान परिवर्तन और जोर बाधाएं शामिल
  • समय क्षेत्र: 30 सेकंड, विवेकीकरण चरण: 0.2 सेकंड

मूल्यांकन मेट्रिक्स

  • कुल लागत फलन: द्विघात लागत c(x,u) = ½(xTQx + uTRu)
  • टर्मिनल स्थिति त्रुटि
  • नियंत्रण इनपुट सुचारुता
  • अभिसरण विश्लेषण

प्रायोगिक परिणाम

मुख्य परिणाम

1. मुद्रा नियंत्रण

  • स्थानांतरण समय प्रभाव: 10 सेकंड से 80 सेकंड तक, कुल लागत 6.45×10^5 से 5.20×10^5 तक कम हुई
  • स्थिति अभिसरण:
    • 10 सेकंड स्थानांतरण: टर्मिनल त्रुटि 34.86°, -33.19°, -36.71°, 2.79°/s, 6.02°/s, 0.97°/s
    • 80 सेकंड स्थानांतरण: टर्मिनल त्रुटि -0.77°, -0.15°, 0.55°, -0.05°/s, 0.02°/s, -0.05°/s

2. मिलन पैंतरेबाज़ी

  • स्थानांतरण समय के साथ लागत में कमी: अधिक स्थानांतरण समय कम लागत और छोटी त्रुटि की ओर ले जाता है
  • टर्मिनल स्थिति तुलना:
    • 600 सेकंड: स्थिति त्रुटि ~1400km स्तर, वेग त्रुटि ~5000m/s स्तर
    • 2400 सेकंड: स्थिति त्रुटि ~1m स्तर, वेग त्रुटि ~2m/s स्तर

3. नरम लैंडिंग

  • सफल लैंडिंग: 29.9 सेकंड पर r3=0 (लैंडिंग)
  • टर्मिनल सटीकता: स्थिति त्रुटि -0.06m, -0.03m, 1.09m, वेग त्रुटि -0.007m/s, -0.008m/s, -0.99m/s
  • बाधा हैंडलिंग: ऊंचाई बाधा को संभालने के लिए घातीय दंड फलन के माध्यम से

मुख्य निष्कर्ष

  1. स्थानांतरण समय अनुकूलन की महत्ता: लंबे स्थानांतरण समय प्रणाली को मूल बिंदु के करीब रैखिकीकरण करने की अनुमति देते हैं, नियंत्रण लागत में उल्लेखनीय कमी करते हैं
  2. सुचारु संक्रमण: उपयुक्त स्थानांतरण समय नियंत्रण इनपुट में तीव्र परिवर्तन से बचाता है
  3. मजबूती: विधि विभिन्न प्रारंभिक स्थितियों और प्रणाली मापदंडों के तहत अच्छा प्रदर्शन करती है

संबंधित कार्य

मुख्य अनुसंधान दिशाएं

  1. पारंपरिक इष्टतम नियंत्रण विधियां: शूटिंग विधि, प्रत्यक्ष विधियां (SQP, आंतरिक बिंदु विधि)
  2. आधुनिक विधियां: सुदृढ़ीकरण सीखना, मॉडल पूर्वानुमानित नियंत्रण
  3. स्थिरता सिद्धांत: लायपुनोव विधि, नियंत्रण लायपुनोव फलन

इस पेपर के लाभ

  • शूटिंग विधि की तुलना में: प्रतिक्रिया नियंत्रण और बेहतर मजबूती प्रदान करता है
  • प्रत्यक्ष विधियों की तुलना में: वैश्विक स्पर्शोन्मुख स्थिरता की गारंटी देता है
  • सुदृढ़ीकरण सीखने की तुलना में: सैद्धांतिक गारंटी और निर्धारणीय परिणाम

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. सैद्धांतिक योगदान: अनंत समय क्षितिज अरैखिक OCP के लिए एक सुगम समाधान रूपरेखा स्थापित की
  2. व्यावहारिक मूल्य: महत्वपूर्ण अंतरिक्ष अनुप्रयोगों में विधि की प्रभावशीलता सत्यापित की
  3. स्थिरता गारंटी: वैश्विक स्पर्शोन्मुख स्थिरता के लिए सैद्धांतिक गारंटी प्रदान की

सीमाएं

  1. रैखिकीकरण सीमा: कुछ प्रणालियों (जैसे गैर-होलोनोमिक प्रणालियां) का रैखिकीकरण नियंत्रणीय नहीं हो सकता है
  2. बाधा हैंडलिंग: कठोर बाधाओं को नरम बाधाओं में परिवर्तित करना आवश्यक है (जैसे नरम लैंडिंग की ऊंचाई बाधा)
  3. कम्प्यूटेशनल जटिलता: स्थानांतरण समय अनुकूलन की आवश्यकता, कम्प्यूटेशनल बोझ बढ़ाता है

भविष्य की दिशाएं

  1. अधिक जटिल बाधाओं तक विस्तार: पथ बाधाओं और संकर प्रणालियों को संभालना
  2. वास्तविक समय कार्यान्वयन: ऑनलाइन अनुप्रयोगों के लिए तेज़ एल्गोरिथ्म विकसित करना
  3. मजबूती वृद्धि: मॉडल अनिश्चितता और बाहरी व्यवधान पर विचार करना

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक कठोरता: पूर्ण गणितीय रूपरेखा और अभिसरण प्रमाण प्रदान करता है
  2. व्यावहारिकता: तीन विभिन्न अंतरिक्ष अनुप्रयोगों में विधि को सत्यापित किया
  3. नवाचार: परिमित समय क्षितिज और अनंत समय क्षितिज विधियों के लाभों को चतुराई से जोड़ता है
  4. स्थिरता गारंटी: CLF के माध्यम से वैश्विक स्पर्शोन्मुख स्थिरता सुनिश्चित करता है

कमियां

  1. मान्यता शर्तें: प्रणाली नियंत्रणीयता और लागत फलन के विशिष्ट गुणों पर निर्भर
  2. पैरामीटर ट्यूनिंग: टर्मिनल सेट पैरामीटर M के चयन के लिए स्पष्ट मार्गदर्शन की कमी
  3. कम्प्यूटेशनल दक्षता: स्थानांतरण समय अनुकूलन को कई पुनरावृत्तियों की आवश्यकता हो सकती है

प्रभाव

  1. शैक्षणिक मूल्य: अनंत समय क्षितिज अरैखिक नियंत्रण के लिए नई सैद्धांतिक रूपरेखा प्रदान करता है
  2. इंजीनियरिंग महत्व: अंतरिक्ष मिशन नियंत्रण के लिए व्यावहारिक डिज़ाइन विधि प्रदान करता है
  3. विस्तारशीलता: विधि अन्य दीर्घकालीन स्थिरता की आवश्यकता वाली नियंत्रण समस्याओं तक विस्तारित हो सकती है

लागू परिदृश्य

  • दीर्घकालीन संचालन वाले अंतरिक्ष मिशन
  • वैश्विक स्थिरता गारंटी की आवश्यकता वाली नियंत्रण प्रणालियां
  • अरैखिक गतिशीलता वाली जटिल प्रणालियां
  • सुरक्षा पर उच्च आवश्यकता वाले महत्वपूर्ण मिशन

संदर्भ

पेपर इष्टतम नियंत्रण सिद्धांत, अंतरिक्ष यान नियंत्रण, संख्यात्मक अनुकूलन विधियों आदि क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हुए 23 संबंधित संदर्भों का हवाला देता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।


समग्र मूल्यांकन: यह सैद्धांतिक और अनुप्रयोग दोनों पहलुओं में महत्वपूर्ण योगदान वाला एक उच्च गुणवत्ता वाला पेपर है। लेखकों ने अनंत समय क्षितिज समस्या को एक सुगम परिमित समय क्षितिज समस्या में चतुराई से परिवर्तित किया है, जबकि स्थिरता की गारंटी दी है। तीन महत्वपूर्ण अंतरिक्ष अनुप्रयोगों में सत्यापन विधि के व्यावहारिक मूल्य को प्रदर्शित करता है। कुछ सीमाओं के बावजूद, समग्र रूप से यह अंतरिक्ष नियंत्रण क्षेत्र के लिए मूल्यवान सैद्धांतिक उपकरण और व्यावहारिक विधि प्रदान करता है।