2025-11-13T08:28:10.831761

Optimal Control with Lyapunov Stability Guarantees for Space Applications

Abhijeet, Mohamed, Sharma et al.

This paper investigates the infinite horizon optimal control problem (OCP) for space applications characterized by nonlinear dynamics. The proposed approach divides the problem into a finite horizon OCP with a regularized terminal cost, guiding the system towards a terminal set, and an infinite horizon linear regulation phase within this set. This strategy guarantees global asymptotic stability under specific assumptions. Our method maintains the system's fully nonlinear dynamics until it reaches the terminal set, where the system dynamics is linearized. As the terminal set converges to the origin, the difference in optimal cost incurred reduces to zero, guaranteeing an efficient and stable solution. The approach is tested through simulations on three problems: spacecraft attitude control, rendezvous maneuver, and soft landing. In spacecraft attitude control, we focus on achieving precise orientation and stabilization. For rendezvous maneuvers, we address the navigation of a chaser to meet a target spacecraft. For the soft landing problem, we ensure a controlled descent and touchdown on a planetary surface. We provide numerical results confirming the effectiveness of the proposed method in managing these nonlinear dynamics problems, offering robust solutions essential for successful space missions.

academic

মহাকাশ প্রয়োগের জন্য লায়াপুনভ স্থিতিশীলতা নিশ্চয়তা সহ সর্বোত্তম নিয়ন্ত্রণ

মৌলিক তথ্য

পেপার আইডি: 2510.08854
শিরোনাম: Optimal Control with Lyapunov Stability Guarantees for Space Applications
লেখক: Abhijeet, Mohamed Naveed Gul Mohamed, Aayushman Sharma, Suman Chakravorty (টেক্সাস এ অ্যান্ড এম বিশ্ববিদ্যালয়)
শ্রেণীবিভাগ: math.OC (অপ্টিমাইজেশন এবং নিয়ন্ত্রণ), cs.SY (সিস্টেম এবং নিয়ন্ত্রণ), eess.SY (সিস্টেম এবং নিয়ন্ত্রণ)
প্রকাশনার সময়: ২০২৫ সালের ৯ অক্টোবর
পেপার লিংক: https://arxiv.org/abs/2510.08854v1

সারসংক্ষেপ

এই পেপারটি মহাকাশ প্রয়োগে অরৈখিক গতিশীলতা বৈশিষ্ট্যযুক্ত অসীম সময়ক্ষেত্র সর্বোত্তম নিয়ন্ত্রণ সমস্যা (OCP) অধ্যয়ন করে। প্রস্তাবিত পদ্ধতি সমস্যাটিকে দুটি পর্যায়ে বিভক্ত করে: নিয়মিতকৃত টার্মিনাল খরচ সহ সীমিত সময়ক্ষেত্র OCP, যা সিস্টেমকে টার্মিনাল সেটে পৌঁছাতে পরিচালিত করে; এবং সেই সেটের মধ্যে অসীম সময়ক্ষেত্র রৈখিক নিয়ন্ত্রণ পর্যায়। এই কৌশল নির্দিষ্ট অনুমানের অধীনে বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতা নিশ্চিত করে। পদ্ধতিটি টার্মিনাল সেটে পৌঁছানোর আগে সিস্টেমের সম্পূর্ণ অরৈখিক গতিশীলতা বজায় রাখে, তারপর সিস্টেম গতিশীলতা রৈখিকীকরণ করে। টার্মিনাল সেট মূলবিন্দুতে সংবৃত হওয়ার সাথে সাথে, উৎপাদিত সর্বোত্তম খরচের পার্থক্য শূন্যের দিকে প্রবণ হয়, উচ্চ দক্ষ স্থিতিশীল সমাধান নিশ্চিত করে। পদ্ধতিটি তিনটি সমস্যার সিমুলেশনের মাধ্যমে যাচাই করা হয়: মহাকাশযান মনোভাব নিয়ন্ত্রণ, সংযোগ কৌশল এবং নরম অবতরণ।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

১. মহাকাশ মিশনের নিয়ন্ত্রণ চ্যালেঞ্জ: মহাকাশ অন্বেষণের জন্য মিশনের সাফল্য নিশ্চিত করতে উন্নত নিয়ন্ত্রণ কৌশল প্রয়োজন, মহাকাশযানের নির্ভুল দিকনির্দেশনা থেকে শুরু করে ডকিং এবং অবতরণের সূক্ষ্ম কৌশল পর্যন্ত সবকিছুই মহাকাশ পরিবেশের অন্তর্নিহিত চ্যালেঞ্জ অতিক্রম করতে হয়।

२. ঐতিহ্যবাহী পদ্ধতির সীমাবদ্ধতা:

শুটিং পদ্ধতি (Shooting Method): মনোভাব নিয়ন্ত্রণ এবং ট্র্যাজেক্টরি অপ্টিমাইজেশনে কার্যকর, কিন্তু খাপ খাওয়ানোর ক্ষমতা দুর্বল এবং প্রাথমিক অনুমানের প্রতি সংবেদনশীল
সরাসরি পদ্ধতি (SQP, ইন্টেরিয়র পয়েন্ট): সীমাবদ্ধতা পরিচালনা করতে পারে, কিন্তু বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতা বা প্রতিক্রিয়া নিশ্চিত করতে পারে না
শক্তিশালী শিক্ষা (RL): ডেটা নির্ভরশীল, ফলাফল অসামঞ্জস্যপূর্ণ

३. দীর্ঘমেয়াদী স্থিতিশীলতার প্রয়োজনীয়তা: মহাকাশ মিশনের জন্য সিস্টেমকে যেকোনো প্রাথমিক অবস্থা থেকে নির্দিষ্ট টার্মিনাল অবস্থায় পৌঁছাতে সক্ষম হতে হবে, যা বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতাকে মহাকাশ মিশনের জন্য বিশেষভাবে মূল্যবান করে তোলে।

গবেষণা প্রেরণা

বর্তমান পদ্ধতিগুলি সর্বোত্তম নিয়ন্ত্রণ সমস্যা সমাধানে এবং দীর্ঘমেয়াদী স্থিতিশীলতার প্রয়োজনীয়তার সীমাবদ্ধতার সমাধান করতে, এই পেপারটি সমস্যাটিকে অসীম সময়ক্ষেত্র OCP হিসাবে পুনর্নির্ধারণ করে, প্রতিক্রিয়া নিশ্চিত করতে এবং বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতা গ্যারান্টি দিতে একটি পরিচালনাযোগ্য পদ্ধতি গ্রহণ করে।

মূল অবদান

१. অসীম সময়ক্ষেত্র অরৈখিক সর্বোত্তম নিয়ন্ত্রণ সমাধানের জন্য একটি নতুন কাঠামো প্রস্তাব করা: অসীম সময়ক্ষেত্র সমস্যাটিকে সীমিত সময়ক্ষেত্র অরৈখিক OCP এবং রৈখিক নিয়ন্ত্রণের দুটি পর্যায়ে বিভক্ত করা

२. তাত্ত্বিক নিশ্চয়তা প্রতিষ্ঠা করা: প্রস্তাবিত পদ্ধতি বেলম্যান সমীকরণ পূরণ করে এবং নিয়ন্ত্রণ লায়াপুনভ ফাংশন (CLF) প্রদান করে, বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতা নিশ্চিত করে তা প্রমাণ করা

३. ব্যবহারিক অ্যালগরিদম উন্নয়ন: পুনরাবৃত্তিমূলক রৈখিক দ্বিঘাত নিয়ন্ত্রক (iLQR) এবং রৈখিক দ্বিঘাত নিয়ন্ত্রক (LQR) এর সংকর পদ্ধতি সংমিশ্রণ করা

४. পদ্ধতির কার্যকারিতা যাচাই করা: তিনটি গুরুত্বপূর্ণ মহাকাশ প্রয়োগে যাচাই: মহাকাশযান মনোভাব নিয়ন্ত্রণ, সংযোগ কৌশল এবং নরম অবতরণ

५. সংবৃতি বিশ্লেষণ প্রদান করা: প্রমাণ করা যে টার্মিনাল সেট প্যারামিটার M→0 হলে, বিকল্প নির্মাণ OCP (AC-OCP) এর খরচ প্রকৃত অসীম সময়ক্ষেত্র OCP খরচে সংবৃত হয়

পদ্ধতির বিস্তারিত বিবরণ

কাজের সংজ্ঞা

অসীম সময়ক্ষেত্র সর্বোত্তম নিয়ন্ত্রণ সমস্যা সংজ্ঞায়িত করা হয়:

J*∞(x) = min{ut} Σ(t=0 to ∞) c(xt, ut); given x0 = x
subject to: xt+1 = f(xt, ut)

যেখানে:

xt ∈ Rn: সিস্টেম অবস্থা ভেক্টর
ut ∈ Rp: নিয়ন্ত্রণ ইনপুট
c(xt, ut): বর্ধিত খরচ ফাংশন

মডেল স্থাপত্য

१. বিকল্প নির্মাণ সর্বোত্তম নিয়ন্ত্রণ সমস্যা (AC-OCP)

অসীম সময়ক্ষেত্র সমস্যাটিকে রূপান্তরিত করা:

JM∞(x) = min{ut}(T-1, t=0), T [Σ(t=0 to T-1) c(xt, ut) + max(J̄∞(xT), M)]
subject to: xt+1 = f(xt, ut), xT ∈ ΩM

যেখানে ΩM = {x | J̄∞(x) ≤ M} টার্মিনাল সেট।

२. দুই-পর্যায় সমাধান কৌশল

প্রথম পর্যায়: অরৈখিক সীমিত সময়ক্ষেত্র OCP

iLQR ব্যবহার করে সীমিত সময়ক্ষেত্র সমস্যা সমাধান:

JT∞(x) = min{ut}(T-1, t=0) [Σ(t=0 to T-1) c(xt, ut) + J̄∞(xT)]

দ্বিতীয় পর্যায়: রৈখিক নিয়ন্ত্রণ

টার্মিনাল সেট ΩM এর মধ্যে LQR নিয়ন্ত্রক ব্যবহার করা
রৈখিকীকৃত সিস্টেম: J̄∞(x) = xTP∞x, যেখানে P∞ স্থিতিশীল রিক্যাটি সমীকরণের সমাধান

३. iLQR অ্যালগরিদম বাস্তবায়ন

এগিয়ে যাওয়া প্রচার:

uk+1_t = uk_t + αkt + Kt(xk+1_t - xk_t)
xk+1_t+1 = f(xk+1_t, uk+1_t)

পিছিয়ে যাওয়া প্রচার: Q ফাংশনের আংশিক ডেরিভেটিভ গণনা এবং লাভ আপডেট:

kt = -Q^(-1)_utut * Qut
Kt = -Q^(-1)_utut * Qutxt

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. মুক্ত টার্মিনাল সময় অপ্টিমাইজেশন: টার্মিনাল সেটে মসৃণ রূপান্তর নিশ্চিত করতে স্থানান্তর সময় T অপ্টিমাইজ করা

२. ক্রমবর্ধমান সর্বোত্তমতা: প্রমাণ করা যে limM→0 JM∞(x) = J*∞(x)

३. স্থিতিশীলতা নিশ্চয়তা: AC-OCP এর খরচ ফাংশন বেলম্যান সমীকরণ পূরণ করে, CLF হিসাবে কাজ করে বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতা নিশ্চিত করে

४. সংকর গতিশীলতা পরিচালনা: টার্মিনাল সেটের বাইরে সম্পূর্ণ অরৈখিক গতিশীলতা বজায় রাখা, টার্মিনাল সেটের মধ্যে রৈখিকীকরণ করা

পরীক্ষামূলক সেটআপ

প্রয়োগের দৃশ্যকল্প

এই পেপারটি তিনটি গুরুত্বপূর্ণ মহাকাশ প্রয়োগে পদ্ধতি যাচাই করে:

१. মহাকাশযান মনোভাব নিয়ন্ত্রণ २. সংযোগ কৌশল
३. নরম অবতরণ

সিস্টেম গতিশীলতা

१. মনোভাব নিয়ন্ত্রণ

অবস্থা ভেক্টর: ψ, θ, φ, ω1, ω2, ω3T

অয়লার কোণ গতিশীলতা এবং কৌণিক বেগ গতিশীলতা
জড়তা মেট্রিক্স: J = diag4500, 2000, 7500
সময় ডোমেইন: ২০০ সেকেন্ড, বিচ্ছিন্নকরণ পদক্ষেপ: ০.১ সেকেন্ড

२. সংযোগ কৌশল

অবস্থা আপেক্ষিক অবস্থান ত্রুটি er, আপেক্ষিক বেগ ত্রুটি ev এবং ভর m অন্তর্ভুক্ত করে

উপবৃত্তাকার কক্ষপথ গতিশীলতা
সময় ডোমেইন: ৬০০০ সেকেন্ড, বিচ্ছিন্নকরণ পদক্ষেপ: ২ সেকেন্ড

३. নরম অবতরণ

মনোভাব এবং অবস্থান গতিশীলতা সংমিশ্রণ

মঙ্গল মহাকর্ষ: gref = 0, 0, -3.7114T
ভর পরিবর্তন এবং থ্রাস্ট সীমাবদ্ধতা অন্তর্ভুক্ত
সময় ডোমেইন: ৩০ সেকেন্ড, বিচ্ছিন্নকরণ পদক্ষেপ: ০.२ সেকেন্ড

মূল্যায়ন মেট্রিক্স

মোট খরচ ফাংশন: দ্বিঘাত খরচ c(x,u) = ½(xTQx + uTRu)
টার্মিনাল অবস্থা ত্রুটি
নিয়ন্ত্রণ ইনপুট মসৃণতা
সংবৃতি বিশ্লেষণ

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

१. মনোভাব নিয়ন্ত্রণ

স্থানান্তর সময়ের প্রভাব: ১০ সেকেন্ড থেকে ৮০ সেকেন্ড পর্যন্ত, মোট খরচ ৬.४५×१०^५ থেকে ५.२०×१०^५ এ হ্রাস পায়
অবস্থা সংবৃতি:
- १० সেকেন্ড স্থানান্তর: টার্মিনাল ত্রুটি ३४.८६°, -३३.१९°, -३६.७१°, २.७९°/s, ६.०२°/s, ०.९७°/s
- ८० সেকেন্ড স্থানান্তর: টার্মিনাল ত্রুটি -०.७७°, -०.१५°, ०.५५°, -०.०५°/s, ०.०२°/s, -०.०५°/s

२. সংযোগ কৌশল

স্থানান্তর সময়ের সাথে খরচ হ্রাস: দীর্ঘতর স্থানান্তর সময় কম খরচ এবং ছোট ত্রুটির দিকে পরিচালিত করে
টার্মিনাল অবস্থা তুলনা:
- ६०० সেকেন্ড: অবস্থান ত্রুটি ~१४०० কিমি স্তর, বেগ ত্রুটি ~५००० মি/সেকেন্ড স্তর
- २४०० সেকেন্ড: অবস্থান ত্রুটি ~१ মিটার স্তর, বেগ ত্রুটি ~२ মি/সেকেন্ড স্তর

३. নরম অবতরণ

সফল অবতরণ: २९.९ সেকেন্ডে r3=० (অবতরণ)
টার্মিনাল নির্ভুলতা: অবস্থান ত্রুটি -०.०६ মিটার, -०.०३ মিটার, १.०९ মিটার, বেগ ত্রুটি -०.००७ মি/সেকেন্ড, -०.००८ মি/সেকেন্ড, -०.९९ মি/সেকেন্ড
সীমাবদ্ধতা পরিচালনা: সূচকীয় শাস্তি ফাংশনের মাধ্যমে উচ্চতা সীমাবদ্ধতা পরিচালনা

মূল অনুসন্ধান

१. স্থানান্তর সময় অপ্টিমাইজেশনের গুরুত্ব: দীর্ঘতর স্থানান্তর সময় সিস্টেমকে মূলবিন্দুর কাছাকাছি রৈখিকীকরণ করতে অনুমতি দেয়, উল্লেখযোগ্যভাবে নিয়ন্ত্রণ খরচ হ্রাস করে

२. মসৃণ রূপান্তর: উপযুক্ত স্থানান্তর সময় নিয়ন্ত্রণ ইনপুটের তীব্র পরিবর্তন এড়ায়

३. শক্তিশালীতা: পদ্ধতি বিভিন্ন প্রাথমিক শর্ত এবং সিস্টেম প্যারামিটারের অধীনে ভালভাবে কাজ করে

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. তাত্ত্বিক অবদান: অসীম সময়ক্ষেত্র অরৈখিক OCP এর পরিচালনাযোগ্য সমাধান কাঠামো প্রতিষ্ঠা করা २. ব্যবহারিক মূল্য: গুরুত্বপূর্ণ মহাকাশ প্রয়োগে পদ্ধতির কার্যকারিতা যাচাই করা ३. স্থিতিশীলতা নিশ্চয়তা: বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতার তাত্ত্বিক নিশ্চয়তা প্রদান করা

সীমাবদ্ধতা

१. রৈখিকীকরণ সীমাবদ্ধতা: কিছু সিস্টেম (যেমন অ-সম্পূর্ণ সিস্টেম) এর রৈখিকীকরণ নিয়ন্ত্রণযোগ্য নাও হতে পারে २. সীমাবদ্ধতা পরিচালনা: কঠিন সীমাবদ্ধতা নরম সীমাবদ্ধতায় রূপান্তরিত করতে হবে (যেমন নরম অবতরণের উচ্চতা সীমাবদ্ধতা) ३. গণনামূলক জটিলতা: স্থানান্তর সময় অপ্টিমাইজ করতে হবে, গণনামূলক বোঝা বৃদ্ধি করে

ভবিষ্যত দিকনির্দেশনা

१. আরও জটিল সীমাবদ্ধতায় সম্প্রসারণ: পথ সীমাবদ্ধতা এবং সংকর সিস্টেম পরিচালনা করা २. রিয়েল-টাইম বাস্তবায়ন: অনলাইন প্রয়োগের জন্য দ্রুত অ্যালগরিদম উন্নয়ন করা ३. শক্তিশালীতা বৃদ্ধি: মডেল অনিশ্চয়তা এবং বাহ্যিক বিঘ্ন বিবেচনা করা

গভীর মূল্যায়ন

শক্তি

१. তাত্ত্বিক কঠোরতা: সম্পূর্ণ গাণিতিক কাঠামো এবং সংবৃতি প্রমাণ প্রদান করে २. ব্যবহারিক শক্তি: তিনটি ভিন্ন মহাকাশ প্রয়োগে পদ্ধতি যাচাই করা ३. উদ্ভাবনী: সীমিত সময়ক্ষেত্র এবং অসীম সময়ক্ষেত্র পদ্ধতির সুবিধাগুলি চতুরভাবে একত্রিত করা ४. স্থিতিশীলতা নিশ্চয়তা: CLF এর মাধ্যমে বৈশ্বিক অসিম্পটোটিক স্থিতিশীলতা নিশ্চিত করা

অপূর্ণতা

१. অনুমানের শর্ত: সিস্টেম নিয়ন্ত্রণযোগ্যতা এবং খরচ ফাংশনের নির্দিষ্ট বৈশিষ্ট্যের উপর নির্ভর করে २. প্যারামিটার সমন্বয়: টার্মিনাল সেট প্যারামিটার M এর নির্বাচনে স্পষ্ট নির্দেশনার অভাব ३. গণনামূলক দক্ষতা: স্থানান্তর সময় অপ্টিমাইজেশন একাধিক পুনরাবৃত্তি সমাধান প্রয়োজন হতে পারে

প্রভাব

१. একাডেমিক মূল্য: অসীম সময়ক্ষেত্র অরৈখিক নিয়ন্ত্রণের জন্য নতুন তাত্ত্বিক কাঠামো প্রদান করে २. প্রকৌশল তাৎপর্য: মহাকাশ মিশন নিয়ন্ত্রণের জন্য ব্যবহারিক ডিজাইন পদ্ধতি প্রদান করে ३. সম্প্রসারণযোগ্যতা: পদ্ধতি দীর্ঘমেয়াদী স্থিতিশীলতার প্রয়োজনীয় অন্যান্য নিয়ন্ত্রণ সমস্যায় সাধারণীকরণ করা যায়

প্রযোজ্য দৃশ্যকল্প

দীর্ঘমেয়াদী চলমান মহাকাশ মিশন
বৈশ্বিক স্থিতিশীলতা নিশ্চয়তার প্রয়োজনীয় নিয়ন্ত্রণ সিস্টেম
অরৈখিক গতিশীলতা সহ জটিল সিস্টেম
নিরাপত্তার প্রয়োজনীয়তা অত্যন্ত উচ্চ গুরুত্বপূর্ণ মিশন

সংদর্ভ

পেপারটি সর্বোত্তম নিয়ন্ত্রণ তত্ত্ব, মহাকাশযান নিয়ন্ত্রণ, সংখ্যাগত অপ্টিমাইজেশন পদ্ধতি এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ সহ ২३টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, গবেষণার জন্য একটি শক্তিশালী তাত্ত্বিক ভিত্তি প্রদান করে।

সামগ্রিক মূল্যায়ন: এটি তাত্ত্বিক এবং প্রয়োগ উভয় ক্ষেত্রেই গুরুত্বপূর্ণ অবদান রাখে এমন একটি উচ্চ মানের পেপার। লেখকরা অসীম সময়ক্ষেত্র সমস্যাটিকে পরিচালনাযোগ্য সীমিত সময়ক্ষেত্র সমস্যায় চতুরভাবে রূপান্তরিত করেছেন, একই সাথে স্থিতিশীলতা নিশ্চিত করেছেন। তিনটি গুরুত্বপূর্ণ মহাকাশ প্রয়োগে যাচাইকরণ পদ্ধতির ব্যবহারিক মূল্য প্রদর্শন করে। কিছু সীমাবদ্ধতা থাকলেও, সামগ্রিকভাবে এটি মহাকাশ নিয়ন্ত্রণ ক্ষেত্রের জন্য মূল্যবান তাত্ত্বিক সরঞ্জাম এবং ব্যবহারিক পদ্ধতি প্রদান করে।