Inverse optimal design of input-to-state stabilizing homogeneous controllers for nonlinear homogeneous systems
Lu, Lyu, Yu
This work studies the inverse optimality of input-to-state stabilizing controllers with input-output stability guarantees for nonlinear homogeneous systems. We formulate a new inverse optimal control problem, where the cost functional incorporates penalties on the output, in addition to the state, control and disturbance as in current related works. One benefit of penalizing the output is that the resulting inverse optimal controllers can ensure both input-to-state stability and input-output stability. We propose a technique for constructing the corresponding meaningful cost functional by using homogeneity properties, and provide sufficient conditions on solving the inverse optimal gain assignment problem. We show that homogeneous stabilizability of homogeneous systems in the case without disturbance is sufficient for the solvability of inverse optimal gain assignment problem for homogeneous systems.
এই পেপারটি অ-রৈখিক সমজাত সিস্টেমের ইনপুট-টু-স্টেট স্থিতিশীলতা (ISS) নিয়ন্ত্রকদের বিপরীত সর্বোত্তমতা সমস্যা অধ্যয়ন করে এবং ইনপুট-আউটপুট স্থিতিশীলতা (IOS) নিশ্চয়তা প্রদান করে। নিবন্ধটি একটি নতুন বিপরীত সর্বোত্তম নিয়ন্ত্রণ সমস্যা প্রস্তাব করে যেখানে খরচ কার্যকারিতা ঐতিহ্যবাহী অবস্থা, নিয়ন্ত্রণ এবং বিঘ্ন শাস্তির উপর ভিত্তি করে আউটপুটের শাস্তি যোগ করে। এই ডিজাইনের সুবিধা হল উৎপাদিত বিপরীত সর্বোত্তম নিয়ন্ত্রক ISS এবং IOS উভয়ই নিশ্চিত করে। লেখকরা অর্থপূর্ণ খরচ কার্যকারিতা নির্মাণের জন্য সমজাত বৈশিষ্ট্য ব্যবহার করে কৌশল প্রস্তাব করেন এবং বিপরীত সর্বোত্তম লাভ বরাদ্দ সমস্যা সমাধানের জন্য পর্যাপ্ত শর্ত প্রদান করেন। গবেষণা দেখায় যে বিঘ্ন-মুক্ত ক্ষেত্রে সমজাত সিস্টেমের সমজাত স্থিতিশীলতা সমজাত সিস্টেমের বিপরীত সর্বোত্তম লাভ বরাদ্দ সমস্যার সমাধানযোগ্যতার জন্য একটি পর্যাপ্ত শর্ত।
এই পেপারের মূল সমস্যা হল: কীভাবে এমন একটি বিপরীত সর্বোত্তম নিয়ন্ত্রক ডিজাইন করতে হয় যা ইনপুট-টু-স্টেট স্থিতিশীলতা (ISS) এবং ইনপুট-আউটপুট স্থিতিশীলতা (IOS) উভয়ই নিশ্চিত করে এবং এর জন্য অর্থপূর্ণ খরচ কার্যকারিতা নির্মাণ করে।
সর্বোত্তমতার সুবিধা: সর্বোত্তম নিয়ন্ত্রকদের অনেক আদর্শ বৈশিষ্ট্য রয়েছে, যেমন লাভ মার্জিন, দৃঢ়তা ইত্যাদি। বিপরীত সর্বোত্তম নিয়ন্ত্রণ হ্যামিল্টন-জ্যাকোবি-আইসাক্স (HJI) সমীকরণ সমাধানের কঠিনতা এড়ায়।
ISS এর সীমাবদ্ধতা: ISS অবস্থা এবং বিঘ্নের মধ্যে সম্পর্ক L∞ দৃষ্টিকোণ থেকে বর্ণনা করে, কিন্তু কিছু নিয়ন্ত্রণ সিস্টেমে (যেমন প্যাসিভ সনাক্তকরণ-ভিত্তিক মডুলার অভিযোজিত নিয়ন্ত্রণ), "আগ্রহের আউটপুট" L∞ স্থানে থাকা নিশ্চিত করা কঠিন।
IOS এর প্রয়োজনীয়তা: বাস্তব নিয়ন্ত্রণ সমস্যায়, ISS নিশ্চিত করার পরে বিঘ্ন ইনপুট নির্দিষ্ট বন্ধ-লুপ সংকেতকে কীভাবে প্রভাবিত করে তা বোঝা প্রয়োজন, বিঘ্ন হ্রাস বাস্তবায়নের জন্য। উদাহরণস্বরূপ অ-রৈখিক H∞ নিয়ন্ত্রণে, সীমিত লাভ L2 স্থিতিশীলতা প্রয়োজন।
Krstic এবং Li 11 এর অগ্রগামী কাজ: বিপরীত সর্বোত্তম ISS নিয়ন্ত্রণ কাঠামো প্রস্তাব করেছে, কিন্তু এর খরচ কার্যকারিতা শুধুমাত্র অবস্থা, নিয়ন্ত্রণ এবং বিঘ্নের শাস্তি অন্তর্ভুক্ত করে, আউটপুট শাস্তি অন্তর্ভুক্ত করে না।
IOS নিশ্চয়তার অভাব: উদাহরণ ১ যেমন দেখায়, আউটপুট শাস্তি না দেওয়া বিপরীত সর্বোত্তম নিয়ন্ত্রক IOS (যেমন L2 স্থিতিশীলতা) নিশ্চিত করতে পারে না।
নির্মাণের অসুবিধা: যখন আউটপুট শাস্তি দেওয়া হয়, অর্থপূর্ণ খরচ কার্যকারিতা খুঁজে পাওয়া কঠিন, কারণ শাস্তি পদটি সম্পূর্ণ অবস্থা স্থানে অ-নেতিবাচক হতে হবে।
সমজাত বৈশিষ্ট্যের সুবিধা: সমজাত বৈশিষ্ট্য উপযুক্ত স্কেলিংয়ের মাধ্যমে সিস্টেমের স্থানীয় বৈশিষ্ট্যকে বৈশ্বিক বৈশিষ্ট্যে রূপান্তরিত করতে পারে, যা উপরোক্ত অসুবিধাগুলি সমাধানের জন্য সরঞ্জাম সরবরাহ করে।
তাত্ত্বিক প্রয়োজন: ISS নিয়ন্ত্রকদের IOS নিশ্চয়তা সহ কোন সর্বোত্তম মানদণ্ড সম্পর্কে বিপরীত সর্বোত্তম তা অধ্যয়ন করা প্রয়োজন।
১. নতুন বিপরীত সর্বোত্তম নিয়ন্ত্রণ সমস্যা: প্রথমবারের মতো খরচ কার্যকারিতায় আউটপুট শাস্তি দেওয়ার বিপরীত সর্বোত্তম নিয়ন্ত্রণ সমস্যা প্রস্তাব করা হয়েছে (সংজ্ঞা ৭), যাতে বিপরীত সর্বোত্তম নিয়ন্ত্রক ISS এবং IOS উভয়ই নিশ্চিত করে।
२. নির্মাণ কৌশল: সমজাত বৈশিষ্ট্য ব্যবহার করে অর্থপূর্ণ খরচ কার্যকারিতা নির্মাণের কৌশল প্রস্তাব করা হয়েছে (লেম্মা ৩ এবং লেম্মা ४), বিশেষত কীভাবে পরামিতি κ এবং ফাংশন γ(s) নির্বাচন করতে হয় তা সমাধান করে যাতে অবস্থা শাস্তি l(x) ইতিবাচক নির্দিষ্ট হয়।
३. পর্যাপ্ত শর্ত: উপপাদ্য ১ এ বিপরীত সর্বোত্তম লাভ বরাদ্দ সমস্যা সমাধানের জন্য পর্যাপ্ত শর্ত প্রদান করা হয়েছে, প্রমাণ করে যে ডিজাইন করা নিয়ন্ত্রক ISS এবং সীমিত লাভ L2 স্থিতিশীলতা উভয়ই নিশ্চিত করে।
४. সমাধানযোগ্যতা ফলাফল: উপপাদ্য २ এ প্রমাণ করা হয়েছে যে বিঘ্ন-মুক্ত ক্ষেত্রে সমজাত সিস্টেমের সমজাত স্থিতিশীলতা সমজাত সিস্টেমের বিপরীত সর্বোত্তম লাভ বরাদ্দ সমস্যার সমাধানযোগ্যতার জন্য একটি পর্যাপ্ত শর্ত, এবং স্পষ্ট নিয়ন্ত্রক ডিজাইন পদ্ধতি প্রদান করা হয়েছে।
५. তাত্ত্বিক অগ্রগতি: সাহিত্য 11 এর পদ্ধতি আউটপুট শাস্তি ক্ষেত্রে সরাসরি প্রয়োগ করা যায় না এমন সীমাবদ্ধতা অতিক্রম করে, সম্পূর্ণ তাত্ত্বিক কাঠামো এবং ডিজাইন প্রক্রিয়া প্রদান করে।
উদ্ভাবন: বিশেষ পছন্দের মাধ্যমে γ(s) = (1/μ)s², যাতে ℓγ(2εs) = ε²ℓγ(2s), সহায়ক সিস্টেম সমজাত বৈশিষ্ট্য সংরক্ষণ করে।
তাৎপর্য: এটি অবস্থা শাস্তি l(x) ইতিবাচকতা প্রমাণের চাবিকাঠি, কারণ স্থানীয় বৈশিষ্ট্যকে বৈশ্বিক পর্যায়ে প্রসারিত করতে সমজাত বৈশিষ্ট্য ব্যবহার করা প্রয়োজন।
চ্যালেঞ্জ: যেহেতু l(x) = l̄(x) - h(x)ᵀR(x)h(x)/κ, এবং l̄(x) এবং h(x)ᵀR(x)h(x) উভয়ই ইতিবাচক অ-রৈখিক ফাংশন, সমস্ত x ∈ ℝⁿ{0} এর জন্য l(x) > 0 নিশ্চিত করা কঠিন।
পর্যবেক্ষণ: সাহিত্য 11 এর নিয়ন্ত্রক তার খরচ কার্যকারিতা ন্যূনতম করে, কিন্তু অবস্থা শাস্তি l̃(x) = l̄(x) - x₂⁶ নেতিবাচক হতে পারে, এই পেপারের খরচ কার্যকারিতার প্রয়োজনীয়তা পূরণ করে না।
শর্ত: যদি নিয়ন্ত্রণ আইন u = α(x) = -(κ/2ϑ²)R(x)⁻¹(LG₁V)ᵀ সহায়ক সিস্টেম অ্যাসিম্পটোটিকভাবে স্থিতিশীল করে
উপসংহার: নিয়ন্ত্রণ আইন u = α*(x) = -(βκ/2ϑ²)R(x)⁻¹(LG₁V)ᵀ (β ≥ 2) নিম্নলিখিত বৈশিষ্ট্য রয়েছে:
१. বিপরীত সর্বোত্তমতা: খরচ কার্যকারিতা (10) ন্যূনতম করে, ন্যূনতম মান Jmin = 2βV(x(0))
२. ISS: বন্ধ-লুপ সিস্টেম V̇(x) ≤ -c₁Γ(x)^(2(k+r₀)) + γ(|w|/2) সন্তুষ্ট করে
३. L2 স্থিতিশীলতা: যখন γ(s) = (1/μ)s², ||y||₂ ≤ κL||w||₂ + c₀, যেখানে κL = √(κβ/(4ρmμ))
প্রধান ফলাফল: যদি সিস্টেম ẋ = f(x) + G₁(x)u (বিঘ্ন-মুক্ত ক্ষেত্র) সমজাত স্থিতিশীল হয়, তবে বিপরীত সর্বোত্তম লাভ বরাদ্দ সমস্যা সমাধানযোগ্য।
নির্মাণমূলক প্রমাণ:
१. সমজাত স্থিতিশীলতা দ্বারা, সমজাত Lyapunov ফাংশন V(x) বিদ্যমান যা Lf V + LG₁Vαh(x) < 0 সন্তুষ্ট করে
२. Sontag-টাইপ নিয়ন্ত্রক αs(x) ডিজাইন করুন
३. |R(x)| এর জন্য ইতিবাচক নিম্ন সীমা প্রমাণ করুন
४. বিশেষ γ নির্বাচন করুন যাতে ℓγ(2εs) = ε²ℓγ(2s)
५. নিয়ন্ত্রক সহায়ক সিস্টেম স্থিতিশীল করে যাচাই করুন
६. বিপরীত সর্বোত্তম নিয়ন্ত্রক পেতে উপপাদ্য १ প্রয়োগ করুন
१. তাত্ত্বিক অবদান: ISS এবং IOS উভয়ই নিশ্চিত করে এমন বিপরীত সর্বোত্তম নিয়ন্ত্রণ তাত্ত্বিক কাঠামো প্রথমবার প্রতিষ্ঠা করা হয়েছে, আউটপুট শাস্তি খরচ কার্যকারিতা নির্মাণের কঠিন সমস্যা সমাধান করেছে।
२. পর্যাপ্ততা ফলাফল: বিঘ্ন-মুক্ত ক্ষেত্রে সমজাত স্থিতিশীলতা সমজাত সিস্টেমের বিপরীত সর্বোত্তম লাভ বরাদ্দ সমস্যার সমাধানযোগ্যতার জন্য পর্যাপ্ত শর্ত প্রমাণ করা হয়েছে (উপপাদ্য २)।
३. নির্মাণ পদ্ধতি: সম্পূর্ণ ডিজাইন প্রক্রিয়া প্রদান করা হয়েছে:
সমজাত বৈশিষ্ট্য সংরক্ষণ γ(s) নির্বাচন ব্যবহার করুন
সমজাত গোলক কৌশল দ্বারা পরামিতি κ নির্ধারণ করুন
ওজন ম্যাট্রিক্স ধারাবাহিকতা নিশ্চিত করতে Sontag-টাইপ নিয়ন্ত্রক ব্যবহার করুন
४. কর্মক্ষমতা নিশ্চয়তা: ডিজাইন করা নিয়ন্ত্রক রয়েছে:
१. সমজাত বৈশিষ্ট্যের প্রয়োজনীয়তা: পদ্ধতি শুধুমাত্র সমজাত সিস্টেম বা সমজাত সিস্টেম দ্বারা অনুমানিত সিস্টেমের জন্য প্রযোজ্য (মন্তব্য 7 স্থানীয় সমাধান প্রদান করে)।
२. একক ইনপুট সীমাবদ্ধতা: তাত্ত্বিক কাঠামো বর্তমানে শুধুমাত্র স্কেলার নিয়ন্ত্রণ ইনপুট u ∈ ℝ বিবেচনা করে, বহু-ইনপুট ক্ষেত্রে সম্প্রসারণ আরও গবেষণা প্রয়োজন।
३. Lyapunov ফাংশন নির্ভরতা: সমজাত Lyapunov ফাংশন V(x) পূর্বে জানা প্রয়োজন, জটিল সিস্টেমের জন্য নির্মাণ কঠিন হতে পারে।
४. পরামিতি নির্বাচন জটিলতা: পরামিতি κ নির্বাচন সমজাত গোলক উপর অপ্টিমাইজেশন সমস্যা সমাধান প্রয়োজন, গণনা জটিল হতে পারে।
५. মসৃণতা অনুমান: f(x), G(x), h(x) ℝⁿ{0} এ ক্রমাগত পার্থক্যযোগ্য হতে প্রয়োজন, কিছু অ-মসৃণ সিস্টেম বাদ দেয়।
६. অর্থোগোনালিটি অনুমান: অনুমান hᵀd = 0 কিছু প্রয়োগে পূরণ না হতে পারে, পদ্ধতির প্রযোজ্যতা সীমিত করে।
সমজাত বৈশিষ্ট্যের প্রয়োজনীয়তা কঠোর: অনেক বাস্তব সিস্টেম সমজাত বৈশিষ্ট্য সন্তুষ্ট করে না, যদিও মন্তব্য 7 স্থানীয় সমাধান প্রদান করে, বৈশ্বিক কর্মক্ষমতা নিশ্চয়তা নেই।
একক ইনপুট সীমাবদ্ধতা: বহু-ইনপুট ক্ষেত্র অন্তর্ভুক্ত নয়, জটিল সিস্টেমে প্রয়োগ সীমিত করে।
1 Kawski, M. (1990). সমজাত স্থিতিশীলকারী প্রতিক্রিয়া আইন।
4 Rosier, L. (1992). সমজাত ক্রমাগত ভেক্টর ক্ষেত্রের জন্য সমজাত Lyapunov ফাংশন।
11 Krstic, M., & Li, Z. H. (1998). ইনপুট-টু-স্টেট স্থিতিশীলকারী অ-রৈখিক নিয়ন্ত্রকদের বিপরীত সর্বোত্তম ডিজাইন। (এই পেপারের প্রধান রেফারেন্স)
19 Bhat, S. P., & Bernstein, D. S. (2005). সীমিত সময় স্থিতিশীলতার প্রয়োগ সহ জ্যামিতিক সমজাত বৈশিষ্ট্য।
20 Sontag, E. D. (1989). অ-রৈখিক স্থিতিশীলকরণে Artstein এর উপপাদ্যের সর্বজনীন নির্মাণ।
32 Polyakov, A. (2020). সিস্টেম এবং নিয়ন্ত্রণে সাধারণীকৃত সমজাত বৈশিষ্ট্য।
এটি নিয়ন্ত্রণ তত্ত্বের একটি উচ্চ মানের তাত্ত্বিক পেপার, বিপরীত সর্বোত্তম নিয়ন্ত্রণ ক্ষেত্রে গুরুত্বপূর্ণ অবদান রেখেছে। সমজাত বৈশিষ্ট্য চতুরভাবে ব্যবহার করে, প্রথমবার ISS এবং IOS উভয়ই নিশ্চিত করে এমন বিপরীত সর্বোত্তম নিয়ন্ত্রণ সমস্যা সমাধান করেছে। তত্ত্ব কঠোর, প্রমাণ সম্পূর্ণ, প্রযুক্তিগত গভীরতা উচ্চ। প্রধান অপূর্ণতা হল সমজাত বৈশিষ্ট্য দ্বারা প্রযোজ্যতা পরিসীমা সীমিত, পরীক্ষামূলক যাচাইকরণ অপূর্ণ। পরবর্তী কাজ সংখ্যাসূচক সিমুলেশন এবং বাস্তব প্রয়োগ যাচাইকরণ শক্তিশালী করা, এবং সমজাত বৈশিষ্ট্য প্রয়োজনীয়তা শিথিল করার সম্ভাবনা অন্বেষণ করা সুপারিশ করা হয়। অ-রৈখিক নিয়ন্ত্রণ তত্ত্ব গবেষণায় নিয়োজিত পণ্ডিতদের জন্য, এটি গভীরভাবে পড়ার যোগ্য একটি পেপার।