2025-11-14T19:58:11.731798

Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability

Shakouri, van Waarde, Baltussen et al.
In this work, we study data-driven stabilization of linear time-invariant systems using prior knowledge of system-theoretic properties, specifically stabilizability and controllability. To formalize this, we extend the concept of data informativity by requiring the existence of a controller that stabilizes all systems consistent with the data and the prior knowledge. We show that if the system is controllable, then incorporating this as prior knowledge does not relax the conditions required for data-driven stabilization. Remarkably, however, we show that if the system is stabilizable, then using this as prior knowledge leads to necessary and sufficient conditions that are weaker than those for data-driven stabilization without prior knowledge. In other words, data-driven stabilization is easier if one knows that the underlying system is stabilizable. We also provide new data-driven control design methods in terms of linear matrix inequalities that complement the conditions for informativity.
academic

ডেটা-চালিত স্থিতিশীলকরণ: স্থিতিশীলযোগ্যতা এবং নিয়ন্ত্রণযোগ্যতার পূর্ব জ্ঞান ব্যবহার করে

মৌলিক তথ্য

  • পেপার আইডি: 2510.25452
  • শিরোনাম: Data-Driven Stabilization Using Prior Knowledge on Stabilizability and Controllability
  • লেখক: Amir Shakouri, Henk J. van Waarde, Tren M.J.T. Baltussen, W.P.M.H. (Maurice) Heemels
  • প্রতিষ্ঠান: গ্রোনিনজেন বিশ্ববিদ্যালয় (Shakouri, van Waarde), আইন্ডহোভেন প্রযুক্তি বিশ্ববিদ্যালয় (Baltussen, Heemels)
  • শ্রেণীবিভাগ: math.OC (অপ্টিমাইজেশন এবং নিয়ন্ত্রণ), cs.SY, eess.SY (সিস্টেম এবং নিয়ন্ত্রণ)
  • প্রকাশনার সময়: arXiv v2, ২০২৫ সালের ৩০ অক্টোবর
  • পেপার লিঙ্ক: https://arxiv.org/abs/2510.25452v2

সারসংক্ষেপ

এই পেপারটি রৈখিক সময়-অপরিবর্তনশীল (LTI) সিস্টেমের ডেটা-চালিত স্থিতিশীলকরণ সমস্যা অধ্যয়ন করে, যেখানে সিস্টেম তত্ত্বের বৈশিষ্ট্য—বিশেষত স্থিতিশীলযোগ্যতা এবং নিয়ন্ত্রণযোগ্যতা—পূর্ব জ্ঞান হিসেবে ব্যবহৃত হয়। লেখকরা ডেটা তথ্যপূর্ণতা (data informativity) ধারণাটি সম্প্রসারিত করেছেন, যেখানে এমন একটি নিয়ন্ত্রক বিদ্যমান থাকা প্রয়োজন যা ডেটা এবং পূর্ব জ্ঞানের সাথে সামঞ্জস্যপূর্ণ সকল সিস্টেমকে স্থিতিশীল করতে পারে। গবেষণায় দেখা যায়:

(১) যদি সিস্টেম নিয়ন্ত্রণযোগ্য হয়, তাহলে এটিকে পূর্ব জ্ঞান হিসেবে ব্যবহার করা ডেটা-চালিত স্থিতিশীলকরণের শর্তকে শিথিল করতে পারে না;

(२) যদি সিস্টেম স্থিতিশীলযোগ্য হয়, তাহলে এই পূর্ব জ্ঞান ব্যবহার করে পূর্ব জ্ঞান ছাড়াই আরও দুর্বল প্রয়োজনীয় ও পর্যাপ্ত শর্ত পাওয়া যায়। অন্যকথায়, যদি অন্তর্নিহিত সিস্টেম স্থিতিশীলযোগ্য হওয়া জানা থাকে, তাহলে ডেটা-চালিত স্থিতিশীলকরণ আরও সহজে বাস্তবায়িত হয়। নিবন্ধটি রৈখিক ম্যাট্রিক্স অসমতা (LMI) ভিত্তিক নতুন ডেটা-চালিত নিয়ন্ত্রণ ডিজাইন পদ্ধতিও প্রদান করে।

গবেষণার পটভূমি এবং প্রেরণা

সমাধানের জন্য মূল সমস্যা

এই পেপারটি সমাধান করে: সীমিত ডেটা শর্তে, সিস্টেমের স্থিতিশীলযোগ্যতা বা নিয়ন্ত্রণযোগ্যতার পূর্ব জ্ঞার সাথে মিলিয়ে, কীভাবে স্থিতিশীলকারী নিয়ন্ত্রক ডিজাইন করা যায়?

ঐতিহ্যবাহী ডেটা-চালিত নিয়ন্ত্রণ অনুমান করে যে সিস্টেম পরামিতি সম্পূর্ণভাবে অজানা, কিন্তু বেশিরভাগ ভৌত সিস্টেমের জন্য এই অনুমান অত্যন্ত রক্ষণশীল। বাস্তবে, আমরা প্রায়ই কিছু পূর্ব জ্ঞান রাখি (যেমন ভর, বসন্ত ধ্রুবক ইত্যাদি ভৌত পরিমাণের পরিসীমা, বা সিস্টেম কাঠামো থেকে অনুমানযোগ্য নিয়ন্ত্রণযোগ্যতা/স্থিতিশীলযোগ্যতা)।

সমস্যার গুরুত্ব

১. ডেটা চাহিদা হ্রাস: সরাসরি ডেটা থেকে নিয়ন্ত্রক ডিজাইন করতে ক্রমাগত উত্তেজনা শর্ত পূরণের জন্য বিশাল পরিমাণ ডেটা প্রয়োজন হতে পারে, কিন্তু পূর্ব জ্ঞানের সাথে মিলিয়ে কম ডেটায় স্থিতিশীলকরণ সম্ভব হতে পারে।

२. ব্যবহারিক সম্ভাব্যতা: কিছু ক্ষেত্রে শুধুমাত্র ডেটা থেকে স্থিতিশীলকারী নিয়ন্ত্রক ডিজাইন করা অসম্ভব (যেমন অবস্থা ডেটা র‍্যাঙ্ক-ঘাটতি), কিন্তু পূর্ব জ্ঞান যোগ করলে ডিজাইন সম্ভব হতে পারে।

३. তাত্ত্বিক সম্পূর্ণতা: সিস্টেম তত্ত্বের বৈশিষ্ট্য (নিয়ন্ত্রণযোগ্যতা, স্থিতিশীলযোগ্যতা) নিয়ন্ত্রণ তত্ত্বের মৌলিক ধারণা, কিন্তু ডেটা-চালিত কাঠামোতে এখনও পর্যাপ্তভাবে অধ্যয়ন করা হয়নি।

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

१. ডেটা-চালিত নিয়ন্ত্রণ: বিদ্যমান কাজ (যেমন De Persis & Tesi ২০१९, van Waarde et al. २०२०) প্রধানত পূর্ব জ্ঞান ছাড়াই অধ্যয়ন করে, কঠোর ডেটা শর্ত (যেমন ক্রমাগত উত্তেজনা, অবস্থা ডেটা পূর্ণ র‍্যাঙ্ক) পূরণ করা প্রয়োজন।

२. পূর্ব জ্ঞান সংহতকরণ: বিদ্যমান গবেষণা শুধুমাত্র পরামিতি সীমানা সীমাবদ্ধতা १२-१४ বা আংশিক পরামিতি পরিচিত १५ পর্যন্ত সীমাবদ্ধ, সিস্টেম তাত্ত্বিক বৈশিষ্ট্য জড়িত নয়।

३. অ-উত্তল চ্যালেঞ্জ: স্থিতিশীলযোগ্য এবং নিয়ন্ত্রণযোগ্য সিস্টেম সেট অ-উত্তল, বিদ্যমান কাজ বিবেচনা করা উত্তল সিস্টেম সেট থেকে ভিন্ন।

গবেষণার প্রেরণা

অনেক ব্যবহারিক প্রয়োগে, সিস্টেম কাঠামো থেকে নিয়ন্ত্রণযোগ্যতা বা স্থিতিশীলযোগ্যতা অনুমান করা যায় (কাঠামোগত নিয়ন্ত্রণযোগ্যতা তত্ত্ব), কিন্তু এই ধরনের পূর্ব জ্ঞান ডেটা-চালিত নিয়ন্ত্রণে এখনও ব্যবহৃত হয়নি। এই পেপারটি এই তাত্ত্বিক শূন্যতা পূরণ করে।

মূল অবদান

এই পেপারের প্রধান অবদানগুলি অন্তর্ভুক্ত করে:

१. তাত্ত্বিক কাঠামো সম্প্রসারণ: ডেটা তথ্যপূর্ণতা (data informativity) ধারণাটি পূর্ব জ্ঞান অন্তর্ভুক্ত করার জন্য সম্প্রসারিত করে, Σ_pk-informativity সংজ্ঞা প্রস্তাব করে (সংজ্ঞা ३)

२. নিয়ন্ত্রণযোগ্যতা পূর্ব জ্ঞানের সমতুল্যতা উপপাদ্য (উপপাদ্য ५): প্রমাণ করে যে নিয়ন্ত্রণযোগ্যতা পূর্ব জ্ঞান হিসেবে ব্যবহার করা পূর্ব জ্ঞান ছাড়াই পরিস্থিতির সমতুল্য, অর্থাৎ নিয়ন্ত্রণযোগ্যতা পূর্ব জ্ঞান শর্ত শিথিল করতে পারে না

३. স্থিতিশীলযোগ্যতা পূর্ব জ্ঞানের সুবিধা উপপাদ্য (উপপাদ্য १४, १५):

  • যখন অবস্থা ডেটা পূর্ণ র‍্যাঙ্ক (rank X⁻ = n), স্থিতিশীলযোগ্যতা পূর্ব জ্ঞান অতিরিক্ত সহায়তা প্রদান করে না
  • যখন অবস্থা ডেটা র‍্যাঙ্ক-ঘাটতি (rank X⁻ < n), স্থিতিশীলযোগ্যতা পূর্ব জ্ঞান উল্লেখযোগ্যভাবে শর্ত শিথিল করে, প্রয়োজনীয় ও পর্যাপ্ত শর্ত প্রদান করে

४. গণনাযোগ্য ডিজাইন পদ্ধতি (প্রস্তাব १६): LMI ভিত্তিক স্থিতিশীলকারী নিয়ন্ত্রক গণনার পদ্ধতি প্রদান করে, Σ_stab-informative ডেটা থেকে সরাসরি সমাধান করা যায়

५. তাত্ত্বিক অন্তর্দৃষ্টি: একটি দেখা যায় এমন বিপরীত ঘটনা প্রকাশ করে—আরও শক্তিশালী বৈশিষ্ট্য (নিয়ন্ত্রণযোগ্যতা) শর্ত শিথিল করতে সাহায্য করতে পারে না, কিন্তু দুর্বল বৈশিষ্ট্য (স্থিতিশীলযোগ্যতা) পারে, এটি কারণ কিছু ক্ষেত্রে সকল ডেটা-সামঞ্জস্যপূর্ণ সিস্টেম নিয়ন্ত্রণযোগ্য নয়।

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

সিস্টেম মডেল: বিচ্ছিন্ন সময় LTI সিস্টেম বিবেচনা করুন

x(t+1) = A_true x(t) + B_true u(t)

যেখানে x(t)∈ℝⁿ অবস্থা, u(t)∈ℝᵐ ইনপুট, সিস্টেম ম্যাট্রিক্স (A_true, B_true) অজানা।

ডেটা: সময় ० থেকে T পর্যন্ত সংগৃহীত ইনপুট-অবস্থা ডেটা

D := ([u(0),...,u(T-1)], [x(0),...,x(T)])

ডেটা ম্যাট্রিক্স সংজ্ঞায়িত করুন:

  • U⁻ = u(0),...,u(T-1)
  • X⁻ = x(0),...,x(T-1)
  • X⁺ = x(1),...,x(T)

ডেটা-সামঞ্জস্যপূর্ণ সিস্টেম সেট:

Σ_D := {(A,B) | X⁺ = AX⁻ + BU⁻}

লক্ষ্য: প্রতিক্রিয়া লাভ K খুঁজে বের করুন যাতে A+BK সকল (A,B)∈Σ_D∩Σ_pk এর জন্য Schur স্থিতিশীল হয় (সকল eigenvalue এর মডুলাস <१)

মূল ধারণা

সংজ্ঞা ३ (স্থিতিশীলকরণের জন্য Σ_pk-informativity): ডেটা D কে স্থিতিশীলকরণের জন্য Σ_pk-informative বলা হয়, যদি একটি K∈ℝᵐˣⁿ বিদ্যমান থাকে যাতে A+BK সকল (A,B)∈Σ_D∩Σ_pk এর জন্য Schur স্থিতিশীল হয়।

পূর্ব জ্ঞান সেট:

  • Σ_cont: সকল নিয়ন্ত্রণযোগ্য সিস্টেম জোড়ার সেট
  • Σ_stab: সকল স্থিতিশীলযোগ্য সিস্টেম জোড়ার সেট

নিয়ন্ত্রণযোগ্যতা পূর্ব জ্ঞান হিসেবে (অংশ III)

উপপাদ্য ५ (মূল ফলাফল): অনুমান করুন (A_true, B_true)∈Σ_cont, তাহলে নিম্নলিখিত সমতুল্য:

  • (a) ডেটা D হল Σ_cont-informative স্থিতিশীলকরণের জন্য
  • (b) ডেটা D হল informative স্থিতিশীলকরণের জন্য (পূর্ব জ্ঞান ছাড়াই)

প্রমাণের চিন্তাভাবনা: १. (b)⇒(a) স্পষ্টভাবে সত্য २. (a)⇒(b) এর মূল চাবিকাঠি:

  • যদি Σ_D⊆Σ_cont, উপসংহার স্পষ্ট
  • যদি একটি অ-নিয়ন্ত্রণযোগ্য (Ā,B̄)∈Σ_D বিদ্যমান থাকে, Lemma ७ (প্যারামিটারাইজড সিস্টেম পরিবার প্রায় সর্বত্র নিয়ন্ত্রণযোগ্য) এবং Lemma ९ (ম্যাট্রিক্স বান্ডেল স্থিতিশীলতা) ব্যবহার করে প্রমাণ করুন যে স্থিতিশীলকারী K ও (Ā,B̄) কে স্থিতিশীল করে

মূল লেম্মা:

  • Lemma ७: যদি (M,N) নিয়ন্ত্রণযোগ্য, তাহলে (M+αM₀, N+αN₀) সর্বোচ্চ n² α মান ছাড়া সকল α এর জন্য নিয়ন্ত্রণযোগ্য
  • Lemma ९: যদি M+δN সকল δ∈[ε,∞)\F এর জন্য Schur (F সীমিত), তাহলে N নিলপোটেন্ট এবং M+δN সকল δ∈ℝ এর জন্য Schur

স্থিতিশীলযোগ্যতা পূর্ব জ্ঞান হিসেবে (অংশ IV)

A. প্রয়োজনীয় শর্ত (উপপাদ্য १०)

যদি ডেটা Σ_stab-informative এবং K স্থিতিশীলকারী লাভ হয়, তাহলে:

  • (a) (A₀+B₀K)R(A,B) = {0} সকল (A,B)∈Σ_D∩Σ_stab এবং (A₀,B₀)∈Σ⁰_D এর জন্য
  • (b) যদি rank X⁻ < n, তাহলে imX⁻;U⁻ = im X⁻ × ℝᵐ
  • (c) im X⁺ ⊆ im X⁻
  • (d) im X⁻ হল A-অপরিবর্তনশীল এবং im B ধারণ করে

মন্তব্য ११: শর্ত (a) পূর্ব জ্ঞান ছাড়াই A₀+B₀K=० এর একটি শিথিল সংস্করণ; শর্ত (b)-(d) rank X⁻ = n হলে স্বয়ংক্রিয়ভাবে সন্তুষ্ট হয়, কিন্তু র‍্যাঙ্ক-ঘাটতি ক্ষেত্রে অ-তুচ্ছ।

B. পূর্ণ র‍্যাঙ্ক ক্ষেত্র (উপপাদ্য १४)

উপপাদ্য १४: যদি (A_true,B_true)∈Σ_stab এবং rank X⁻ = n, তাহলে:

  • Σ_stab-informativity ⟺ informativity (পূর্ব জ্ঞান ছাড়াই)

প্রমাণের চিন্তাভাবনা: १. যদি প্রকৃত সিস্টেম নিয়ন্ত্রণযোগ্য, উপপাদ্য ५ দ্বারা উপসংহার পান २. যদি প্রকৃত সিস্টেম অ-নিয়ন্ত্রণযোগ্য, একটি K̂ নির্মাণ করুন যাতে সকল (A,B)∈Σ_D এর জন্য A+BK̂ = A_true+B_true K̂, তারপর প্রমাণ করুন পরবর্তীটি Schur

C. র‍্যাঙ্ক-ঘাটতি ক্ষেত্র (উপপাদ্য १५, মূল ফলাফল)

উপপাদ্য १५: যদি (A_true,B_true)∈Σ_stab এবং rank X⁻ < n, তাহলে ডেটা D হল Σ_stab-informative যখন এবং শুধুমাত্র যখন:

  • (a) im X⁺ ⊆ im X⁻
  • (b) imX⁻;U⁻ = im X⁻ × ℝᵐ

মূল লেম্মা (Lemma १७): যদি শর্ত (a)(b) সন্তুষ্ট হয়, তাহলে সকল (A,B)∈Σ_D∩Σ_stab এর জন্য, রূপান্তর ম্যাট্রিক্স S সন্তুষ্ট করে:

SAS⁻¹ = [A₁₁  A₁₂]    SB = [B₁]
         [0    A₂₂]          [0]

যেখানে (A₁₁,B₁) স্থিতিশীলযোগ্য, A₂₂ Schur, এবং A₁₁ B₁ = X̂⁺X̂⁻;U⁻

এটি ডেটা-চালিত Kalman বিয়োজন প্রদান করে।

নিয়ন্ত্রক ডিজাইন পদ্ধতি (প্রস্তাব १६)

প্রস্তাব १६: যদি ডেটা Σ_stab-informative এবং rank X⁻ = r < n:

(a) একটি Θ∈ℝᵀˣʳ বিদ্যমান থাকে যাতে LMI সম্ভাব্য:

X̂⁻Θ = Θᵀ X̂⁻ᵀ
[X̂⁻Θ    X̂⁺Θ  ] > 0
[Θᵀ X̂⁺ᵀ  X̂⁻Θ  ]

(b) যদি Θ (११) সন্তুষ্ট করে, K = K₁ K₂S নিন, যেখানে:

  • K₁ = U⁻Θ(X̂⁻Θ)⁻¹
  • K₂∈ℝᵐˣ⁽ⁿ⁻ʳ⁾ যেকোনো তাহলে A+BK সকল (A,B)∈Σ_D∩Σ_stab এর জন্য Schur

ডিজাইন পদক্ষেপ: १. X⁻ এর QR বিয়োজন গণনা করুন S এবং X̂⁻ পেতে २. LMI (११) সমাধান করুন Θ পেতে ३. K₁ = U⁻Θ(X̂⁻Θ)⁻¹ গণনা করুন ४. যেকোনো K₂ নির্বাচন করুন, K = K₁ K₂S নির্মাণ করুন

পরীক্ষামূলক সেটআপ

সংখ্যাগত উদাহরণ: তিন-জলাশয় সিস্টেম

সিস্টেম বর্ণনা (চিত্র २):

  • ३টি সিরিজ জলাশয়, তরল জলাশয় ३ থেকে জলাশয় २ এবং তারপর জলাশয় १ এ প্রবাহিত হয়
  • অবস্থা: x_i জলাশয় i এর তরল উচ্চতা (i=१,२,३)
  • নিয়ন্ত্রণ ইনপুট: u জলাশয় २ এবং সংরক্ষণ পুল মধ্যে প্রবাহ হার
  • কাঠামোগত বৈশিষ্ট্য: একমুখী প্রবাহের কারণে, x₃ অ-নিয়ন্ত্রণযোগ্য

ক্রমাগত সময় মডেল:

ẋ = A_c x + B_c u

যেখানে:

A_c = [-0.6  0.5   0  ]    B_c = [0  ]
      [0.5  -0.5  0.5 ]          [1  ]
      [0     0   -0.5 ]          [0  ]

বিচ্ছিন্নকরণ (নমুনা সময় ०.१s):

A_true = [0.9429  0.0473  0.0012]    B_true = [0.0024]
         [0.0473  0.9524  0.0476]             [0.0976]
         [0      0       0.9512]              [0     ]

পরীক্ষামূলক ডেটা

খোলা লুপ পরীক্ষা (T=५):

t012345
u(t)10-101
x₁11.041.07781.10861.13341.1575
x₂22.04982.00151.85971.82371.8881
x₃000000

ডেটা বৈশিষ্ট্য: rank X⁻ = २ < ३ (র‍্যাঙ্ক-ঘাটতি)

সমাধান প্রক্রিয়া

१. MATLAB + YALMIP + MOSEK ব্যবহার করে LMI (११) সমাধান করুন २. Θ পান (५×२ ম্যাট্রিক্স) ३. K₁ = -२.७७२८ -९.७१२३ গণনা করুন ४. K₂ = ० নিন, K = -२.७७२८ -९.७१२३ ० পান

Monte Carlo পরীক্ষা

পরীক্ষা সেটআপ:

  • १००० র‍্যান্ডম পরিস্থিতি
  • প্রতিটি পরিস্থিতি: t=० থেকে t=१०० পর্যন্ত সিস্টেম সিমুলেট করুন
  • ইনপুট এবং প্রাথমিক শর্ত Poisson বিতরণ (λ=१) থেকে স্বাধীনভাবে নমুনা করুন
  • বিভিন্ন নমুনা সংখ্যা T = ३, ४, ५, १०, १०० এর ডেটা তথ্যপূর্ণতা বিশ্লেষণ করুন

মূল্যায়ন সূচক:

  • সিস্টেম সনাক্তকরণ তথ্যপূর্ণতা (rankX⁻ᵀ U⁻ᵀ = n+m)
  • পূর্ব জ্ঞান ছাড়াই স্থিতিশীলকরণ তথ্যপূর্ণতা
  • Σ_stab-স্থিতিশীলকরণ তথ্যপূর্ণতা

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল (সারণী I)

Tসিস্টেম সনাক্তকরণ তথ্যপূর্ণতাস্থিতিশীলকরণ তথ্যপূর্ণতা (পূর্ব জ্ঞান ছাড়াই)Σ_stab-স্থিতিশীলকরণ তথ্যপূর্ণতা
30%8.1%42%
462.4%63.2%99.4%
562.8%63.2%99.8%
1063.2%63.2%100%
10063.2%63.2%100%

মূল আবিষ্কার

१. T=३ এ উল্লেখযোগ্য সুবিধা:

  • সিস্টেম সনাক্তকরণ সম্ভব নয় (T < n+m)
  • মাত্র ८.१% ডেটা পূর্ব জ্ঞান ছাড়াই স্থিতিশীলকরণের জন্য ব্যবহারযোগ্য
  • ४२% ডেটা Σ_stab-স্থিতিশীলকরণের জন্য ব্যবহারযোগ্য (५ গুণ উন্নতি)

२. T≥४ এ সংমিশ্রণ আচরণ:

  • সিস্টেম সনাক্তকরণ এবং পূর্ব জ্ঞান ছাড়াই স্থিতিশীলকরণ তথ্যপূর্ণতা ६३.२% এ স্থিতিশীল
  • এটি কারণ প্রায় ३६.८% র‍্যান্ডম ডেটা প্রয়োজনীয় শর্ত পূরণ করে না

३. T≥१० এ সম্পূর্ণ কভারেজ:

  • १००% ডেটা Σ_stab-informative
  • স্থিতিশীলযোগ্যতা পূর্ব জ্ঞানের শক্তিশালী প্রভাব উল্লেখযোগ্যভাবে প্রদর্শন করে

কেস যাচাইকরণ

প্রদত্ত T=५ ডেটার জন্য:

  • X⁻ পূর্ণ র‍্যাঙ্ক নয়, প্রস্তাব २ ব্যর্থ (পূর্ব জ্ঞান ছাড়াই স্থিতিশীলকরণের জন্য ব্যবহারযোগ্য নয়)
  • কিন্তু উপপাদ্য १५ শর্ত সন্তুষ্ট করে
  • সফলভাবে LMI সমাধান করে স্থিতিশীলকারী লাভ K পান

সম্পর্কিত কাজ

ডেটা-চালিত নিয়ন্ত্রণ

१. De Persis & Tesi (२०१९): প্রথম ডেটা থেকে সরাসরি স্থিতিশীলকারী প্রতিক্রিয়া ডিজাইনের LMI পদ্ধতি প্রস্তাব করে, ক্রমাগত উত্তেজনা শর্ত প্রয়োজন २. van Waarde et al. (२०२०): ডেটা তথ্যপূর্ণতা কাঠামো প্রস্তাব করে, প্রয়োজনীয় ও পর্যাপ্ত শর্ত প্রদান করে, অনন্য সনাক্তকরণ প্রয়োজন নেই ३. শব্দ ক্ষেত্র: van Waarde et al. (२०२०), Li et al. (२०२६) শব্দ ডেটার অধীনে নিয়ন্ত্রক সংশ্লেষণ অধ্যয়ন করে

ডেটা-চালিত নিয়ন্ত্রণে পূর্ব জ্ঞান

१. পরামিতি সীমানা সীমাবদ্ধতা: Berberich et al. (२०२२) রৈখিক ভগ্নাংশ প্রতিনিধিত্ব পূর্ব জ্ঞান অধ্যয়ন করে २. আংশিক পরামিতি পরিচিত: Huang et al. (२०२५) বহুপদী সিস্টেমের ঘনত্ব ফাংশন পদ্ধতি অধ্যয়ন করে ३. এই পেপারের উদ্ভাবন: প্রথম সিস্টেম তাত্ত্বিক বৈশিষ্ট্য (নিয়ন্ত্রণযোগ্যতা/স্থিতিশীলযোগ্যতা) পূর্ব জ্ঞান হিসেবে অধ্যয়ন করে

সিস্টেম সনাক্তকরণে পূর্ব জ্ঞান

१. স্থিতিশীলতা সীমাবদ্ধতা: van Gestel et al. (२००२), Lacy & Bernstein (२००३) २. eigenvalue সীমাবদ্ধতা: Miller & De Callafon (२०१३) ३. ইতিবাচকতা/প্যাসিভিটি: De Santis & Farina (२००२), Goethals et al. (२००३) ४. এই পেপারের পার্থক্য: নিয়ন্ত্রক ডিজাইনে ফোকাস করে সনাক্তকরণে নয়, এবং অ-উত্তল পূর্ব জ্ঞান সেট পরিচালনা করে

কাঠামোগত নিয়ন্ত্রণযোগ্যতা

Jia et al. (२०२०) ইত্যাদি সিস্টেম কাঠামো থেকে নিয়ন্ত্রণযোগ্যতা অনুমান অধ্যয়ন করে, এই পেপারটি এই কাঠামোগত তথ্য ডেটা-চালিত নিয়ন্ত্রণে ব্যবহারের সেতু হিসেবে দেখা যায়।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. নিয়ন্ত্রণযোগ্যতা পূর্ব জ্ঞানের অকার্যকারিতা: যদি সিস্টেম নিয়ন্ত্রণযোগ্য হওয়া জানা থাকে, এই পূর্ব জ্ঞান ডেটা-চালিত স্থিতিশীলকরণের শর্ত শিথিল করতে পারে না (উপপাদ্য ५)

२. স্থিতিশীলযোগ্যতা পূর্ব জ্ঞানের কার্যকারিতা:

  • অবস্থা ডেটা পূর্ণ র‍্যাঙ্ক হলে সহায়তা নেই (উপপাদ্য १४)
  • অবস্থা ডেটা র‍্যাঙ্ক-ঘাটতি হলে উল্লেখযোগ্যভাবে শর্ত শিথিল করে (উপপাদ্য १५)

३. প্রতিবিম্বিত ঘটনা: আরও শক্তিশালী বৈশিষ্ট্য (নিয়ন্ত্রণযোগ্যতা) অপ্রয়োজনীয়, আরও দুর্বল বৈশিষ্ট্য (স্থিতিশীলযোগ্যতা) প্রয়োজনীয়—কারণ সম্ভবত সকল ডেটা-সামঞ্জস্যপূর্ণ সিস্টেম অ-নিয়ন্ত্রণযোগ্য

४. ব্যবহারিক ডিজাইন পদ্ধতি: LMI ভিত্তিক গণনাযোগ্য নিয়ন্ত্রক ডিজাইন পদ্ধতি প্রদান করে (প্রস্তাব १६)

তাত্ত্বিক অন্তর্দৃষ্টি

উদাহরণ ४ এর শিক্ষা:

Σ_D = {([1 α], [1]) | α,β∈ℝ}
      ([0 β], [0])
  • rank X⁻ = १ < २, ডেটা informative নয়
  • কিন্তু Σ_D∩Σ_stab এর সকল সিস্টেম K=-१ ० দ্বারা স্থিতিশীল করা যায়
  • মূল চাবিকাঠি: অ-নিয়ন্ত্রণযোগ্য সিস্টেমের স্বায়ত্তশাসিত অংশ β অবশ্যই স্থিতিশীল (|β|<१)

Lemma १७ এর অর্থ: ডেটা-চালিত সিস্টেম বিয়োজন প্রদান করে, সিস্টেম ম্যাট্রিক্স জানার প্রয়োজন নেই:

  • স্থিতিশীলযোগ্য অংশ: (A₁₁,B₁) সরাসরি ডেটা থেকে পুনরুদ্ধার করা যায়
  • স্থিতিশীল স্বায়ত্তশাসিত অংশ: A₂₂ স্থিতিশীলকরণে প্রভাব ফেলে না

সীমাবদ্ধতা

१. শব্দমুক্ত অনুমান: বর্তমান তত্ত্ব শুধুমাত্র শব্দমুক্ত ডেটায় প্রযোজ্য, শব্দ ক্ষেত্রে সম্প্রসারণ একটি খোলা প্রশ্ন

२. অফলাইন ডেটা: সম্পূর্ণ ডেটা সেট পূর্বে সংগ্রহ করা প্রয়োজন, অনলাইন শেখার পরিস্থিতিতে প্রযোজ্য নয়

३. রৈখিক সিস্টেম: শুধুমাত্র LTI সিস্টেম বিবেচনা করে, অ-রৈখিক সিস্টেম সম্প্রসারণ চ্যালেঞ্জিং

४. বাইনারি পূর্ব জ্ঞান: শুধুমাত্র "স্থিতিশীলযোগ্য" বা "অ-স্থিতিশীলযোগ্য" বিবেচনা করে, পৌঁছানো যোগ্য সাবস্পেস মাত্রার উপরের সীমানা ইত্যাদি আরও সূক্ষ্ম পূর্ব জ্ঞান বিবেচনা করে না

५. Schur স্থিতিশীলতা: শুধুমাত্র স্থিতিশীলতা বিবেচনা করে, কর্মক্ষমতা সূচক (যেমন H∞ নর্ম) জড়িত নয়

ভবিষ্যত দিকনির্দেশনা

१. শব্দ দৃঢ়তা: শব্দ ডেটায় সম্প্রসারণ, সম্ভবত দৃঢ় নিয়ন্ত্রণ কৌশল (যেমন S-lemma) সংমিশ্রণ প্রয়োজন

२. পৌঁছানো যোগ্য সাবস্পেস মাত্রা সীমানা: "rank R(A,B) ≤ r" পূর্ব জ্ঞান হিসেবে অধ্যয়ন করুন

३. কর্মক্ষমতা অপ্টিমাইজেশন: স্থিতিশীলযোগ্যতা পূর্ব জ্ঞান সহ সর্বোত্তম নিয়ন্ত্রক ডিজাইন (যেমন LQR)

४. অনলাইন শেখা: অনলাইন নিয়ন্ত্রক আপডেটের জন্য অভিযোজিত অ্যালগরিদম বিকাশ করুন

५. অ-রৈখিক সম্প্রসারণ: দ্বিরৈখিক বা বহুপদী সিস্টেমের অনুরূপ তত্ত্ব অধ্যয়ন করুন

६. ব্যবহারিক প্রয়োগ: রোবোটিক্স, বিদ্যুৎ ব্যবস্থা ইত্যাদি ক্ষেত্রে পদ্ধতি যাচাই করুন

গভীর মূল্যায়ন

সুবিধা

१. তাত্ত্বিক অবদান গভীর

  • অ-উত্তল পূর্ব জ্ঞান পরিচালনা: প্রথমবার ডেটা-চালিত নিয়ন্ত্রণে অ-উত্তল পূর্ব জ্ঞান সেট (স্থিতিশীলযোগ্য/নিয়ন্ত্রণযোগ্য সিস্টেম সেট অ-উত্তল) পরিচালনা করে, প্রযুক্তিগত কঠিনতা উচ্চ
  • প্রয়োজনীয় ও পর্যাপ্ত শর্ত: উপপাদ্য १५ র‍্যাঙ্ক-ঘাটতি ক্ষেত্রে প্রয়োজনীয় ও পর্যাপ্ত শর্ত প্রদান করে, তাত্ত্বিক সম্পূর্ণতা
  • প্রতিবিম্বিত ফলাফল: নিয়ন্ত্রণযোগ্যতা অপ্রয়োজনীয় কিন্তু স্থিতিশীলযোগ্যতা প্রয়োজনীয় ঘটনা প্রকাশ করে, গভীর অন্তর্দৃষ্টি প্রদান করে

२. প্রমাণ কৌশল পরিশীলিত

  • Lemma ७ (প্যারামিটারাইজড নিয়ন্ত্রণযোগ্যতা): Kalman ম্যাট্রিক্সের বহুপদী বৈশিষ্ট্য ব্যবহার করে, "প্রায় সর্বত্র" নিয়ন্ত্রণযোগ্যতা প্রমাণ করে
  • Lemma ९ (ম্যাট্রিক্স বান্ডেল বিশ্লেষণ): ট্রেসের বহুপদী বৈশিষ্ট্য মাধ্যমে নিলপোটেন্সি অনুমান করে, কৌশল পরিশীলিত
  • Lemma १७ (ডেটা-চালিত বিয়োজন): সিস্টেম ম্যাট্রিক্স জানা ছাড়াই বিয়োজন বাস্তবায়ন করে, উদ্ভাবনী

३. পদ্ধতি ব্যবহারিক শক্তি শক্তিশালী

  • LMI সমাধানযোগ্য: প্রস্তাব १६ মান উত্তল অপ্টিমাইজেশন সমস্যা প্রদান করে, বিদ্যমান সরঞ্জাম ব্যবহার করা যায়
  • পরামিতি স্বাধীনতা: K₂ এর যেকোনোতা ডিজাইন নমনীয়তা প্রদান করে
  • সংখ্যাগত যাচাইকরণ: তিন-জলাশয় উদাহরণ পদ্ধতি কার্যকারিতা স্পষ্টভাবে প্রদর্শন করে

४. পরীক্ষা ডিজাইন যুক্তিসঙ্গত

  • Monte Carlo বিশ্লেষণ: १००० পরিস্থিতি পরিসংখ্যান পর্যাপ্ত
  • বহু-নমুনা বিশ্লেষণ: T ३ থেকে १०० পর্যন্ত প্রভাব সিস্টেমেটিকভাবে অধ্যয়ন করে
  • ভৌত সিস্টেম: তিন-জলাশয় সিস্টেম ব্যবহারিক অর্থ এবং স্পষ্ট কাঠামোগত নিয়ন্ত্রণযোগ্যতা রয়েছে

५. লেখা স্পষ্ট কঠোর

  • সংজ্ঞা নির্ভুল, উপপাদ্য বিবৃতি স্পষ্ট
  • উদাহরণ (উদাহরণ ४, ६) বোঝাপড়া সহায়তা করে
  • চিহ্ন সিস্টেম সামঞ্জস্যপূর্ণ

অপূর্ণতা

१. তাত্ত্বিক সীমাবদ্ধতা

  • মন্তব্য १९ এর সমস্যা: Σ_stab-informative দ্বিঘাত স্থিতিশীলকরণ (quadratic stabilization) নিশ্চিত করে না, ব্যবহারিক প্রয়োগ সীমিত করতে পারে
  • রক্ষণশীলতা বিশ্লেষণ অনুপস্থিত: স্থিতিশীলযোগ্যতা পূর্ব জ্ঞান পূর্ব জ্ঞান ছাড়াই কত ডেটা সাশ্রয় করতে পারে তা পরিমাণ করা হয়নি
  • প্রয়োজনীয়তা প্রমাণ অসম্পূর্ণ: উপপাদ্য १० (b)-(d) এর প্রয়োজনীয়তা প্রমাণ (a) এর উপর নির্ভর করে, কিন্তু (a) নিজেই জটিল

२. পরীক্ষা অপর্যাপ্ত

  • একক কেস: শুধুমাত্র তিন-জলাশয় সিস্টেম, বৈচিত্র্য অনুপস্থিত (যেমন উচ্চ-মাত্রা সিস্টেম, বিভিন্ন কাঠামো)
  • শব্দ তুলনা অনুপস্থিত: শব্দ পরিস্থিতিতে পদ্ধতির দৃঢ়তা তুলনা করা হয়নি
  • গণনা জটিলতা: LMI সমাধান সময় n,T এর সাথে কীভাবে পরিবর্তিত হয় তা বিশ্লেষণ করা হয়নি
  • ব্যর্থতা কেস: উপপাদ্য १५ শর্ত পূরণ না করে এমন ডেটা উদাহরণ প্রদর্শন করা হয়নি

३. পদ্ধতি সীমাবদ্ধতা

  • K₂ নির্বাচন: প্রস্তাব १६(b) এ K₂ যেকোনো, কিন্তু নির্বাচন নির্দেশনা প্রদান করা হয়নি (যেমন কর্মক্ষমতা অপ্টিমাইজেশন)
  • ডেটা দক্ষতা: মডেল-ভিত্তিক পদ্ধতির সাথে ডেটা দক্ষতা তুলনা করা হয়নি
  • সম্প্রসারণযোগ্যতা: বহু-ইনপুট বহু-আউটপুট (MIMO) সিস্টেমের বিশেষ বিবেচনা আলোচনা করা হয়নি

४. সম্পর্কিত কাজ তুলনা

  • সর্বশেষ গভীর শক্তিশালী শেখার পদ্ধতির সাথে তুলনা করা হয়নি
  • অভিযোজিত নিয়ন্ত্রণের সাথে সম্পর্ক আলোচনা করা হয়নি
  • দৃঢ় নিয়ন্ত্রণের সাথে সংযোগ (যেমন μ-synthesis) অনুপস্থিত

५. ব্যবহারিক বিবেচনা

  • পূর্ব জ্ঞান অধিগ্রহণ: ব্যবহারিকভাবে সিস্টেম স্থিতিশীলযোগ্য যাচাই কীভাবে করতে হয় তা আলোচনা করা হয়নি (সম্ভবত আংশিক সনাক্তকরণ প্রয়োজন)
  • ব্যর্থতা পরিচালনা: LMI (११) সম্ভাব্য না হলে কী করতে হবে?
  • বন্ধ লুপ ডেটা: শুধুমাত্র খোলা লুপ ডেটা বিবেচনা করে, বন্ধ লুপ ডেটা পরিস্থিতি অন্তর্ভুক্ত নয়

প্রভাব মূল্যায়ন

ক্ষেত্রে অবদান

१. তাত্ত্বিক ভিত্তি: ডেটা-চালিত নিয়ন্ত্রণে সিস্টেম তাত্ত্বিক বৈশিষ্ট্য সংহতকরণের ভিত্তি স্থাপন করে, নতুন গবেষণা দিকনির্দেশনা খোলে २. পদ্ধতিবিদ্যা: অ-উত্তল পূর্ব জ্ঞান পরিচালনার কৌশল অন্যান্য সিস্টেম বৈশিষ্ট্যে (যেমন প্যাসিভিটি, ইতিবাচকতা) প্রসারিত করা যায় ३. সেতু ভূমিকা: কাঠামোগত নিয়ন্ত্রণযোগ্যতা তত্ত্ব এবং ডেটা-চালিত নিয়ন্ত্রণ সংযুক্ত করে

ব্যবহারিক মূল্য

१. ডেটা চাহিদা হ্রাস: Monte Carlo পরীক্ষা দেখায় ডেটা চাহিদা ১/५ এ হ্রাস করা যায় (T=३ সময়) २. র‍্যাঙ্ক-ঘাটতি পরিস্থিতি: ব্যবহারিকে সাধারণ র‍্যাঙ্ক-ঘাটতি ডেটার সমাধান প্রদান করে ३. খোলা উৎস কোড: GitHub কোড প্রদান করে, পুনরুৎপাদনযোগ্যতা শক্তিশালী

সম্ভাব্য প্রয়োগ

१. রোবোটিক্স: যৌথ অ-নিয়ন্ত্রণযোগ্য সময় স্থিতিশীলকারী নিয়ন্ত্রণ २. বিদ্যুৎ ব্যবস্থা: আংশিক জেনারেটর অ-নিয়ন্ত্রণযোগ্য বিদ্যুৎ গ্রিড স্থিতিশীলতা ३. প্রক্রিয়া নিয়ন্ত্রণ: রাসায়নিক প্রক্রিয়া বহু-জলাশয়, তাপ বিনিময়কারী সিস্টেম ४. মহাকাশ: উপগ্রহ মনোভাব নিয়ন্ত্রণ (কিছু মোড অ-নিয়ন্ত্রণযোগ্য কিন্তু স্থিতিশীলযোগ্য)

সীমাবদ্ধতা

१. তাত্ত্বিক প্রবেশদ্বার উচ্চ: গভীর নিয়ন্ত্রণ তত্ত্ব পটভূমি প্রয়োজন, প্রচার সীমিত করে २. ব্যবহারিক যাচাইকরণ অপর্যাপ্ত: প্রকৃত সিস্টেম পরীক্ষা অনুপস্থিত, শিল্প গ্রহণযোগ্যতা সন্দেহজনক ३. শব্দ সংবেদনশীলতা: শব্দমুক্ত অনুমান সরাসরি প্রয়োগ সীমিত করে

প্রযোজ্য পরিস্থিতি

আদর্শ পরিস্থিতি

१. কাঠামো-পরিচিত সিস্টেম: কাঠামো থেকে স্থিতিশীলযোগ্যতা অনুমান করা যায় (যেমন নেটওয়ার্ক সিস্টেম) २. র‍্যাঙ্ক-ঘাটতি ডেটা: প্রাথমিক শর্ত X⁻ র‍্যাঙ্ক-ঘাটতি কিন্তু সিস্টেম স্থিতিশীলযোগ্য ३. কম ডেটা পরিবেশ: ডেটা সংগ্রহ ব্যয়বহুল (যেমন মহাকাশ, চিকিৎসা) ४. নিরাপত্তা-গুরুত্বপূর্ণ সিস্টেম: তাত্ত্বিক স্থিতিশীলতা নিশ্চয়তা প্রয়োজন

অপ্রযোজ্য পরিস্থিতি

१. উচ্চ শব্দ পরিবেশ: বর্তমান তত্ত্ব প্রযোজ্য নয় २. অ-রৈখিক সিস্টেম: অন্যান্য পদ্ধতি প্রয়োজন ३. সময়-পরিবর্তনশীল সিস্টেম: LTI অনুমান অসন্তুষ্ট ४. কঠোর কর্মক্ষমতা প্রয়োজনীয়তা: শুধুমাত্র স্থিতিশীলতা নিশ্চিত করে, কর্মক্ষমতা নিশ্চিত করে না

উন্নতি সুপারিশ

१. দৃঢ় পদ্ধতি সংমিশ্রণ: সীমাবদ্ধ শব্দ পরিস্থিতিতে সম্প্রসারণ २. কর্মক্ষমতা অপ্টিমাইজেশন: স্থিতিশীলকরণ সীমাবদ্ধতার অধীনে LQR খরচ অপ্টিমাইজ করুন ३. অনলাইন আপডেট: পুনরাবৃত্তিমূলক অ্যালগরিদম বিকাশ করুন ४. পরীক্ষামূলক যাচাইকরণ: প্রকৃত সিস্টেমে যাচাই করুন (যেমন ড্রোন, শিল্প প্রক্রিয়া)

সামগ্রিক মূল্যায়ন

এটি একটি উচ্চ-মানের তাত্ত্বিক নিয়ন্ত্রণ পেপার, ডেটা-চালিত নিয়ন্ত্রণ ক্ষেত্রে গুরুত্বপূর্ণ অবদান করে। প্রধান হাইলাইট: १. প্রথমবার সিস্টেম তাত্ত্বিক বৈশিষ্ট্য পূর্ব জ্ঞান হিসেবে সিস্টেমেটিকভাবে অধ্যয়ন করে २. নিয়ন্ত্রণযোগ্যতা এবং স্থিতিশীলযোগ্যতার মূল পার্থক্য প্রকাশ করে ३. সম্পূর্ণ প্রয়োজনীয় ও পর্যাপ্ত শর্ত এবং গণনাযোগ্য পদ্ধতি প্রদান করে

প্রধান অপূর্ণতা পর্যাপ্ত পরীক্ষামূলক যাচাইকরণ অনুপস্থিত, শব্দ দৃঢ়তা বিবেচনা করা হয়নি।

সুপারিশ সূচক: ⭐⭐⭐⭐☆ (४/५)

  • তাত্ত্বিক গভীরতা: ⭐⭐⭐⭐⭐
  • ব্যবহারিক মূল্য: ⭐⭐⭐⭐
  • পরীক্ষা সম্পূর্ণতা: ⭐⭐⭐
  • লেখার গুণমান: ⭐⭐⭐⭐⭐
  • উদ্ভাবনী: ⭐⭐⭐⭐⭐

নিয়ন্ত্রণ ক্ষেত্রের শীর্ষ জার্নালে প্রকাশের জন্য উপযুক্ত (যেমন IEEE TAC, Automatica), ডেটা-চালিত নিয়ন্ত্রণ এবং সিস্টেম তত্ত্ব গবেষকদের জন্য গুরুত্বপূর্ণ রেফারেন্স মূল্য রয়েছে।

সংগৃহীত সাহিত্য (নির্বাচিত)

H. J. van Waarde et al., "Data informativity: A new perspective on data-driven analysis and control," IEEE TAC, २०२०। (ডেটা তথ্যপূর্ণতা কাঠামোর প্রতিষ্ঠাপক কাজ)

C. De Persis & P. Tesi, "Formulas for data-driven control: Stabilization, optimality, and robustness," IEEE TAC, २०१९। (প্রথম ডেটা-চালিত স্থিতিশীলকরণ LMI পদ্ধতি)

१२ J. Berberich et al., "Combining prior knowledge and data for robust controller design," IEEE TAC, २०२२। (পরামিতি সীমানা পূর্ব জ্ঞান)

२५ J. Jia et al., "A unifying framework for strong structural controllability," IEEE TAC, २०२०। (কাঠামোগত নিয়ন্ত্রণযোগ্যতা তত্ত্ব)

२७ H. J. van Waarde & M. K. Camlibel, "A matrix Finsler's lemma with applications to data-driven control," CDC, २०२१। (দ্বিঘাত স্থিতিশীলকরণ তত্ত্ব)