Control of Conditional Processes and Fleming--Viot Dynamics
Jettkant
We discuss equivalent formulations of the control of conditional processes introduced by Lions. In this problem, a controlled diffusion process is killed once it hits the boundary of a given domain and the controller's reward is computed based on the conditional distribution given the process's survival. So far there is no clarity regarding the relationship between the open- and closed-loop formulation of this nonstandard control problem. We provide a short proof of their equivalence using measurable selection and mimicking arguments. In addition, we link the closed-loop formulation to Fleming--Viot dynamics of McKean--Vlasov type, where upon being killed the diffusion process is reinserted into the domain according to the current law of the process itself. This connection offers a new interpretation of the control problem and opens it up to applications that feature costs caused by reinsertion.
academic
শর্তসাপেক্ষ প্রক্রিয়া এবং Fleming--Viot গতিশীলতার নিয়ন্ত্রণ
এই পেপারটি Lions দ্বারা প্রবর্তিত শর্তসাপেক্ষ প্রক্রিয়া নিয়ন্ত্রণ সমস্যার সমতুল্য প্রণয়ন নিয়ে আলোচনা করে। এই সমস্যায়, নিয়ন্ত্রিত বিস্তৃতি প্রক্রিয়া একবার প্রদত্ত অঞ্চলের সীমানায় পৌঁছালে "হত্যা" করা হয়, এবং নিয়ন্ত্রকের পুরস্কার প্রক্রিয়া বেঁচে থাকার শর্তে শর্তসাপেক্ষ বিতরণের উপর ভিত্তি করে গণনা করা হয়। এই অ-মানক নিয়ন্ত্রণ সমস্যার খোলা-লুপ এবং বন্ধ-লুপ প্রণয়নের মধ্যে সম্পর্ক বর্তমানে অস্পষ্ট। লেখক পরিমাপযোগ্য নির্বাচন এবং সিমুলেশন যুক্তি ব্যবহার করে তাদের সমতুল্যতার একটি সংক্ষিপ্ত প্রমাণ প্রদান করেন। অধিকন্তু, বন্ধ-লুপ প্রণয়নকে McKean-Vlasov ধরনের Fleming-Viot গতিশীলতার সাথে সংযুক্ত করেন, যেখানে হত্যা করা বিস্তৃতি প্রক্রিয়াগুলি প্রক্রিয়াটির নিজস্ব বর্তমান বিতরণ অনুযায়ী অঞ্চলে পুনরায় সন্নিবেশ করানো হয়। এই সংযোগ নিয়ন্ত্রণ সমস্যার জন্য নতুন ব্যাখ্যা প্রদান করে এবং এটিকে পুনরায় সন্নিবেশ খরচ সহ প্রয়োগে প্রসারিত করে।
উপপাদ্য 2.4 (সমতুল্যতা): উপযুক্ত অনুমানের অধীনে, যেকোনো সম্ভাব্য নিয়ন্ত্রণ (α,μ) এর জন্য, একটি বন্ধ-লুপ নিয়ন্ত্রণ (α̃,μ) বিদ্যমান যেমন J(α̃,μ) ≥ J(α,μ)। বিশেষত, V_closed = V।
উপপাদ্য 3.4 (Fleming-Viot অস্তিত্ব এবং অনন্যতা): McKean-Vlasov SDE (3.1) এর একটি শক্তিশালী সমাধান বিদ্যমান এবং পথ অনন্য, অধিকন্তু, L(Xₜ) = L(X'ₜ|τ' > t)।
এই পেপারটি সফলভাবে Lions দ্বারা প্রস্তাবিত শর্তসাপেক্ষ প্রক্রিয়া নিয়ন্ত্রণ সমস্যায় মূল তাত্ত্বিক সমস্যা সমাধান করে, খোলা-লুপ এবং বন্ধ-লুপ নিয়ন্ত্রণের সমতুল্যতা স্থাপন করে, এবং Fleming-Viot গতিশীলতার মাধ্যমে নতুন ব্যাখ্যা দৃষ্টিভঙ্গি প্রদান করে। প্রযুক্তিগতভাবে, সহায়ক প্রক্রিয়া পদ্ধতির প্রবর্তন প্রমাণ জটিলতা সরল করে, সম্পর্কিত গবেষণার জন্য মূল্যবান সরঞ্জাম প্রদান করে। তাত্ত্বিক ফলাফল শুধুমাত্র গাণিতিক সৌন্দর্য নয়, বরং পুনরায় সন্নিবেশ খরচ সহ বাস্তব প্রয়োগের জন্য পথ প্রশস্ত করে।