We consider a moving target that we seek to learn from samples. Our results extend randomized techniques developed in control and optimization for a constant target to the case where the target is changing. We derive a novel bound on the number of samples that are required to construct a probably approximately correct (PAC) estimate of the target. Furthermore, when the moving target is a convex polytope, we provide a constructive method of generating the PAC estimate using a mixed integer linear program (MILP). The proposed method is demonstrated on an application to autonomous emergency braking.
এই পেপারটি নমুনা থেকে গতিশীল লক্ষ্য শিক্ষার সমস্যা অধ্যয়ন করে। গবেষণাটি নিয়ন্ত্রণ এবং অপ্টিমাইজেশন ক্ষেত্রে স্থির লক্ষ্যের জন্য বিকশিত র্যান্ডমাইজড কৌশলগুলিকে লক্ষ্য পরিবর্তনের ক্ষেত্রে প্রসারিত করে। পেপারটি সম্ভাব্যতামূলক আনুমানিক সঠিক (PAC) লক্ষ্য অনুমান তৈরির জন্য প্রয়োজনীয় নমুনা সংখ্যার নতুন সীমানা প্রদান করে। অধিকন্তু, যখন গতিশীল লক্ষ্য উত্তল পলিহেড্রন হয়, মিশ্র পূর্ণসংখ্যা রৈখিক প্রোগ্রামিং (MILP) ব্যবহার করে PAC অনুমান তৈরির একটি গঠনমূলক পদ্ধতি প্রদান করা হয়। এই পদ্ধতিটি স্বয়ংক্রিয় জরুরি ব্রেকিং অ্যাপ্লিকেশনে যাচাই করা হয়।
ঐতিহ্যবাহী পরিসংখ্যানগত শিক্ষা তত্ত্ব (যেমন PAC শিক্ষা) অনুমান করে যে লক্ষ্য লেবেলিং ফাংশন অপরিবর্তিত থাকে। তবে অনেক বাস্তব প্রয়োগে, শিক্ষার লক্ষ্য সময়ের সাথে পরিবর্তিত হয়। এই পেপারটি অধ্যয়ন করে কীভাবে সীমিত নমুনা থেকে এই ধরনের কাঠামোগত পরিবর্তনশীল লেবেলিং প্রক্রিয়া শিখতে হয় এবং সম্ভাব্যতামূলক গ্যারান্টি প্রদান করে।
বাস্তব চাহিদা: নিয়ন্ত্রণ ব্যবস্থা, রোবোটিক্স, স্বয়ংচালিত গাড়ি ইত্যাদি ক্ষেত্রে, পরিবেশ এবং সিস্টেম পরামিতি সময়ের সাথে পরিবর্তিত হয় (যেমন ব্রেকিং কর্মক্ষমতা অবনতি, যানবাহন ভর পরিবর্তন)
তাত্ত্বিক চ্যালেঞ্জ: ক্লাসিক্যাল PAC তত্ত্ব গতিশীল লক্ষ্যের জন্য সরাসরি প্রয়োগ করা যায় না, নতুন তাত্ত্বিক কাঠামো প্রয়োজন
নিরাপত্তা-সমালোচনামূলক অ্যাপ্লিকেশন: স্বয়ংচালিত গাড়ি ইত্যাদি নিরাপত্তা-সমালোচনামূলক সিস্টেমে কঠোর সম্ভাব্যতামূলক গ্যারান্টি প্রয়োজন
পরিস্থিতি পদ্ধতি (Scenario Approach): প্রধানত স্থির লক্ষ্যের অনিশ্চয়তা অপ্টিমাইজেশনের জন্য, লক্ষ্য সময়ের সাথে পরিবর্তনশীল বিবেচনা করে না
VC তত্ত্ব: সীমিত VC মাত্রা প্রয়োজন, এবং প্রধানত স্থির লক্ষ্যের জন্য
বিদ্যমান গতিশীল লক্ষ্য শিক্ষা: যেমন 2,3,15,20,22,23 ইত্যাদি কাজ, কিন্তু অধিকাংশ প্রত্যাশা মূল্য মূল্যায়ন প্রদান করে PAC ধরনের দ্বিস্তরীয় সম্ভাব্যতা গ্যারান্টি নয়
গঠনমূলক পদ্ধতির অভাব: বিদ্যমান বিশ্লেষণ অধিকাংশই অস্তিত্ব প্রমাণ, অনুমান তৈরির ব্যবহারিক অ্যালগরিদম অভাব
পূর্ব নমুনা জটিলতা সীমানা: Section 3 এ PAC অনুমান তৈরির জন্য প্রয়োজনীয় ন্যূনতম নমুনা সংখ্যার পূর্ব সীমানা প্রদান করা হয় (Theorem 2), 20 এর কাজ প্রসারিত করে কিন্তু প্রত্যাশা মূল্য মূল্যায়নের পরিবর্তে PAC ধরনের ফলাফল ব্যবহার করে
গাণিতিক সংশোধন: 20, Theorem 1 এ গাণিতিক অসংগতি সংশোধন করা, লক্ষ্য পরিবর্তনের নিম্ন সীমানা μ প্রবর্তন করা (শুধুমাত্র উপরের সীমানা μ̄ নয়)
গঠনমূলক MILP পদ্ধতি: Section 4 এ প্রথম গঠনমূলক পদ্ধতি প্রস্তাব করা, মিশ্র পূর্ণসংখ্যা রৈখিক প্রোগ্রামিং ব্যবহার করে উত্তল পলিহেড্রন শ্রেণীর ন্যূনতম বিরোধ অনুমান তৈরি করা (এটি ট্র্যাকিং সমস্যার জন্য প্রথম গঠনমূলক পদ্ধতি)
ব্যবহারিক প্রয়োগ যাচাইকরণ: Section 5 এ স্বয়ংক্রিয় জরুরি ব্রেকিং (AEB) সিস্টেম কেস স্টাডির মাধ্যমে তাত্ত্বিক ফলাফল যাচাই করা, এবং নমুনা অপসারণ কৌশল প্রস্তাব করা যা গণনামূলক দক্ষতা বৃদ্ধি করে (95% অপ্রয়োজনীয় নমুনা অপসারণ)
1 Alamo et al., 2009. "Randomized strategies for probabilistic solutions" - র্যান্ডমাইজড পদ্ধতি ভিত্তি
5-7,9,12 Calafiore & Campi সিরিজ. "The scenario approach" - পরিস্থিতি পদ্ধতি মূল সাহিত্য
20 Helmbold & Long, 1994. "Tracking drifting concepts by minimizing disagreements" - এই পেপারের প্রধান প্রসারণ বস্তু
29 Vidyasagar, 2003. "Learning and Generalisation" - PAC শিক্ষা এবং VC তত্ত্ব ক্লাসিক পাঠ্যপুস্তক
28 Tempo et al., 2005. "Randomized algorithms for analysis and control" - নিয়ন্ত্রণে র্যান্ডমাইজড পদ্ধতি
সামগ্রিক মূল্যায়ন: এটি একটি তাত্ত্বিকভাবে কঠোর এবং পদ্ধতিগতভাবে উদ্ভাবনী চমৎকার পেপার। প্রধান অবদান হল PAC শিক্ষা গতিশীল লক্ষ্যে প্রসারিত করা এবং প্রথম গঠনমূলক অ্যালগরিদম প্রদান করা। তাত্ত্বিক অনুমান সম্পূর্ণ, সাহিত্য ত্রুটি সংশোধন করে, পরীক্ষা যথেষ্ট। প্রধান সীমাবদ্ধতা হল পরিবর্তন সীমানা পূর্বজ্ঞান প্রয়োজন, গণনামূলক জটিলতা বেশি, এবং স্থির বিতরণ অনুমান। পেপার ধীর পরিবর্তনশীল নিরাপত্তা-সমালোচনামূলক সিস্টেমের জন্য উপযুক্ত, নিয়ন্ত্রণ তত্ত্ব এবং পরিসংখ্যানগত শিক্ষার ক্রস-শৃঙ্খলা গবেষণায় গুরুত্বপূর্ণ অবদান রাখে। পরবর্তী কাজ স্ব-অভিযোজিত অনুমান, বিতরণ ড্রিফট এবং গণনামূলক দক্ষতা অপ্টিমাইজেশনে মনোনিবেশ করার সুপারিশ করা হয়।