We consider a moving target that we seek to learn from samples. Our results extend randomized techniques developed in control and optimization for a constant target to the case where the target is changing. We derive a novel bound on the number of samples that are required to construct a probably approximately correct (PAC) estimate of the target. Furthermore, when the moving target is a convex polytope, we provide a constructive method of generating the PAC estimate using a mixed integer linear program (MILP). The proposed method is demonstrated on an application to autonomous emergency braking.
यह पेपर नमूनों से गतिशील लक्ष्यों (moving targets) को सीखने की समस्या का अध्ययन करता है। यह शोध नियंत्रण और अनुकूलन क्षेत्र में स्थिर लक्ष्यों के लिए विकसित यादृच्छिकीकरण तकनीकों को लक्ष्य परिवर्तन के मामले में विस्तारित करता है। पेपर संभाव्य लगभग सही (PAC) लक्ष्य अनुमान के निर्माण के लिए आवश्यक नमूनों की संख्या के नए सीमांकन प्राप्त करता है। इसके अलावा, जब गतिशील लक्ष्य उत्तल बहुफलक (convex polytope) हों, तो मिश्रित पूर्णांक रैखिक प्रोग्रामिंग (MILP) का उपयोग करके PAC अनुमान उत्पन्न करने की एक रचनात्मक विधि प्रदान की जाती है। यह विधि स्वचालित आपातकालीन ब्रेकिंग अनुप्रयोग में सत्यापित की गई है।
पारंपरिक सांख्यिकीय शिक्षण सिद्धांत (जैसे PAC शिक्षण) मानता है कि लक्ष्य लेबलिंग फ़ंक्शन निश्चित और अपरिवर्तनीय है। हालांकि, कई व्यावहारिक अनुप्रयोगों में, शिक्षण लक्ष्य समय के साथ बदलते हैं। यह पेपर अध्ययन करता है कि परिमित नमूनों से इस संरचित परिवर्तनशील लेबलिंग तंत्र को कैसे सीखा जाए और संभाव्य गारंटी कैसे प्रदान की जाए।
व्यावहारिक आवश्यकता: नियंत्रण प्रणालियों, रोबोटिक्स, स्वचालित ड्राइविंग आदि क्षेत्रों में, पर्यावरण और प्रणाली पैरामीटर समय के साथ बदलते हैं (जैसे ब्रेकिंग प्रदर्शन में गिरावट, वाहन द्रव्यमान में परिवर्तन)
सैद्धांतिक चुनौती: शास्त्रीय PAC सिद्धांत गतिशील लक्ष्यों पर सीधे लागू नहीं हो सकता है, नए सैद्धांतिक ढांचे की आवश्यकता है
सुरक्षा-महत्वपूर्ण अनुप्रयोग: स्वचालित ड्राइविंग जैसी सुरक्षा-महत्वपूर्ण प्रणालियों में, कठोर संभाव्य गारंटी प्रदान करने की आवश्यकता है
परिदृश्य विधि (Scenario Approach): मुख्य रूप से स्थिर लक्ष्यों के अनिश्चित अनुकूलन के लिए, समय के साथ लक्ष्य परिवर्तन पर विचार नहीं करता
VC सिद्धांत: सीमित VC आयाम की आवश्यकता है, और मुख्य रूप से स्थिर लक्ष्यों के लिए है
मौजूदा गतिशील लक्ष्य शिक्षण: जैसे 2,3,15,20,22,23 आदि कार्य, लेकिन अधिकांश अपेक्षा मूल्य मूल्यांकन प्रदान करते हैं न कि PAC प्रकार की दोहरी संभाव्य गारंटी
रचनात्मक विधियों की कमी: मौजूदा विश्लेषण अधिकांशतः अस्तित्व प्रमाण हैं, परिकल्पना के निर्माण के लिए व्यावहारिक एल्गोरिदम की कमी है
पूर्व नमूना जटिलता सीमाएं: धारा 3 में PAC परिकल्पना उत्पन्न करने के लिए आवश्यक न्यूनतम नमूनों की संख्या की पूर्व सीमा प्रदान करता है (प्रमेय 2), 20 के कार्य को विस्तारित करता है लेकिन अपेक्षा मूल्य मूल्यांकन के बजाय PAC प्रकार के परिणाम का उपयोग करता है
गणितीय सुधार: 20, प्रमेय 1 में गणितीय चूकों को सुधारता है, लक्ष्य परिवर्तन की निचली सीमा μ (केवल ऊपरी सीमा μ̄ के बजाय) का परिचय देता है
रचनात्मक MILP विधि: धारा 4 में पहली रचनात्मक विधि प्रस्तावित करता है, उत्तल बहुफलक वर्ग के लिए न्यूनतम विसंगति परिकल्पना उत्पन्न करने के लिए मिश्रित पूर्णांक रैखिक प्रोग्रामिंग का उपयोग करता है (यह ट्रैकिंग समस्याओं के लिए पहली रचनात्मक विधि है)
व्यावहारिक अनुप्रयोग सत्यापन: धारा 5 में स्वचालित आपातकालीन ब्रेकिंग (AEB) प्रणाली के मामले के माध्यम से सैद्धांतिक परिणामों को सत्यापित करता है, और नमूना निष्कासन रणनीति प्रस्तावित करता है जो कम्प्यूटेशनल दक्षता में सुधार करता है (95% अनावश्यक नमूनों को निष्कासित करता है)
1 Alamo et al., 2009. "Randomized strategies for probabilistic solutions" - यादृच्छिकीकरण विधि आधार
5-7,9,12 Calafiore & Campi श्रृंखला. "The scenario approach" - परिदृश्य विधि मुख्य साहित्य
20 Helmbold & Long, 1994. "Tracking drifting concepts by minimizing disagreements" - यह पेपर मुख्य विस्तार वस्तु
29 Vidyasagar, 2003. "Learning and Generalisation" - PAC शिक्षण और VC सिद्धांत शास्त्रीय पाठ्यपुस्तक
28 Tempo et al., 2005. "Randomized algorithms for analysis and control" - नियंत्रण में यादृच्छिकीकरण विधि
समग्र मूल्यांकन: यह एक सैद्धांतिक रूप से कठोर और विधि नवाचारी उत्कृष्ट पेपर है। मुख्य योगदान PAC शिक्षण को गतिशील लक्ष्य तक विस्तारित करना और पहली रचनात्मक एल्गोरिदम प्रदान करना है। सैद्धांतिक व्युत्पत्ति पूर्ण है, साहित्य त्रुटियों को सुधारता है, प्रायोगिक सत्यापन पर्याप्त है। मुख्य सीमाएं परिवर्तन सीमा को पहले से जानने की आवश्यकता, कम्प्यूटेशनल जटिलता अधिक, और निश्चित वितरण मान्यता हैं। पेपर धीरे-धीरे परिवर्तनशील सुरक्षा-महत्वपूर्ण प्रणालियों के लिए उपयुक्त है, नियंत्रण सिद्धांत और सांख्यिकीय शिक्षण के अंतर-अनुशासनात्मक अनुसंधान में महत्वपूर्ण योगदान देता है। अनुवर्ती कार्य स्व-अनुकूली अनुमान, वितरण बहाव और कम्प्यूटेशनल दक्षता अनुकूलन पर ध्यान केंद्रित करने की सिफारिश की जाती है।