We consider a moving target that we seek to learn from samples. Our results extend randomized techniques developed in control and optimization for a constant target to the case where the target is changing. We derive a novel bound on the number of samples that are required to construct a probably approximately correct (PAC) estimate of the target. Furthermore, when the moving target is a convex polytope, we provide a constructive method of generating the PAC estimate using a mixed integer linear program (MILP). The proposed method is demonstrated on an application to autonomous emergency braking.
تدرس هذه الورقة مشكلة التعلم من العينات للأهداف المتحركة (moving targets). يوسّع البحث التقنيات العشوائية المطورة في مجالات التحكم والتحسين للأهداف الثابتة إلى حالات تغيير الأهداف. تشتق الورقة حدوداً جديدة لعدد العينات المطلوبة لبناء تقديرات أهداف احتمالية تقريبية صحيحة (PAC). علاوة على ذلك، عندما يكون الهدف المتحرك متعدد الوجوه محدباً، توفر طريقة بناءة لتوليد تقديرات PAC باستخدام البرمجة الخطية بالأعداد الصحيحة المختلطة (MILP). تم التحقق من الطريقة في تطبيق الكبح الطارئ الآلي.
تفترض نظرية التعلم الإحصائي التقليدية (مثل تعلم PAC) أن دالة التسمية المستهدفة ثابتة لا تتغير. ومع ذلك، في العديد من التطبيقات العملية، يتغير هدف التعلم بمرور الوقت. تدرس هذه الورقة كيفية التعلم من عينات محدودة لهذا الآلية المتغيرة بشكل منظم للتسمية، مع توفير ضمانات احتمالية.
الاحتياجات العملية: في مجالات أنظمة التحكم والروبوتات والقيادة الذاتية، تتغير معاملات البيئة والنظام بمرور الوقت (مثل تدهور أداء الكبح وتغير كتلة المركبة)
التحديات النظرية: لا يمكن تطبيق نظرية PAC الكلاسيكية مباشرة على الأهداف المتحركة، مما يتطلب إطار نظري جديد
التطبيقات الحساسة للسلامة: في الأنظمة الحساسة للسلامة مثل القيادة الذاتية، يلزم توفير ضمانات احتمالية صارمة
طريقة السيناريو (Scenario Approach): موجهة بشكل أساسي لتحسين عدم اليقين للأهداف الثابتة، لا تأخذ في الاعتبار تغير الهدف بمرور الوقت
نظرية VC: تتطلب بُعد VC محدود، وموجهة بشكل أساسي للأهداف الثابتة
التعلم الموجود للأهداف المتحركة: مثل الأعمال 2,3,15,20,22,23 وغيرها، لكن معظمها يوفر تقييماً للقيمة المتوقعة وليس ضمانات احتمالية ثنائية المستوى من نوع PAC
نقص الطرق البناءة: معظم التحليلات الموجودة هي إثباتات وجودية، تفتقر إلى خوارزميات عملية لبناء الفرضيات
حدود تعقيد العينات المسبقة: توفير حد مسبق لعدد العينات الأدنى المطلوب لتوليد فرضيات PAC في القسم 3 (النظرية 2)، توسيع عمل 20 لكن باستخدام نتائج من نوع PAC بدلاً من التقييم المتوقع
التصحيح الرياضي: تصحيح الثغرات الرياضية في 20, النظرية 1، مع إدخال حد أدنى لتغير الهدف μ (وليس فقط الحد الأعلى μ̄)
طريقة MILP البناءة: اقتراح أول طريقة بناءة في القسم 4، باستخدام البرمجة الخطية بالأعداد الصحيحة المختلطة لتوليد فرضيات الاختلاف الأدنى لفئة المتعددات المحدبة (هذه أول طريقة بناءة لمشاكل التتبع)
التحقق من التطبيق العملي: التحقق من النتائج النظرية في القسم 5 من خلال دراسة حالة نظام الكبح الطارئ الآلي (AEB)، مع اقتراح استراتيجية حذف العينات لتحسين الكفاءة الحسابية (حذف 95% من العينات الزائدة)
1 Alamo et al., 2009. "Randomized strategies for probabilistic solutions" - أساس الطرق العشوائية
5-7,9,12 سلسلة Calafiore & Campi. "The scenario approach" - أدبيات أساسية لطريقة السيناريو
20 Helmbold & Long, 1994. "Tracking drifting concepts by minimizing disagreements" - الهدف الرئيسي للتوسع في هذه الورقة
29 Vidyasagar, 2003. "Learning and Generalisation" - كتاب كلاسيكي لتعلم PAC ونظرية VC
28 Tempo et al., 2005. "Randomized algorithms for analysis and control" - الطرق العشوائية في التحكم
التقييم الشامل: هذه ورقة ممتازة بنظرية صارمة وطرق مبتكرة. المساهمات الرئيسية تكمن في توسيع تعلم PAC إلى الأهداف المتحركة وتوفير أول خوارزمية بناءة. الاشتقاق النظري كامل، تصحيح الأخطاء في الأدبيات، والتحقق التجريبي كافٍ. القيود الرئيسية هي الحاجة إلى معرفة حدود التغيير مسبقاً، التعقيد الحسابي العالي، والافتراض بتوزيع ثابت. الورقة مناسبة للأنظمة ذات التغير البطيء والحساسة للسلامة، وتساهم بشكل مهم في البحث المتقاطع بين نظرية التعلم الإحصائي والتحكم. يُنصح بالعمل اللاحق على التقدير التكيفي وتحسين الكفاءة الحسابية وتوسيع انجراف التوزيع.