تدرس هذه الورقة مشكلة تعلم الفضاءات النصفية العامة (غير المتجانسة) على التوزيع الغاوسي Rd، مع النظر في نمطي وصول الاستعلام المختلفين. في نموذج التعلم النشط القائم على المجموعة الكلاسيكي، يمكن للخوارزمية إجراء استعلامات تسميات تكيفية على النقاط المأخوذة مسبقاً. يثبت المؤلفون حدوداً نظرية معلومات قوية تستبعد التحسينات غير البديهية بالنسبة للإعداد السلبي. على وجه التحديد، يتطلب أي متعلم نشط تعقيد تسميات بقيمة Ω~(d/(log(m)ϵ))، حيث m هو عدد العينات غير المسماة. لتجاوز تعقيد التسميات O~(d/ϵ) للتعلم السلبي، يحتاج المتعلم النشط إلى 2poly(d) عينة غير مسماة. من الناحية الإيجابية، يثبت المؤلفون أنه يمكن تجنب هذا الحد من خلال وصول استعلامات العضوية، حتى في النموذج غير المعروف. على وجه التحديد، يقدمون متعلماً فعالاً حسابياً بتعقيد استعلام O~(min{1/p,1/ϵ}+d⋅polylog(1/ϵ))، مما يحقق ضمان خطأ بقيمة O(opt)+ϵ.
تدرس هذه الورقة مشكلة تعلم الفضاءات النصفية العامة تحت التوزيع الغاوسي. الفضاء النصفي (أو دالة العتبة الخطية LTF) هو دالة من الشكل h(x)=sign(w⋅x+t)، حيث w∈Sd−1 هو متجه الأوزان و t هو العتبة. عندما يكون t=0، يُطلق عليه الفضاء النصفي المتجانس.
الفجوة النظرية: بالنسبة للفضاءات النصفية المتجانسة، من المعروف أن التعلم النشط يمكن أن يحقق تعقيد تسميات بقيمة O(dlog(1/ϵ))، لكن ما إذا كان يمكن تحقيق تحسينات مماثلة للفضاءات النصفية العامة لا يزال سؤالاً مفتوحاً.
الأهمية العملية: تعلم الفضاءات النصفية هو مشكلة كلاسيكية في التعلم الآلي، مع تأثير مهم من خوارزمية الإدراك الحسي إلى آلات المتجهات الداعمة و AdaBoost.
مقارنة نماذج الاستعلام: يتطلب فهم الفروقات في القدرات بين التعلم النشط (استعلامات التسميات) واستعلامات العضوية دراسة متعمقة.
الإدخال: الوصول إلى دالة مسماة y(x):Rd→{±1}، مع التوزيع المستهدف N(0,I)الإخراج: فضاء نصفي h^(x)=sign(w^⋅x+t^)الهدف: تقليل معدل الخطأ err(h^)=Prx∼N(0,I)(h^(x)=y(x))
إذا كان يمكن تعلم فضاء نصفي بمعدل خطأ p/2 باستخدام عدد قليل من الاستعلامات، فيمكن تقسيم مجموعة العينات بشكل عشوائي، واستخدام الجزء الأول لتعلم الفضاء النصفي، واستخدام الجزء الثاني للعثور على d عينات سالبة بـ O(d) استعلامات متوقعة.
اللمة 2.1: إذا كانت هناك خوارزمية تعلم نشط يمكنها تعلم فضاء نصفي بانحياز p إلى معدل خطأ p/2 باستخدام r استعلام تسمية، فإن هناك خوارزمية تستخدم r+O(d) استعلام للعثور على d عينات سالبة من 2m عينة.
اللمة 2.2: بالنسبة للمصفوفة A∈Rk×d، إذا كان ∥AAT−dI∥2≤O(d/(t∗)2)، فإن احتمال أن يسمي الفضاء النصفي العشوائي جميع العينات k كسالبة هو على الأكثر O(plog(1/p))k.
النظرية 1.1: بالنسبة لأي خوارزمية تعلم نشط A، يوجد فضاء نصفي h∗ بانحياز p، إذا أجرت A أقل من Ω~(d/(plog(m))) استعلام تسمية على m عينة غاوسية مستقلة وموزعة بشكل متطابق، فإنها تُخرج باحتمال لا يقل عن 2/3 فرضية بمعدل خطأ يتجاوز p/2.
النتيجة: لتجاوز تعقيد التعلم السلبي O~(d/ϵ)، يتطلب الأمر 2poly(d) عينة غير مسماة.
هذه الورقة تمثل مساهمة مهمة في نظرية التعلم النشط، حيث تكشف من خلال التحليل الرياضي الدقيق الفروقات الجوهرية بين نماذج الاستعلام المختلفة، مما يضع أساساً متيناً لتطور هذا المجال النظري.