2025-11-19T15:49:13.925681

Myopic Bayesian Decision Theory for Batch Active Learning with Partial Batch Label Sampling

Hu, Mussmann

Over the past couple of decades, many active learning acquisition functions have been proposed, leaving practitioners with an unclear choice of which to use. Bayesian Decision Theory (BDT) offers a universal principle to guide decision-making. In this work, we derive BDT for (Bayesian) active learning in the myopic framework, where we imagine we only have one more point to label. This derivation leads to effective algorithms such as Expected Error Reduction (EER), Expected Predictive Information Gain (EPIG), and other algorithms that appear in the literature. Furthermore, we show that BAIT (active learning based on V-optimal experimental design) can be derived from BDT and asymptotic approximations. A key challenge of such methods is the difficult scaling to large batch sizes, leading to either computational challenges (BatchBALD) or dramatic performance drops (top-$B$ selection). Here, using a particular formulation of the decision process, we derive Partial Batch Label Sampling (ParBaLS) for the EPIG algorithm. We show experimentally for several datasets that ParBaLS EPIG gives superior performance for a fixed budget and Bayesian Logistic Regression on Neural Embeddings. Our code is available at https://github.com/ADDAPT-ML/ParBaLS.

academic

نظرية القرار البايزية قصيرة النظر للتعلم النشط الدفعي مع أخذ العينات الجزئية للتسميات الدفعية

المعلومات الأساسية

معرّف الورقة: 2510.09877
العنوان: Myopic Bayesian Decision Theory for Batch Active Learning with Partial Batch Label Sampling
المؤلفون: Kangping Hu, Stephen Mussmann (معهد جورجيا للتكنولوجيا)
التصنيف: cs.LG cs.AI stat.ML
تاريخ النشر: 10 أكتوبر 2025 (نسخة أولية)
رابط الورقة: https://arxiv.org/abs/2510.09877v1

الملخص

على مدى العقود الماضية، تم اقتراح العديد من دوال الاستحصال للتعلم النشط، لكن الممارسين يواجهون صعوبة في اختيار الطريقة المناسبة. توفر نظرية القرار البايزية (BDT) مبادئ عامة لتوجيه القرارات. تشتق هذه الورقة نظرية القرار البايزية للتعلم النشط (البايزي) في إطار قصير النظر، بافتراض الحاجة إلى تسمية نقطة بيانات إضافية واحدة فقط. ينتج عن هذا الاشتقاق خوارزميات فعالة مثل تقليل الخطأ المتوقع (EER) والمكسب المعلوماتي المتوقع للتنبؤ (EPIG) وغيرها. علاوة على ذلك، يثبت المؤلفون أن BAIT يمكن اشتقاقه من خلال نظرية القرار البايزية والتقريبات المقاربة. التحدي الرئيسي لهذه الفئة من الطرق هو صعوبة التوسع إلى أحجام دفعات كبيرة، مما يؤدي إلى تحديات حسابية (BatchBALD) أو انخفاض حاد في الأداء (اختيار أفضل-B). تشتق هذه الورقة طريقة أخذ العينات الجزئية للتسميات الدفعية (ParBaLS) لخوارزمية EPIG من خلال صيغة عملية قرار محددة. تظهر التجارب أن ParBaLS EPIG يحقق أداءً متفوقة على عدة مجموعات بيانات في إطار الانحدار اللوجستي البايزي على التضمينات العصبية مع ميزانية ثابتة.

الخلفية البحثية والدافع

تعريف المشكلة

يهدف التعلم النشط إلى اختيار البيانات الأكثر إفادة من كمية كبيرة من البيانات غير المسماة للتسمية، بهدف تعظيم أداء النموذج ضمن ميزانية تسمية محدودة. تشمل الطرق الموجودة الطرق الاستكشافية والطرق الاحتمالية، لكنها تفتقر إلى مبادئ توجيهية واضحة للاختيار.

أهمية المشكلة

الاحتياجات العملية: في التعلم الآلي الحديث، عادة ما يتم تسمية البيانات على شكل دفعات وليس بشكل فردي
صعوبة اختيار الطريقة: تفتقر الخوارزميات الموجودة إلى القابلية للتفسير، مما يجعل من الصعب على الممارسين تحديد متى وأي خوارزمية تكون فعالة
تحديات التوسع: تواجه الطرق الموجودة مشاكل حسابية أو أداء في أحجام الدفعات الكبيرة

قيود الطرق الموجودة

اختيار أفضل-B: يتجاهل الاعتماديات بين تسميات الدفعة، قد يختار عينات زائدة
التنوع الاستكشافي: يتطلب ضبط المعاملات الفائقة الخاصة بمجموعة البيانات، وهو غير ممكن في التعلم النشط
الاستحصال الدفعي الجشع: طرق مثل BatchBALD لها تعقيد حسابي يزداد بشكل أسي مع حجم الدفعة

الدافع البحثي

توفير إطار نظري موحد من خلال نظرية القرار البايزية، لشرح كيفية عمل الخوارزميات الموجودة، واقتراح طرق جديدة يمكنها التعامل بفعالية مع اختيار الدفعات.

المساهمات الأساسية

التوحيد النظري: توحيد عدة خوارزميات (EER, EPIG, BAIT وغيرها) كنتائج اشتقاق من نظرية القرار البايزية قصيرة النظر (MBDT)
اقتراح طريقة جديدة: تقديم طريقة أخذ العينات الجزئية للتسميات الدفعية (ParBaLS) لحل تحديات التعلم النشط الدفعي
التحليل النظري: إثبات أن خطأ تقريب مونت كارلو لـ ParBaLS هو O(1/√m)، وغير معتمد على حجم الدفعة
التحقق التجريبي: التحقق من أداء ParBaLS EPIG المتفوقة في 10 إعدادات مختلفة

شرح الطريقة

تعريف المهمة

بالنظر إلى مجال الإدخال X، مجال الإخراج Y، ومجموعة بيانات الحوض غير المسماة D⊂X، الهدف هو اختيار T دفعة بشكل متكرر S⊂D، حيث يكون حجم كل دفعة |S|=B للتسمية، بحيث يتم تقليل خسارة الاختبار بعد التدريب على مجموعة التسميات.

نظرية القرار البايزية قصيرة النظر (MBDT)

اشتقاق اختيار النقطة الواحدة

في إطار قصير النظر، بافتراض اختيار نقطة بيانات إضافية واحدة فقط x̂، فإن نقطة التسمية التالية هي:

argmin_{x̂∈D} E_{ŷ~Y_{x̂}|L} [min_{P∈Δ^{|V|}_Y} E_{y⃗~Y_V|Y_{x̂}=ŷ,L} [∑_{j=1}^{|V|} ℓ(y_j, P_j)]]

بالنسبة لخسارة اللوغاريتم السالب للاحتمالية، يتم تبسيط الخسارة المتوقعة إلى الإنتروبيا:

argmax_{x̂∈D} ∑_{x∈V} I(Y_x; Y_{x̂}|L)

هذا يكافئ خوارزميات EPIG و EER وغيرها.

تحديات اختيار الدفعة

تنقسم استراتيجيات الدفعة الموجودة إلى ثلاث فئات:

أفضل-B: اختيار أفضل B نقطة بأعلى درجات، تجاهل العلاقات الاعتمادية
التنوع الاستكشافي: إضافة عشوائية أو تنوع، يتطلب ضبط المعاملات الفائقة
الاستحصال الدفعي الجشع: تحسين الدفعة بأكملها، تعقيد حسابي عالي

طريقة ParBaLS

الفكرة الأساسية

إدخال دفعة جزئية S تم الالتزام بتسميتها لكن لم تُلاحظ التسميات، النقطة المثلى التالية هي:

argmax_{x̂∈D} E_{y_S~Y_S|L} [∑_{x∈V} I(Y_x; Y_{x̂}|Y_S = y_S, L)]

تقدير مونت كارلو

استخدام تقدير مونت كارلو للتعامل مع المجموع على مستوى أسي:

argmax_{x̂∈D} (1/m) ∑_{i=1}^m ∑_{x∈V} I(Y_x; Y_{x̂}|Y_S = y_S^{(i)}, L)

تدفق الخوارزمية

تبني خوارزمية ParBaLS الدفعة بشكل تدريجي:

تهيئة دفعة فارغة S=∅
تدريب نموذج بايزي M_L
أخذ عينات من m نسخة تسمية زائفة y^{(i)}~Y_D|L
لكل موضع دفعة:
- حساب درجة EPIG لكل نقطة مرشحة
- اختيار النقطة ذات أعلى درجة وإضافتها إلى الدفعة
- تحديث m نموذج متوازي باستخدام التسميات الزائفة
إرجاع الدفعة الكاملة

اشتقاق BAIT

من خلال تقريب مقارب غير رسمي، يمكن أيضاً اشتقاق BAIT من مبادئ MBDT:

Tr([∇²ℓ_{L∪S}(ŵ_L)]^{-1}∇²ℓ_D(ŵ_L))

إعداد التجارب

مجموعات البيانات

تغطي التجارب 6 فئات من مجموعات البيانات:

البيانات الجدولية: رضا الركاب في الخطوط الجوية، احتيال بطاقات الائتمان
بيانات الصور القياسية: CIFAR-10, CIFAR-100
بيانات الصور من العالم الحقيقي: iWildCam, fMoW (من معيار WILDS)
بيانات الصور من واحد إلى متعدد: تحويل متعدد الفئات إلى سيناريوهات عدم توازن ثنائية
بيانات الصور مع تحول المجموعات الفرعية: إعدادات ثلاثية الفئات، الاختبار على الفئتين الأوليين فقط

إعداد النموذج

بيانات الصور: استخدام نموذج تضمين ثابت (CLIP-ViT-B/32 لـ WILDS، DINOv2-ViT-S/14 لـ CIFAR)
البيانات الجدولية: تطبيق الانحدار اللوجستي البايزي مباشرة
الإعداد البايزي: k=400 عينة معامل خلفي، استخدام أخذ عينات NUTS

مقاييس التقييم

استخدام دقة الاختبار كمقياس تقييم أساسي

طرق المقارنة

الطرق البايزية: EPIG, BALD (مع أفضل-B أو ضوضاء Gumbel)
الطرق الأساسية: عشوائي، الثقة، BatchBALD
الطريقة المقترحة: ParBaLS-MAP EPIG, ParBaLS EPIG

معاملات التجربة

T=10 تكرارات، ميزانية B=10 عينة لكل تكرار
أخذ عينات عشوائية أولية من 500 عينة
استخدام B=20، عينات أولية 100 لبعض الإعدادات لزيادة التمييز
تشغيل كل إعداد 5 مرات بـ بذور مختلفة

نتائج التجارب

النتائج الرئيسية

وفقاً لنتائج التجارب الكاملة في الجدول 1، يحقق ParBaLS EPIG أفضل أداء في 9 من 10 إعدادات:

الخوارزمية	أعلى متوسط	دخول القائمة الأمامية
ParBaLS EPIG	4	9
ParBaLS-MAP EPIG	2	7
SoftRankEPIG	0	4
EPIG	0	4
الثقة	3	5

الأداء المحدد

مجموعات البيانات الجدولية (الأداء الأكثر بروزاً):

رضا الركاب في الخطوط الجوية: يحقق ParBaLS EPIG 89.42±0.41%
احتيال بطاقات الائتمان: يحقق ParBaLS EPIG 93.55±0.23%

إعداد تحول المجموعات الفرعية (الأكثر تحدياً):

fMoW: يحقق ParBaLS EPIG 31.37±6.60%، متفوق بشكل ملحوظ على الطرق الأخرى
iWildCam: يحقق ParBaLS EPIG 84.72±1.98%

تحليل منحنيات التعلم

يوضح الشكل 2 أن طريقة ParBaLS تحافظ على ميزة ثابتة طوال عملية التعلم على مجموعات البيانات الجدولية، خاصة في إعدادات الميزانية المنخفضة.

تجارب الاستئصال

ParBaLS مقابل ParBaLS-MAP: عادة ما يتفوق ParBaLS الكامل على النسخة التي تستخدم تسميات MAP فقط
تأثير حجم الدفعة: تكون ميزة ParBaLS أكثر وضوحاً مع دفعات أكبر (B=20)
نقطة واحدة مقابل دفعة: تظهر التجارب في الملحق أنه على الرغم من أن اختيار النقطة الواحدة (B=1) له أداء أفضل، فإن اختيار الدفعة أكثر كفاءة في التطبيقات العملية

الأعمال ذات الصلة

تصنيف طرق التعلم النشط

الطرق الاستكشافية: بناءً على عدم اليقين (الثقة، الهامش، الإنتروبيا)، التنوع (CORESET) أو كليهما (BADGE, GALAXY)
الطرق الاحتمالية: BALD, BatchBALD, BAIT وغيرها بناءً على نظرية المعلومات أو المبادئ البايزية

تقليل الخطأ المتوقع (EER)

يركز EER مباشرة على مقاييس الأداء مثل خسارة الصفر والواحد واللوغاريتم السالب للاحتمالية، مما يوفر قابلية تفسير أفضل. تشمل الأعمال ذات الصلة متغيرات تجمع بين الطرق الاستكشافية والطرق التكيفية لسيناريوهات الميزانية المنخفضة.

التسميات الزائفة في التعلم النشط

بخلاف التعلم شبه الموجه، تُستخدم التسميات الزائفة في التعلم النشط بشكل أساسي لـ:

تحسين التدريب: التدريب مع الجمع بين التسميات الحقيقية والزائفة
بناء الدفعة: الابتكار في ParBaLS هو استخدام التسميات الزائفة فقط لبناء الدفعة مؤقتاً، دون تلويث بيانات التسمية النهائية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

التوحيد النظري: توفر MBDT أساساً نظرياً موحداً لعدة خوارزميات للتعلم النشط
حل الدفعة: يحل ParBaLS بفعالية مشكلة التوسع في التعلم النشط الدفعي
التحقق التجريبي: يحقق ParBaLS EPIG أداءً متفوقة في إعدادات متعددة، خاصة في السيناريوهات ذات عدم اليقين العالي

القيود

التعقيد الحسابي: التعقيد الزمني لـ ParBaLS هو O(TBm)، حيث تزيد m نموذج متوازي من العبء الحسابي
قابلية تطبيق الطريقة: تم التحقق منها بشكل أساسي على الانحدار اللوجستي البايزي، يتطلب التوسع إلى الشبكات العميقة مزيداً من البحث
التحليل النظري: يعتمد اشتقاق BAIT على تقريبات مقاربة غير رسمية، تحتاج الصرامة النظرية إلى تحسين

الاتجاهات المستقبلية

الكفاءة الحسابية: اكتشاف طرق تقريبية محسّنة حسابياً، التوسع إلى مجموعات بيانات وأنماط أكبر
التكامل مع التعلم العميق: البحث عن كيفية توسيع ParBaLS إلى التدريب الكامل للشبكات العصبية العميقة
تحسين النظرية: توفير تحليل نظري أكثر صرامة وضمانات التقارب

التقييم المتعمق

المزايا

المساهمة النظرية: توفير إطار نظري موحد لخوارزميات التعلم النشط، تحسين القابلية للتفسير
القيمة العملية: يحل ParBaLS مشكلة اختيار الدفعة في التطبيقات العملية
التجارب الشاملة: تغطي أنواع بيانات متعددة وإعدادات تحديات، النتائج مقنعة
ابتكار الطريقة: تطبيق التسميات الزائفة في بناء الدفعة له جدة

أوجه القصور

النفقات الحسابية: صيانة m نموذج متوازي تزيد من التكلفة الحسابية
الصرامة النظرية: بعض الاشتقاقات (مثل BAIT) تعتمد على تقريبات غير رسمية
قيود التجارب: التحقق بشكل أساسي على نماذج نسبياً بسيطة (الانحدار اللوجستي)
حساسية المعاملات الفائقة: تحليل اختيار m وتأثيره على التوازن بين الأداء والحساب غير كافٍ

التأثير

التأثير النظري: توفير منظور نظري جديد للتعلم النشط، قد يلهم الأبحاث اللاحقة
القيمة العملية: لطريقة ParBaLS قيمة تطبيق مباشرة، خاصة في سيناريوهات التسمية الدفعية
قابلية إعادة الإنتاج: توفير كود مفتوح المصدر، يسهل إعادة الإنتاج والتوسع

السيناريوهات المناسبة

المهام ذات عدم اليقين العالي: البيانات الجدولية وتحول المجموعات الفرعية والسيناريوهات الأخرى ذات عدم اليقين غير القابل للاختزال
احتياجات التسمية الدفعية: التطبيقات العملية التي تتطلب تسمية دفعية وليس فردية
الإعدادات البايزية: النماذج والمهام التي يمكنها إجراء الاستدلال البايزي

المراجع

تستشهد هذه الورقة بالأدبيات المهمة في مجال التعلم النشط، بما في ذلك:

طرق أخذ العينات الكلاسيكية بناءً على عدم اليقين (Lewis, 1995)
طرق التعلم النشط البايزي (Houlsby et al., 2011; Gal et al., 2017)
طرق التعلم النشط الدفعي (Kirsch et al., 2019, 2023)
طرق تقليل الخطأ المتوقع (Roy and McCallum, 2001; Mussmann et al., 2022)

التقييم الإجمالي: هذه ورقة ذات قيمة نظرية وعملية مهمة في مجال التعلم النشط. من خلال توحيد الخوارزميات الموجودة بـ MBDT واقتراح ParBaLS لحل مشكلة اختيار الدفعة، توفر اتجاهاً بحثياً جديداً للمجال. على الرغم من وجود مجال للتحسين في الكفاءة الحسابية والصرامة النظرية، فإن مساهماتها كبيرة.