2025-11-19T15:49:13.925681

Myopic Bayesian Decision Theory for Batch Active Learning with Partial Batch Label Sampling

Hu, Mussmann

Over the past couple of decades, many active learning acquisition functions have been proposed, leaving practitioners with an unclear choice of which to use. Bayesian Decision Theory (BDT) offers a universal principle to guide decision-making. In this work, we derive BDT for (Bayesian) active learning in the myopic framework, where we imagine we only have one more point to label. This derivation leads to effective algorithms such as Expected Error Reduction (EER), Expected Predictive Information Gain (EPIG), and other algorithms that appear in the literature. Furthermore, we show that BAIT (active learning based on V-optimal experimental design) can be derived from BDT and asymptotic approximations. A key challenge of such methods is the difficult scaling to large batch sizes, leading to either computational challenges (BatchBALD) or dramatic performance drops (top-$B$ selection). Here, using a particular formulation of the decision process, we derive Partial Batch Label Sampling (ParBaLS) for the EPIG algorithm. We show experimentally for several datasets that ParBaLS EPIG gives superior performance for a fixed budget and Bayesian Logistic Regression on Neural Embeddings. Our code is available at https://github.com/ADDAPT-ML/ParBaLS.

academic

ব্যাচ অ্যাক্টিভ লার্নিংয়ের জন্য আংশিক ব্যাচ লেবেল স্যাম্পলিং সহ মায়োপিক বেইজিয়ান সিদ্ধান্ত তত্ত্ব

মৌলিক তথ্য

পেপার আইডি: 2510.09877
শিরোনাম: Myopic Bayesian Decision Theory for Batch Active Learning with Partial Batch Label Sampling
লেখক: কাংপিং হু, স্টিফেন মাসম্যান (জর্জিয়া ইনস্টিটিউট অফ টেকনোলজি)
শ্রেণীবিভাগ: cs.LG cs.AI stat.ML
প্রকাশনার সময়: ২০২৫ সালের ১০ অক্টোবর (প্রি-প্রিন্ট)
পেপার লিংক: https://arxiv.org/abs/2510.09877v1

সারসংক্ষেপ

গত কয়েক দশকে অসংখ্য অ্যাক্টিভ লার্নিং অধিগ্রহণ ফাংশন প্রস্তাব করা হয়েছে, কিন্তু অনুশীলনকারীরা প্রায়শই উপযুক্ত পদ্ধতি নির্বাচন করতে অসুবিধা পান। বেইজিয়ান সিদ্ধান্ত তত্ত্ব (BDT) সিদ্ধান্ত গ্রহণের নির্দেশনা দেওয়ার জন্য একটি সর্বজনীন নীতি প্রদান করে। এই পেপারটি মায়োপিক কাঠামোর অধীনে (বেইজিয়ান) অ্যাক্টিভ লার্নিংয়ের জন্য BDT প্রকাশ করে, যেখানে অনুমান করা হয় যে শুধুমাত্র একটি অতিরিক্ত ডেটা পয়েন্ট লেবেল করার প্রয়োজন। এই প্রকাশনা কার্যকর অ্যালগরিদম তৈরি করে, যেমন প্রত্যাশিত ত্রুটি হ্রাস (EER), প্রত্যাশিত পূর্বাভাস তথ্য লাভ (EPIG) ইত্যাদি। অধিকন্তু, লেখকরা প্রমাণ করেছেন যে BAIT কে BDT এবং অ্যাসিম্পটোটিক অনুমান থেকে প্রকাশ করা যায়। এই ধরনের পদ্ধতির মূল চ্যালেঞ্জ হল বড় ব্যাচ আকারে স্কেল করা কঠিন, যা গণনামূলক চ্যালেঞ্জ (BatchBALD) বা কর্মক্ষমতা তীব্র হ্রাস (শীর্ষ-B নির্বাচন) সৃষ্টি করে। এই পেপারটি নির্দিষ্ট সিদ্ধান্ত প্রক্রিয়া সূত্রের মাধ্যমে EPIG অ্যালগরিদমের জন্য আংশিক ব্যাচ লেবেল স্যাম্পলিং (ParBaLS) পদ্ধতি প্রকাশ করে। পরীক্ষা-নিরীক্ষা দেখায় যে নির্দিষ্ট বাজেট এবং নিউরাল এমবেডিংয়ে বেইজিয়ান লজিস্টিক রিগ্রেশন সেটিংয়ের অধীনে, ParBaLS EPIG একাধিক ডেটাসেটে উৎকৃষ্ট কর্মক্ষমতা প্রদর্শন করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার সংজ্ঞা

অ্যাক্টিভ লার্নিং বৃহৎ পরিমাণ অলেবেল করা ডেটা থেকে সবচেয়ে তথ্যপূর্ণ ডেটা নির্বাচন করার লক্ষ্য রাখে যাতে সীমিত লেবেলিং বাজেটের অধীনে মডেল কর্মক্ষমতা সর্বাধিক করা যায়। বিদ্যমান পদ্ধতিগুলির মধ্যে রয়েছে হিউরিস্টিক পদ্ধতি এবং সম্ভাব্য পদ্ধতি, কিন্তু স্পষ্ট নির্বাচন নির্দেশিকা নীতির অভাব রয়েছে।

সমস্যার গুরুত্ব

ব্যবহারিক চাহিদা: আধুনিক মেশিন লার্নিংয়ে, ডেটা সাধারণত ব্যাচ আকারে লেবেল করা হয় বরং পৃথকভাবে নয়
পদ্ধতি নির্বাচনের অসুবিধা: বিদ্যমান অ্যালগরিদমগুলি ব্যাখ্যাযোগ্যতার অভাব রয়েছে, অনুশীলনকারীরা কখন এবং কোন অ্যালগরিদম কার্যকর তা নির্ধারণ করতে অসুবিধা পান
স্কেলেবিলিটি চ্যালেঞ্জ: বিদ্যমান পদ্ধতিগুলি বড় ব্যাচ আকারে গণনামূলক বা কর্মক্ষমতা সমস্যার সম্মুখীন হয়

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

শীর্ষ-B নির্বাচন: ব্যাচ লেবেলগুলির মধ্যে নির্ভরতা উপেক্ষা করে, সম্ভবত অপ্রয়োজনীয় নমুনা নির্বাচন করে
হিউরিস্টিক বৈচিত্র্য: ডেটাসেট-নির্দিষ্ট হাইপারপ্যারামিটার সামঞ্জস্যের প্রয়োজন, অ্যাক্টিভ লার্নিংয়ে অসম্ভব
লোভী ব্যাচ অধিগ্রহণ: BatchBALD এর মতো পদ্ধতিগুলি ব্যাচ আকারের সাথে সূচকীয়ভাবে বৃদ্ধি পায়

গবেষণা প্রেরণা

বেইজিয়ান সিদ্ধান্ত তত্ত্বের মাধ্যমে একটি একীভূত তাত্ত্বিক কাঠামো প্রদান করা, বিদ্যমান অ্যালগরিদমের কাজের নীতি ব্যাখ্যা করা এবং ব্যাচ নির্বাচন কার্যকরভাবে পরিচালনা করতে পারে এমন নতুন পদ্ধতি প্রস্তাব করা।

মূল অবদান

তাত্ত্বিক একীকরণ: একাধিক অ্যালগরিদম (EER, EPIG, BAIT ইত্যাদি) কে মায়োপিক বেইজিয়ান সিদ্ধান্ত তত্ত্ব (MBDT) এর প্রকাশনার ফলাফলে একীভূত করা
নতুন পদ্ধতি প্রস্তাব: ব্যাচ অ্যাক্টিভ লার্নিংয়ের চ্যালেঞ্জ সমাধানের জন্য আংশিক ব্যাচ লেবেল স্যাম্পলিং (ParBaLS) প্রবর্তন করা
তাত্ত্বিক বিশ্লেষণ: ParBaLS এর মন্টে কার্লো অনুমান ত্রুটি O(1/√m) প্রমাণ করা, যা ব্যাচ আকারের উপর নির্ভর করে না
পরীক্ষামূলক যাচাইকরণ: ১০টি ভিন্ন সেটিংয়ে ParBaLS EPIG এর উচ্চতর কর্মক্ষমতা যাচাই করা

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

ইনপুট ডোমেইন X, আউটপুট ডোমেইন Y এবং অলেবেল করা পুল ডেটাসেট D⊂X দেওয়া, লক্ষ্য হল T টি ব্যাচ S⊂D পুনরাবৃত্তিমূলকভাবে নির্বাচন করা, প্রতিটি ব্যাচ আকার |S|=B লেবেল করা, যাতে লেবেল করা সেটে প্রশিক্ষণের পরে পরীক্ষার ক্ষতি ন্যূনতম হয়।

মায়োপিক বেইজিয়ান সিদ্ধান্ত তত্ত্ব (MBDT)

একক পয়েন্ট নির্বাচন প্রকাশনা

মায়োপিক কাঠামোর অধীনে, অনুমান করা হয় যে শুধুমাত্র একটি অতিরিক্ত ডেটা পয়েন্ট x̂ নির্বাচন করা হয়, পরবর্তী লেবেল করা পয়েন্ট হল:

argmin_{x̂∈D} E_{ŷ~Y_{x̂}|L} [min_{P∈Δ^{|V|}_Y} E_{y⃗~Y_V|Y_{x̂}=ŷ,L} [∑_{j=1}^{|V|} ℓ(y_j, P_j)]]

নেতিবাচক লগ সম্ভাবনা ক্ষতির জন্য, সর্বোত্তম পূর্বাভাস পোস্টেরিয়র বিতরণ, প্রত্যাশিত ক্ষতি এন্ট্রপিতে সরল করা হয়:

argmax_{x̂∈D} ∑_{x∈V} I(Y_x; Y_{x̂}|L)

এটি EPIG এবং EER অ্যালগরিদমের সমতুল্য।

ব্যাচ নির্বাচন চ্যালেঞ্জ

বিদ্যমান ব্যাচ কৌশলগুলি তিনটি বিভাগে বিভক্ত:

শীর্ষ-B: সর্বোচ্চ স্কোর সহ B টি পয়েন্ট নির্বাচন করে, নির্ভরতা উপেক্ষা করে
হিউরিস্টিক বৈচিত্র্য: র্যান্ডমনেস বা বৈচিত্র্য যোগ করে, হাইপারপ্যারামিটার সামঞ্জস্যের প্রয়োজন
লোভী ব্যাচ অধিগ্রহণ: সম্পূর্ণ ব্যাচ অপ্টিমাইজ করে, উচ্চ গণনামূলক জটিলতা

ParBaLS পদ্ধতি

মূল ধারণা

ইতিমধ্যে প্রতিশ্রুতিবদ্ধ কিন্তু অপর্যবেক্ষিত লেবেল সহ আংশিক ব্যাচ S প্রবর্তন করা, পরবর্তী সর্বোত্তম পয়েন্ট হল:

argmax_{x̂∈D} E_{y_S~Y_S|L} [∑_{x∈V} I(Y_x; Y_{x̂}|Y_S = y_S, L)]

মন্টে কার্লো অনুমান

সূচকীয় স্তরের যোগফল পরিচালনা করতে মন্টে কার্লো অনুমান ব্যবহার করা:

argmax_{x̂∈D} (1/m) ∑_{i=1}^m ∑_{x∈V} I(Y_x; Y_{x̂}|Y_S = y_S^{(i)}, L)

অ্যালগরিদম প্রবাহ

ParBaLS অ্যালগরিদম ক্রমান্বয়ে ব্যাচ তৈরি করে:

খালি ব্যাচ S=∅ শুরু করা
বেইজিয়ান মডেল M_L প্রশিক্ষণ করা
m টি ছদ্ম-লেবেল সংস্করণ y^{(i)}~Y_D|L নমুনা করা
প্রতিটি ব্যাচ অবস্থানের জন্য:
- প্রতিটি প্রার্থী পয়েন্টের EPIG স্কোর গণনা করা
- সর্বোচ্চ স্কোর সহ পয়েন্ট ব্যাচে যোগ করা
- ছদ্ম-লেবেল সহ m টি সমান্তরাল মডেল আপডেট করা
সম্পূর্ণ ব্যাচ ফেরত দেওয়া

BAIT এর প্রকাশনা

অ-আনুষ্ঠানিক অ্যাসিম্পটোটিক অনুমানের মাধ্যমে, BAIT কে MBDT নীতি থেকেও প্রকাশ করা যায়:

Tr([∇²ℓ_{L∪S}(ŵ_L)]^{-1}∇²ℓ_D(ŵ_L))

পরীক্ষামূলক সেটআপ

ডেটাসেট

পরীক্ষা-নিরীক্ষা ৬টি ডেটাসেট বিভাগ জুড়ে বিস্তৃত:

টেবিলার ডেটা: এয়ারলাইন যাত্রী সন্তুষ্টি, ক্রেডিট কার্ড জালিয়াতি
মান চিত্র ডেটা: CIFAR-10, CIFAR-100
বাস্তব-বিশ্ব চিত্র ডেটা: iWildCam, fMoW (WILDS বেঞ্চমার্ক থেকে)
এক-থেকে-অনেক চিত্র ডেটা: বহু-শ্রেণীকে দ্বি-শ্রেণীতে রূপান্তরিত করা অসম পরিস্থিতি
উপ-গোষ্ঠী স্থানান্তর চিত্র ডেটা: তিন-শ্রেণী সেটিং, শুধুমাত্র প্রথম দুটি শ্রেণীতে পরীক্ষা করা

মডেল সেটআপ

চিত্র ডেটা: নির্দিষ্ট এমবেডিং মডেল ব্যবহার করা (WILDS এর জন্য CLIP-ViT-B/32, CIFAR এর জন্য DINOv2-ViT-S/14)
টেবিলার ডেটা: সরাসরি বেইজিয়ান লজিস্টিক রিগ্রেশন প্রয়োগ করা
বেইজিয়ান সেটিং: k=400 পোস্টেরিয়র প্যারামিটার নমুনা, NUTS স্যাম্পলার ব্যবহার করা

মূল্যায়ন মেট্রিক্স

পরীক্ষার নির্ভুলতা প্রধান মূল্যায়ন মেট্রিক হিসাবে ব্যবহার করা হয়

তুলনামূলক পদ্ধতি

বেইজিয়ান পদ্ধতি: EPIG, BALD (শীর্ষ-B বা Gumbel শব্দ সহ)
বেসলাইন পদ্ধতি: র্যান্ডম, আত্মবিশ্বাস, BatchBALD
প্রস্তাবিত পদ্ধতি: ParBaLS-MAP EPIG, ParBaLS EPIG

পরীক্ষামূলক প্যারামিটার

T=10 পুনরাবৃত্তি, প্রতিটি B=10 নমুনা বাজেট
প্রাথমিক র্যান্ডম স্যাম্পলিং 500 নমুনা
বিভাজনের জন্য B=20, প্রাথমিক 100 নমুনা ব্যবহার করা বৃদ্ধি করা
প্রতিটি সেটিং 5টি ভিন্ন বীজ সহ চালানো

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

সারণী 1 এর সম্পূর্ণ পরীক্ষামূলক ফলাফল অনুযায়ী, ParBaLS EPIG 10টি সেটিংয়ের 9টিতে সর্বোত্তম কর্মক্ষমতা প্রদর্শন করে:

অ্যালগরিদম	সর্বোচ্চ গড়	শীর্ষ তালিকায়
ParBaLS EPIG	4	9
ParBaLS-MAP EPIG	2	7
SoftRankEPIG	0	4
EPIG	0	4
আত্মবিশ্বাস	3	5

নির্দিষ্ট কর্মক্ষমতা প্রদর্শন

টেবিলার ডেটাসেট (সবচেয়ে উল্লেখযোগ্য):

এয়ারলাইন যাত্রী সন্তুষ্টি: ParBaLS EPIG 89.42±0.41% অর্জন করে
ক্রেডিট কার্ড জালিয়াতি: ParBaLS EPIG 93.55±0.23% অর্জন করে

উপ-গোষ্ঠী স্থানান্তর সেটিং (সবচেয়ে চ্যালেঞ্জিং):

fMoW: ParBaLS EPIG 31.37±6.60% অর্জন করে, অন্যান্য পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে উন্নত
iWildCam: ParBaLS EPIG 84.72±1.98% অর্জন করে

শেখার বক্ররেখা বিশ্লেষণ

চিত্র 2 টেবিলার ডেটাসেটে দেখায় যে ParBaLS পদ্ধতি সম্পূর্ণ শেখার প্রক্রিয়া জুড়ে সুবিধা বজায় রাখে, বিশেষত কম বাজেট সেটিংয়ে আরও উল্লেখযোগ্য কর্মক্ষমতা প্রদর্শন করে।

অ্যাবলেশন পরীক্ষা

ParBaLS বনাম ParBaLS-MAP: সম্পূর্ণ ParBaLS সাধারণত শুধুমাত্র MAP লেবেল ব্যবহার করা সংস্করণের চেয়ে উন্নত
ব্যাচ আকার প্রভাব: বৃহত্তর ব্যাচ (B=20) এ ParBaLS এর সুবিধা আরও স্পষ্ট
একক পয়েন্ট বনাম ব্যাচ: পরিশিষ্ট পরীক্ষা দেখায় যে যদিও একক পয়েন্ট নির্বাচন (B=1) ভাল কর্মক্ষমতা প্রদান করে, ব্যাচ নির্বাচন ব্যবহারিক প্রয়োগে আরও দক্ষ

উপসংহার এবং আলোচনা

প্রধান উপসংহার

তাত্ত্বিক একীকরণ: MBDT একাধিক অ্যাক্টিভ লার্নিং অ্যালগরিদমের জন্য একটি একীভূত তাত্ত্বিক ভিত্তি প্রদান করে
ব্যাচ সমাধান: ParBaLS ব্যাচ অ্যাক্টিভ লার্নিংয়ের স্কেলেবিলিটি সমস্যা কার্যকরভাবে সমাধান করে
পরীক্ষামূলক যাচাইকরণ: ParBaLS EPIG বিভিন্ন সেটিংয়ে উৎকৃষ্ট কর্মক্ষমতা প্রদর্শন করে, বিশেষত উচ্চ অনিশ্চয়তার পরিস্থিতিতে উপযুক্ত

সীমাবদ্ধতা

গণনামূলক জটিলতা: ParBaLS এর সময় জটিলতা O(TBm), m টি সমান্তরাল মডেল গণনামূলক বোঝা বৃদ্ধি করে
পদ্ধতির প্রযোজ্যতা: প্রধানত বেইজিয়ান লজিস্টিক রিগ্রেশনে যাচাই করা, গভীর নেটওয়ার্কে সম্প্রসারণ আরও গবেষণার প্রয়োজন
তাত্ত্বিক বিশ্লেষণ: BAIT এর প্রকাশনা অ-আনুষ্ঠানিক অ্যাসিম্পটোটিক অনুমানের উপর নির্ভর করে, তাত্ত্বিক কঠোরতা উন্নতির অপেক্ষায়

ভবিষ্যত দিকনির্দেশনা

গণনামূলক দক্ষতা: গণনা-দক্ষ অনুমান পদ্ধতি আবিষ্কার করা, বৃহত্তর ডেটাসেট এবং মডেলে সম্প্রসারণ
গভীর শেখার একীকরণ: সম্পূর্ণ গভীর নিউরাল নেটওয়ার্ক প্রশিক্ষণে ParBaLS সম্প্রসারণ কীভাবে করতে হয় তা গবেষণা করা
তাত্ত্বিক উন্নতি: আরও কঠোর তাত্ত্বিক বিশ্লেষণ এবং সংমিশ্রণ গ্যারান্টি প্রদান করা

গভীর মূল্যায়ন

শক্তি

তাত্ত্বিক অবদান: অ্যাক্টিভ লার্নিং অ্যালগরিদমের জন্য একটি একীভূত তাত্ত্বিক কাঠামো প্রদান করে, ব্যাখ্যাযোগ্যতা বৃদ্ধি করে
ব্যবহারিক মূল্য: ParBaLS ব্যবহারিক প্রয়োগে ব্যাচ নির্বাচন সমস্যা সমাধান করে
পর্যাপ্ত পরীক্ষা-নিরীক্ষা: একাধিক ডেটা ধরন এবং চ্যালেঞ্জিং সেটিং জুড়ে বিস্তৃত, ফলাফল প্রভাবশালী
পদ্ধতি উদ্ভাবন: ব্যাচ নির্মাণে ছদ্ম-লেবেলের প্রয়োগ নতুনত্ব রাখে

অপূর্ণতা

গণনামূলক ওভারহেড: m টি সমান্তরাল মডেলের রক্ষণাবেক্ষণ গণনামূলক খরচ বৃদ্ধি করে
তাত্ত্বিক কঠোরতা: কিছু প্রকাশনা (যেমন BAIT) অ-আনুষ্ঠানিক অনুমানের উপর নির্ভর করে
পরীক্ষামূলক সীমাবদ্ধতা: প্রধানত অপেক্ষাকৃত সহজ মডেলে (লজিস্টিক রিগ্রেশন) যাচাই করা
হাইপারপ্যারামিটার সংবেদনশীলতা: কর্মক্ষমতা এবং গণনার মধ্যে ভারসাম্যে m এর নির্বাচনের গভীর বিশ্লেষণ অপর্যাপ্ত

প্রভাব

তাত্ত্বিক প্রভাব: অ্যাক্টিভ লার্নিংয়ের জন্য নতুন তাত্ত্বিক দৃষ্টিভঙ্গি প্রদান করে, পরবর্তী গবেষণা অনুপ্রাণিত করতে পারে
ব্যবহারিক মূল্য: ParBaLS পদ্ধতি সরাসরি প্রয়োগ মূল্য রাখে, বিশেষত ব্যাচ লেবেলিং পরিস্থিতিতে
পুনরুৎপাদনযোগ্যতা: খোলা উৎস কোড প্রদান করে, পুনরুৎপাদন এবং সম্প্রসারণ সহজতর করে

প্রযোজ্য পরিস্থিতি

উচ্চ অনিশ্চয়তা কাজ: টেবিলার ডেটা এবং উপ-গোষ্ঠী স্থানান্তর যেখানে অপ্রতিরোধ্য অনিশ্চয়তা বিদ্যমান
ব্যাচ লেবেলিং চাহিদা: যেখানে পৃথক লেবেলিং নয় বরং বাল্ক লেবেলিং প্রয়োজন এমন ব্যবহারিক প্রয়োগ
বেইজিয়ান সেটিং: যেখানে বেইজিয়ান অনুমান পরিচালনা করা যায় এমন মডেল এবং কাজ

সংদর্ভ

এই পেপারটি অ্যাক্টিভ লার্নিং ক্ষেত্রের গুরুত্বপূর্ণ সাহিত্য উদ্ধৃত করে, যার মধ্যে রয়েছে:

ক্লাসিক অনিশ্চয়তা স্যাম্পলিং পদ্ধতি (লুইস, 1995)
বেইজিয়ান অ্যাক্টিভ লার্নিং পদ্ধতি (হাউলসবি এট আল., 2011; গ্যাল এট আল., 2017)
ব্যাচ অ্যাক্টিভ লার্নিং পদ্ধতি (কিরশ এট আল., 2019, 2023)
প্রত্যাশিত ত্রুটি হ্রাস পদ্ধতি (রয় এবং ম্যাককলাম, 2001; মাসম্যান এট আল., 2022)

সামগ্রিক মূল্যায়ন: এটি অ্যাক্টিভ লার্নিং ক্ষেত্রে উল্লেখযোগ্য তাত্ত্বিক এবং ব্যবহারিক মূল্য সহ একটি পেপার। MBDT এর মাধ্যমে বিদ্যমান অ্যালগরিদম একীভূত করে এবং ব্যাচ নির্বাচন সমস্যা সমাধানের জন্য ParBaLS প্রস্তাব করে, এটি এই ক্ষেত্রে নতুন গবেষণা দিকনির্দেশনা প্রদান করে। যদিও গণনামূলক দক্ষতা এবং তাত্ত্বিক কঠোরতার ক্ষেত্রে উন্নতির অবকাশ রয়েছে, তবে এর অবদান উল্লেখযোগ্য।