Myopic Bayesian Decision Theory for Batch Active Learning with Partial Batch Label Sampling
Hu, Mussmann
Over the past couple of decades, many active learning acquisition functions have been proposed, leaving practitioners with an unclear choice of which to use. Bayesian Decision Theory (BDT) offers a universal principle to guide decision-making. In this work, we derive BDT for (Bayesian) active learning in the myopic framework, where we imagine we only have one more point to label. This derivation leads to effective algorithms such as Expected Error Reduction (EER), Expected Predictive Information Gain (EPIG), and other algorithms that appear in the literature. Furthermore, we show that BAIT (active learning based on V-optimal experimental design) can be derived from BDT and asymptotic approximations. A key challenge of such methods is the difficult scaling to large batch sizes, leading to either computational challenges (BatchBALD) or dramatic performance drops (top-$B$ selection). Here, using a particular formulation of the decision process, we derive Partial Batch Label Sampling (ParBaLS) for the EPIG algorithm. We show experimentally for several datasets that ParBaLS EPIG gives superior performance for a fixed budget and Bayesian Logistic Regression on Neural Embeddings. Our code is available at https://github.com/ADDAPT-ML/ParBaLS.
지난 수십 년간 많은 능동학습 획득 함수가 제안되었으나, 실무자들은 적절한 방법을 선택하기 어려워하고 있습니다. 베이지안 의사결정 이론(BDT)은 의사결정을 지도하는 일반적인 원칙을 제공합니다. 본 논문은 근시적 프레임워크 하에서 (베이지안) 능동학습을 위한 BDT를 도출하며, 단 하나의 추가 데이터 포인트만 레이블링하면 된다고 가정합니다. 이 도출은 기댓값 오류 감소(EER), 기댓값 예측 정보 이득(EPIG) 등의 효과적인 알고리즘을 생성합니다. 또한 저자들은 BAIT가 BDT와 점근 근사를 통해 도출될 수 있음을 증명합니다. 이러한 방법들의 핵심 과제는 대규모 배치로 확장하기 어렵다는 점으로, 계산 문제(BatchBALD) 또는 성능 급격한 저하(상위-B 선택)를 초래합니다. 본 논문은 특정 의사결정 과정 표현을 통해 EPIG 알고리즘을 위한 부분 배치 레이블 샘플링(ParBaLS) 방법을 도출합니다. 실험 결과는 고정 예산 및 신경 임베딩 상의 베이지안 로지스틱 회귀 설정에서 ParBaLS EPIG가 여러 데이터셋에서 우수한 성능을 보임을 나타냅니다.
베이지안 능동학습 방법 (Houlsby et al., 2011; Gal et al., 2017)
배치 능동학습 방법 (Kirsch et al., 2019, 2023)
기댓값 오류 감소 방법 (Roy and McCallum, 2001; Mussmann et al., 2022)
종합 평가: 이는 능동학습 분야에서 중요한 이론적 및 실용적 가치를 가진 논문입니다. MBDT를 통해 기존 알고리즘을 통일하고 배치 선택 문제를 해결하기 위해 ParBaLS를 제안함으로써 해당 분야에 새로운 연구 방향을 제공합니다. 계산 효율성 및 이론적 엄밀성 측면에서 개선의 여지가 있지만, 그 기여는 상당합니다.