Can Large Language Models Improve SE Active Learning via Warm-Starts?
Senthilkumar, Menzies
When SE data is scarce, "active learners" use models learned from tiny samples of the data to find the next most informative example to label. In this way, effective models can be generated using very little data. For multi-objective software engineering (SE) tasks, active learning can benefit from an effective set of initial guesses (also known as "warm starts"). This paper explores the use of Large Language Models (LLMs) for creating warm-starts. Those results are compared against Gaussian Process Models and Tree of Parzen Estimators. For 49 SE tasks, LLM-generated warm starts significantly improved the performance of low- and medium-dimensional tasks. However, LLM effectiveness diminishes in high-dimensional problems, where Bayesian methods like Gaussian Process Models perform best.
소프트웨어 공학(SE) 데이터가 부족할 때, "능동 학습기"는 소수의 데이터 샘플에서 학습한 모델을 사용하여 주석을 달 다음의 가장 정보량이 많은 예제를 찾습니다. 이러한 방식으로 매우 적은 데이터로 효과적인 모델을 생성할 수 있습니다. 다중 목표 소프트웨어 공학 작업의 경우, 능동 학습은 효과적인 초기 추측 집합("따뜻한 시작"이라고도 함)에서 이점을 얻을 수 있습니다. 본 논문은 대규모 언어 모델(LLMs)을 사용하여 따뜻한 시작을 생성하고 그 결과를 가우스 프로세스 모델 및 Parzen 추정기 트리와 비교하는 것을 탐색합니다. 49개의 SE 작업에서 LLM이 생성한 따뜻한 시작은 저차원 및 중차원 작업의 성능을 크게 개선했습니다. 그러나 LLM의 고차원 문제에서의 효과는 감소하며, 이 경우 가우스 프로세스 모델과 같은 베이지안 방법이 최고의 성능을 발휘합니다.