MalCL: Leveraging GAN-Based Generative Replay to Combat Catastrophic Forgetting in Malware Classification
Park, Ji, Park et al.
Continual Learning (CL) for malware classification tackles the rapidly evolving nature of malware threats and the frequent emergence of new types. Generative Replay (GR)-based CL systems utilize a generative model to produce synthetic versions of past data, which are then combined with new data to retrain the primary model. Traditional machine learning techniques in this domain often struggle with catastrophic forgetting, where a model's performance on old data degrades over time.
In this paper, we introduce a GR-based CL system that employs Generative Adversarial Networks (GANs) with feature matching loss to generate high-quality malware samples. Additionally, we implement innovative selection schemes for replay samples based on the model's hidden representations.
Our comprehensive evaluation across Windows and Android malware datasets in a class-incremental learning scenario -- where new classes are introduced continuously over multiple tasks -- demonstrates substantial performance improvements over previous methods. For example, our system achieves an average accuracy of 55% on Windows malware samples, significantly outperforming other GR-based models by 28%. This study provides practical insights for advancing GR-based malware classification systems. The implementation is available at \url {https://github.com/MalwareReplayGAN/MalCL}\footnote{The code will be made public upon the presentation of the paper}.
본 논문은 악성코드 분류의 지속적 학습 문제를 해결하기 위해 MalCL 시스템을 제안합니다. 본 시스템은 생성대립신경망(GAN) 기반의 생성 재생(Generative Replay) 방법을 채택하여 특징 매칭 손실을 통해 고품질의 악성코드 샘플을 생성하고, 모델 은닉층 표현 기반의 혁신적인 샘플 선택 메커니즘을 구현했습니다. Windows 및 Android 악성코드 데이터셋의 클래스 증분 학습 시나리오에서 본 시스템은 현저한 성능 향상을 보여주었으며, Windows 악성코드 샘플에서 55%의 평균 정확도를 달성하여 다른 생성 재생 기반 모델보다 28% 향상되었습니다.
악성코드 분류가 직면한 주요 과제는 재앙적 망각(Catastrophic Forgetting) 현상입니다. 머신러닝 모델이 새로운 데이터에 대해 지속적으로 훈련될 때, 기존 데이터에 대한 성능이 현저히 저하됩니다. 이는 악성코드 분야에서 특히 심각한데, 그 이유는 다음과 같습니다:
악성코드의 빠른 진화: AV-TEST 연구소는 매일 45만 개의 새로운 악성코드 및 잠재적 유해 프로그램(PUA) 기록
VirusTotal의 일일 처리량: 100만 개 이상의 소프트웨어 제출 처리
백신 회사의 딜레마: 기존 샘플 제거(구형 악성코드 재출현 위험) 또는 새 샘플 무시(신흥 위협 놓침)