MalCL: Leveraging GAN-Based Generative Replay to Combat Catastrophic Forgetting in Malware Classification
Park, Ji, Park et al.
Continual Learning (CL) for malware classification tackles the rapidly evolving nature of malware threats and the frequent emergence of new types. Generative Replay (GR)-based CL systems utilize a generative model to produce synthetic versions of past data, which are then combined with new data to retrain the primary model. Traditional machine learning techniques in this domain often struggle with catastrophic forgetting, where a model's performance on old data degrades over time.
In this paper, we introduce a GR-based CL system that employs Generative Adversarial Networks (GANs) with feature matching loss to generate high-quality malware samples. Additionally, we implement innovative selection schemes for replay samples based on the model's hidden representations.
Our comprehensive evaluation across Windows and Android malware datasets in a class-incremental learning scenario -- where new classes are introduced continuously over multiple tasks -- demonstrates substantial performance improvements over previous methods. For example, our system achieves an average accuracy of 55% on Windows malware samples, significantly outperforming other GR-based models by 28%. This study provides practical insights for advancing GR-based malware classification systems. The implementation is available at \url {https://github.com/MalwareReplayGAN/MalCL}\footnote{The code will be made public upon the presentation of the paper}.
academic
MalCL: Использование генеративного воспроизведения на основе GAN для борьбы с катастрофическим забыванием при классификации вредоносного ПО
В данной работе предлагается система MalCL для решения проблемы непрерывного обучения при классификации вредоносного ПО. Система использует метод генеративного воспроизведения на основе генеративно-состязательных сетей (GAN) с потерей согласования признаков для генерации высококачественных образцов вредоносного ПО и реализует инновационный механизм выбора образцов на основе скрытых представлений модели. В сценариях пошагового обучения по классам на наборах данных вредоносного ПО для Windows и Android система демонстрирует значительное улучшение производительности, достигая средней точности 55% на образцах вредоносного ПО для Windows, что на 28% выше, чем у других моделей, основанных на генеративном воспроизведении.
Основной вызов при классификации вредоносного ПО — это явление катастрофического забывания (Catastrophic Forgetting). Когда модель машинного обучения продолжает обучаться на новых данных, её производительность на старых данных значительно снижается. Это особенно критично в области вредоносного ПО, поскольку:
Быстрая эволюция вредоносного ПО: Институт AV-TEST регистрирует 450 тысяч новых образцов вредоносного ПО и потенциально нежелательных программ (PUA) ежедневно
VirusTotal обрабатывает более 1 миллиона отправок программ в день
Дилемма антивирусных компаний: либо удалять старые образцы (рискуя возвращением старого вредоноса), либо игнорировать новые образцы (упуская новые угрозы)
В статье определён конкретный сценарий угрозы: злоумышленник использует устаревшее вредоносное ПО для обхода системы машинного обучения, обновлённой только на новых данных. По мере увеличения временного разрыва между исходным обучением и атакой вероятность успешного обхода возрастает.
Традиционные методы машинного обучения: неэффективны при борьбе с катастрофическим забыванием
Методы непрерывного обучения из компьютерного зрения: плохо применяются к классификации вредоносного ПО, производительность даже ниже базовой линии "None"
Ограничения хранилища: хранение исторических данных ограничено нормативно-правовыми актами о конфиденциальности
Модель непрерывного обучения, специализированная для области вредоносного ПО: предложена система MalCL, достигающая средней точности 55% на 11 задачах непрерывного обучения с 100 семействами вредоносного ПО, что на 28% выше существующих методов
Улучшенное генеративное воспроизведение с согласованием признаков: использование генератора GAN в сочетании с потерей согласования признаков (Feature Matching Loss) для снижения различий между исходными и синтетическими образцами
Инновационный механизм выбора образцов для воспроизведения: разработка множественных стратегий выбора на основе признаков промежуточных слоёв классификатора для повышения согласованности синтетических образцов с исходными данными
Стратегическое построение набора задач: исследование стратегии назначения больших категорий начальным задачам для эффективного смягчения катастрофического забывания
LG = 1/m ∑(i=1 to m) ||Ex~pdata[D(f)(x)] - Ez~pz[D(f)(G(z))]||
где D(f)(·) обозначает выход промежуточного слоя дискриминатора. Эта функция потерь сосредоточена на более богатых промежуточных признаках, а не на финальном выходе.
В статье цитируются важные работы в областях непрерывного обучения, обнаружения вредоносного ПО и генеративно-состязательных сетей, включая:
Shin et al. (2017): Continual learning with deep generative replay
Rahman, Coull, and Wright (2022): Первое исследование непрерывного обучения при классификации вредоносного ПО
Anderson and Roth (2018): Набор данных EMBER
Arp et al. (2014): Метод извлечения признаков Drebin
Общая оценка: В данной работе предложено инновационное решение проблемы катастрофического забывания при классификации вредоносного ПО. Исследование достаточно полно в плане технических методов и экспериментальной проверки. Хотя есть пространство для улучшения производительности, работа вносит значительный вклад в исследования и практическое применение в этой области.