2025-11-18T04:28:13.955272

Software Defect Prediction using Autoencoder Transformer Model

Barma, Hariharan, Arvapalli

An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.

academic

Предсказание дефектов программного обеспечения с использованием модели Autoencoder Transformer

Основная информация

ID статьи: 2510.10840
Название: Software Defect Prediction using Adaptive Differential Evolution-based Quantum Variational Autoencoder-Transformer (ADE-QVAET) Model
Авторы: Seshu Babu Barma, Mohanakrishnan Hariharan, Satish Arvapalli (Apple Inc.)
Классификация: cs.SE cs.AI
Дата публикации/конференция: Препринт 2024 года
Ссылка на статью: https://arxiv.org/abs/2510.10840

Аннотация

В данной работе предложен метод инженерии качества на основе AI-ML, который повышает оценку качества программного обеспечения путём предсказания дефектов. Для решения проблем существующих моделей машинного обучения при работе с зашумленными данными, дисбалансом данных, распознаванием образов, извлечением признаков и обобщением разработана модель квантового вариационного автокодировщика-Transformer (QVAET) на основе адаптивной дифференциальной эволюции (ADE) — модель ADE-QVAET. Данная модель объединяет оптимизацию ADE и архитектуру QVAET для захвата высокомерных скрытых признаков и сохранения последовательных зависимостей, что повышает точность предсказания дефектов. При соотношении обучения 90% модель ADE-QVAET достигла точности 98,08%, полноты 92,45%, чувствительности 94,67% и F1-оценки 98,12%.

Исследовательский контекст и мотивация

Определение проблемы

Высокая стоимость тестирования программного обеспечения: Тестирование ПО в корпоративной среде сталкивается с проблемами сложных данных и бизнес-требований, инженеры качества тратят 30-40% времени на ручное выполнение тестов
Недостаточная профилактика дефектов: Традиционные методы тестирования полагаются на обнаружение ошибок после завершения разработки, игнорируя потенциальные сбои, которые можно предотвратить раньше
Недостаточная точность моделей: Существующие технологии AI-ML предсказывают дефекты с точностью ниже 80%
Изолированные знания: Исторические знания о тестировании ограничены индивидуальным опытом, а не являются организационным активом

Значимость исследования

В сложных корпоративных системах, таких как облачные вычисления, микросервисы, IoT и реализация AI, сложная бизнес-логика и технологические зависимости создают экспоненциальную сложность, с которой традиционные методы сталкиваются с ограничениями, включая галлюцинации, недостаточное контекстное генерирование и потерю критических бизнес-отношений в процессе поиска.

Ограничения существующих методов

Проблемы качества данных: Неочищенные данные содержат избыточную информацию, влияющую на точность прогностических моделей
Склонность к переобучению: Модели глубокого обучения легко переобучаются на ограниченных или зашумленных данных
Чёрный ящик: Отсутствие интерпретируемости затрудняет доверие инженеров качества
Требования к вычислительным ресурсам: Обучение и вывод требуют значительных вычислительных ресурсов
Сложность интеграции: Недостаточная интеграция с существующими платформами разработки программного обеспечения

Основные вклады

Предложена модель ADE-QVAET: Впервые объединены адаптивная дифференциальная эволюция, квантовый вариационный автокодировщик и архитектура Transformer в единую структуру
Разработана структура предварительной обработки ANRA: Структура адаптивного снижения шума и расширения данных, улучшающая качество данных и баланс классов
Реализована динамическая оптимизация гиперпараметров: Алгоритм ADE динамически настраивает коэффициент масштабирования и коэффициент кроссовера на основе эволюционной производительности кандидатов
Достигнуто значительное повышение производительности: Точность повышена на 7,73%, полнота повышена на 18,63% по сравнению с традиционной моделью DE

Подробное описание методологии

Определение задачи

Входные данные: Набор данных для предсказания дефектов ПО, содержащий статические атрибуты кода, индекс поддерживаемости, циклическую сложность, количество строк кода, характеристики текучести кода и т.д. Выходные данные: Результат бинарной классификации (модуль с дефектом/модуль без дефекта) Цель: Максимизировать точность, полноту, чувствительность и F1-оценку предсказания дефектов

Архитектура модели

1. Предварительная обработка данных — структура ANRA

Входной набор данных: D = {x₁, x₂, ..., xₙ}
Предварительно обработанные данные: D' = ANRA(D)

Структура ANRA балансирует экземпляры с дефектами и без дефектов путём снижения шума, удаления избыточной информации и генерирования синтетических данных.

2. Квантовый вариационный автокодировщик (QVAE)

Извлечение скрытых признаков: Z = QVAE(D')

QVAE извлекает высокомерные скрытые признаки из входных данных, выявляя сложные многомерные образы.

3. Архитектура Transformer

Обработка последовательности: T = Transformer(Z)

Transformer обрабатывает скрытые признаки, выявляя последовательные зависимости и контекстные отношения между метриками программного обеспечения.

4. Слой предсказания

Финальное предсказание: P = PredictionLayer(T)

Технические инновации

1. Квантово-усиленное извлечение признаков

По сравнению с традиционным VAE, QVAE использует принципы квантовых вычислений для извлечения более богатых высокомерных скрытых признаков, способных захватывать сложные образы, которые трудно выявить классическими методами.

2. Оптимизация адаптивной дифференциальной эволюции

Операция мутации: v_{i,g+1} = x_{r1,g} + F × (x_{r2,g} - x_{r3,g})
Операция кроссовера: u_{j,i,g+1} = {v_{j,i,g+1} if rand(0,1) ≤ CR, x_{j,i,g} otherwise}
Операция отбора: x_{i,g+1} = u_{i,g+1} if f(u_{i,g+1}) ≤ f(x_{i,g})

ADE динамически настраивает F (коэффициент масштабирования) и CR (коэффициент кроссовера) на основе эволюции популяции, достигая баланса между исследованием и использованием.

3. Сквозная оптимизация

Целевая функция: θ* = argmin f(θ), где θ включает ключевые гиперпараметры, такие как скорость обучения, коэффициент регуляризации, количество слоёв и т.д.

Экспериментальная установка

Наборы данных

Источник данных: Набор данных Kaggle для предсказания дефектов программного обеспечения Признаки: Количество строк кода (LOC), циклическая сложность, глубина дерева наследования (DIT), связанность между объектами (CBO) и другие структурные элементы Метки: Бинарная классификация (дефект=1, без дефекта=0) Вызовы: Проблема дисбаланса классов, низкая частота появления модулей с дефектами

Метрики оценки

Точность (Accuracy): Доля правильно предсказанных результатов
Полнота (Precision): Доля действительных дефектов среди предсказанных дефектов
Чувствительность (Recall): Доля правильно выявленных дефектов среди всех действительных дефектов
F1-оценка: Гармоническое среднее полноты и чувствительности

Методы сравнения

SVM (Support Vector Machine)
DT (Decision Tree)
RF (Random Forest)
LR (Logistic Regression)
QVA (Quantum Variational Autoencoder)
DE (Differential Evolution)

Детали реализации

Соотношение обучения: 90%
Количество эпох тестирования: 100, 200, 300, 400, 500
Цели оптимизации: Максимизация точности, полноты, чувствительности и F1-оценки

Результаты экспериментов

Основные результаты

Производительность при различном количестве эпох

При соотношении обучения 90% модель ADE-QVAET достигла оптимальной производительности при 500 эпохах:

Точность: 98,67%
Полнота: 98,67%
Чувствительность: 93,34%
F1-оценка: 98,56%

Сравнение с базовыми методами

Улучшения модели ADE-QVAET по сравнению с традиционной моделью DE при соотношении обучения 90%:

Повышение точности: 7,73% (достигнуто 98,08%)
Повышение полноты: 18,63% (достигнуто 92,45%)
Повышение чувствительности: 4,34% (достигнуто 94,67%)
Повышение F1-оценки: 15,63% (достигнуто 98,12%)

Абляционные исследования

Статья проверяет вклад каждого компонента путём сравнения моделей QVA и полной модели ADE-QVAET:

Компонент QVAE: Обеспечивает возможность извлечения высокомерных признаков
Компонент Transformer: Улучшает моделирование последовательных зависимостей
Оптимизация ADE: Значительно улучшает сходимость и производительность предсказания

Экспериментальные выводы

Улучшение сходимости: Стратегия динамической настройки ADE значительно ускоряет сходимость модели
Робастность к шуму: Предварительная обработка ANRA эффективно повышает робастность модели к зашумленным данным
Способность к обобщению: Модель демонстрирует хорошую способность к обобщению между различными программными проектами

Связанные работы

Основные направления исследований

Традиционные методы машинного обучения: Khalid и др. использовали кластеризацию K-means для улучшения предсказания дефектов, но с большими вычислительными затратами
Оптимизация эволюционными алгоритмами: Tang и др. предложили алгоритм AVSSA для работы с дисбалансированными данными, но с высокой сложностью интеграции
Методы глубокого обучения: Khleel и др. объединили CNN и GRU, требующие значительных вычислений и генерирования синтетических данных
Методы отбора признаков: Mehmood и др. разработали методы ML на основе отбора признаков, но с риском потери информации

Преимущества данной работы

По сравнению с существующими работами, ADE-QVAET решает следующие проблемы через единую структуру:

Проблемы вычислительной сложности
Обработка зашумленных и дисбалансированных данных
Способность к обобщению для развивающихся программных проектов

Заключение и обсуждение

Основные выводы

Технологический прорыв: ADE-QVAET успешно интегрирует преимущества квантовых вычислений, глубокого обучения и эволюционных алгоритмов
Превосходная производительность: Значительно превосходит существующие методы по нескольким метрикам
Практическая ценность: Обеспечивает масштабируемое решение для инженерии качества, управляемой AI

Ограничения

Вычислительная сложность: Квантовый вариационный автокодировщик и архитектура Transformer по-прежнему требуют значительных вычислительных ресурсов
Зависимость от данных: Производительность модели в высокой степени зависит от высококачественной предварительной обработки данных
Интерпретируемость: Как модель глубокого обучения, сохраняет характеристики чёрного ящика
Проверка обобщения: Требуется проверка способности к обобщению на более широком спектре различных типов программных проектов

Направления будущих исследований

Интеграция обучения с подкреплением: Объединение глубокого обучения и обучения с подкреплением для профилактики программных проблем
Интеграция в реальном времени: Интеграция в реальном времени с системами контроля версий и конвейерами CI/CD
Улучшение интерпретируемости: Разработка более интерпретируемых инструментов тестирования, управляемых AI
Оптимизация для граничных вычислений: Сжатие моделей и оптимизация для сред с ограниченными ресурсами

Углубленная оценка

Преимущества

Высокая инновационность методологии: Впервые объединены квантовые вычисления, вариационный автокодировщик, Transformer и адаптивный эволюционный алгоритм
Полный экспериментальный дизайн: Комплексные сравнительные эксперименты с несколькими эпохами и базовыми методами
Значительное повышение производительности: Явное улучшение по всем ключевым метрикам
Практическая прикладная ценность: Исследование из промышленности (Apple) с потенциалом практического развёртывания

Недостатки

Недостаточный теоретический анализ: Отсутствует теоретическое объяснение эффектов квантового усиления
Единственный набор данных: Проверка только на одном наборе данных Kaggle, способность к обобщению требует проверки
Отсутствует анализ вычислительных затрат: Не предоставлено сравнение времени обучения и потребления вычислительных ресурсов
Проблемы воспроизводимости: Недостаточно подробное описание деталей реализации квантовой части

Влияние

Академический вклад: Предоставляет новые идеи для пересечения программной инженерии и AI
Промышленная ценность: Может быть непосредственно применена к управлению качеством программного обеспечения в корпорациях
Технологический прогресс: Способствует применению квантового машинного обучения в программной инженерии

Применимые сценарии

Разработка крупного корпоративного ПО: Подходит для управления качеством сложных корпоративных систем
Интеграция CI/CD: Может быть интегрирована в конвейеры непрерывной интеграции/непрерывного развёртывания
Мониторинг качества в реальном времени: Поддерживает предсказание дефектов в реальном времени в процессе разработки ПО
Управление многопроектной разработкой: Подходит для управления качеством нескольких параллельных программных проектов

Библиография

Статья ссылается на 21 соответствующий источник, включая:

Методы машинного обучения для предсказания дефектов ПО
Применение эволюционных алгоритмов в программной инженерии
Технологии квантового машинного обучения
Применение глубокого обучения в анализе кода

Общая оценка: Это статья с высокой технологической инновационностью, которая успешно интегрирует несколько передовых технологий для решения проблемы предсказания дефектов программного обеспечения. Хотя в теоретическом анализе и полноте проверки есть место для улучшения, её практическая ценность и повышение производительности весьма значительны, что имеет важное значение для продвижения применения AI в инженерии качества программного обеспечения.