2025-11-18T04:28:13.955272

Software Defect Prediction using Autoencoder Transformer Model

Barma, Hariharan, Arvapalli
An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.
academic

Software Defect Prediction using Autoencoder Transformer Model

基本信息

  • 论文ID: 2510.10840
  • 标题: Software Defect Prediction using Adaptive Differential Evolution-based Quantum Variational Autoencoder-Transformer (ADE-QVAET) Model
  • 作者: Seshu Babu Barma, Mohanakrishnan Hariharan, Satish Arvapalli (Apple Inc.)
  • 分类: cs.SE cs.AI
  • 发表时间/会议: 2024年预印本
  • 论文链接: https://arxiv.org/abs/2510.10840

摘要

本文提出了一种基于AI-ML的质量工程方法,通过预测缺陷来增强软件质量评估。针对现有ML模型在处理噪声数据、数据不平衡、模式识别、特征提取和泛化方面的困难,开发了基于自适应差分进化(ADE)的量子变分自编码器-Transformer(QVAET)模型(ADE-QVAET)。该模型结合ADE优化和QVAET架构,获取高维潜在特征并保持序列依赖性,从而提升缺陷预测准确性。在90%训练比例下,ADE-QVAET达到了98.08%的准确率、92.45%的精确率、94.67%的召回率和98.12%的F1分数。

研究背景与动机

问题定义

  1. 软件测试成本高昂: 企业环境中的软件测试面临复杂数据和业务需求的挑战,质量工程师需要花费30-40%的时间进行手工测试执行
  2. 缺陷预防不足: 传统测试方法依赖于开发结束后发现错误,忽略了可以更早预防的潜在故障
  3. 模型准确性不足: 现有AI-ML技术预测缺陷的准确性低于80%
  4. 知识孤立: 历史测试知识局限于个人专业知识,而非组织资产

研究重要性

在云计算、微服务、IoT和AI实现等复杂企业系统中,复杂的业务逻辑和技术依赖性创造了指数级复杂性,传统方法面临幻觉、上下文生成不足、检索过程中关键业务关系丢失等限制。

现有方法局限性

  • 数据质量问题: 未清理的数据包含冗余信息,影响预测模型准确性
  • 过拟合倾向: 深度学习模型在有限或噪声数据上容易过拟合
  • 黑盒特性: 缺乏可解释性,质量工程师难以信任
  • 计算资源需求: 训练和推理需要大量计算资源
  • 集成困难: 与现有软件开发平台集成不足

核心贡献

  1. 提出ADE-QVAET模型: 首次将自适应差分进化、量子变分自编码器和Transformer架构统一到单一框架中
  2. 开发ANRA预处理框架: 自适应噪声减少和数据增强框架,改善数据质量和类别平衡
  3. 实现动态超参数优化: ADE算法根据候选解的演化性能动态调整缩放因子和交叉率
  4. 达成显著性能提升: 相比传统DE模型,准确率提升7.73%,精确率提升18.63%

方法详解

任务定义

输入: 软件缺陷预测数据集,包含静态代码属性、可维护性指数、圈复杂度、代码行数、代码流失特征等 输出: 二分类结果(缺陷模块/非缺陷模块) 目标: 最大化缺陷预测的准确性、精确率、召回率和F1分数

模型架构

1. 数据预处理 - ANRA框架

输入数据集: D = {x₁, x₂, ..., xₙ}
预处理后数据: D' = ANRA(D)

ANRA框架通过噪声减少、冗余信息清除和合成数据生成来平衡缺陷和非缺陷实例。

2. 量子变分自编码器(QVAE)

潜在特征提取: Z = QVAE(D')

QVAE从输入数据中提取高维潜在特征,识别复杂的多维模式。

3. Transformer架构

序列处理: T = Transformer(Z)

Transformer处理潜在特征,识别软件指标之间的序列依赖性和上下文关系。

4. 预测层

最终预测: P = PredictionLayer(T)

技术创新点

1. 量子增强特征提取

相比传统VAE,QVAE利用量子计算原理提取更丰富的高维潜在特征,能够捕获经典方法难以识别的复杂模式。

2. 自适应差分进化优化

变异操作: v_{i,g+1} = x_{r1,g} + F × (x_{r2,g} - x_{r3,g})
交叉操作: u_{j,i,g+1} = {v_{j,i,g+1} if rand(0,1) ≤ CR, x_{j,i,g} otherwise}
选择操作: x_{i,g+1} = u_{i,g+1} if f(u_{i,g+1}) ≤ f(x_{i,g})

ADE根据种群演化动态调整F(缩放因子)和CR(交叉率),实现探索和利用的平衡。

3. 端到端优化

目标函数: θ* = argmin f(θ),其中θ包括学习率、正则化系数、层数等关键超参数。

实验设置

数据集

数据来源: Kaggle软件缺陷预测数据集 特征: 代码行数(LOC)、圈复杂度、继承树深度(DIT)、对象间耦合(CBO)等结构元素 标签: 二分类(缺陷=1,非缺陷=0) 挑战: 类别不平衡问题,缺陷模块出现频率较低

评价指标

  • 准确率(Accuracy): 正确预测的比例
  • 精确率(Precision): 预测为缺陷中真正缺陷的比例
  • 召回率(Recall): 实际缺陷中被正确识别的比例
  • F1分数: 精确率和召回率的调和平均

对比方法

  • SVM (Support Vector Machine)
  • DT (Decision Tree)
  • RF (Random Forest)
  • LR (Logistic Regression)
  • QVA (Quantum Variational Autoencoder)
  • DE (Differential Evolution)

实现细节

  • 训练比例: 90%
  • 测试轮次: 100, 200, 300, 400, 500 epochs
  • 优化目标: 最大化准确率、精确率、召回率和F1分数

实验结果

主要结果

不同轮次下的性能表现

在训练比例90%下,ADE-QVAET在500轮次时达到最佳性能:

  • 准确率: 98.67%
  • 精确率: 98.67%
  • 召回率: 93.34%
  • F1分数: 98.56%

与基线方法对比

相比传统DE模型,ADE-QVAET在训练比例90%下的改进:

  • 准确率提升: 7.73% (达到98.08%)
  • 精确率提升: 18.63% (达到92.45%)
  • 召回率提升: 4.34% (达到94.67%)
  • F1分数提升: 15.63% (达到98.12%)

消融实验

论文通过对比QVA和完整ADE-QVAET模型,验证了各组件的贡献:

  1. QVAE组件: 提供高维特征提取能力
  2. Transformer组件: 增强序列依赖性建模
  3. ADE优化: 显著改善收敛性和预测性能

实验发现

  1. 收敛性改善: ADE动态调整策略显著加快模型收敛
  2. 噪声鲁棒性: ANRA预处理有效提升模型对噪声数据的鲁棒性
  3. 泛化能力: 模型在不同软件项目间展现良好泛化性能

相关工作

主要研究方向

  1. 传统机器学习方法: Khalid等使用K-means聚类改善缺陷预测,但计算开销大
  2. 进化算法优化: Tang等提出AVSSA算法处理不平衡数据,但集成复杂度高
  3. 深度学习方法: Khleel等结合CNN和GRU,需要大量计算和合成数据生成
  4. 特征选择技术: Mehmood等开发基于特征选择的ML方法,但存在信息丢失风险

本文优势

相比现有工作,ADE-QVAET通过统一框架解决了:

  • 计算复杂性问题
  • 噪声和不平衡数据处理
  • 对演化软件项目的泛化能力

结论与讨论

主要结论

  1. 技术突破: ADE-QVAET成功整合量子计算、深度学习和进化算法优势
  2. 性能优越: 在多个指标上显著超越现有方法
  3. 实用价值: 为AI驱动的质量工程提供可扩展解决方案

局限性

  1. 计算复杂度: 量子变分自编码器和Transformer架构仍需要相当的计算资源
  2. 数据依赖: 模型性能高度依赖于高质量的预处理数据
  3. 可解释性: 作为深度学习模型,仍存在黑盒特性
  4. 泛化验证: 需要在更多不同类型的软件项目上验证泛化能力

未来方向

  1. 增强学习集成: 结合深度学习和强化学习预防软件问题
  2. 实时集成: 与版本控制系统和CI/CD管道的实时集成
  3. 可解释性改进: 开发更具可解释性的AI驱动测试工具
  4. 边缘计算优化: 针对资源受限环境的模型压缩和优化

深度评价

优点

  1. 方法创新性强: 首次将量子计算、变分自编码器、Transformer和自适应进化算法统一
  2. 实验设计完善: 多轮次、多基线的全面对比实验
  3. 性能提升显著: 在所有关键指标上都有明显改善
  4. 实际应用价值: 来自Apple的工业界研究,具有实际部署潜力

不足

  1. 理论分析不足: 缺乏对量子增强效果的理论解释
  2. 数据集单一: 仅在一个Kaggle数据集上验证,泛化性有待验证
  3. 计算成本分析缺失: 未提供训练时间和计算资源消耗对比
  4. 可复现性问题: 量子计算部分的实现细节描述不够详细

影响力

  1. 学术贡献: 为软件工程和AI交叉领域提供新思路
  2. 工业价值: 可直接应用于企业软件质量管理
  3. 技术推进: 推动量子机器学习在软件工程中的应用

适用场景

  1. 大型企业软件开发: 适用于复杂企业系统的质量管理
  2. CI/CD集成: 可集成到持续集成/持续部署流水线
  3. 实时质量监控: 支持软件开发过程中的实时缺陷预测
  4. 多项目管理: 适用于管理多个并行软件项目的质量

参考文献

本文引用了21篇相关文献,主要包括:

  • 软件缺陷预测的机器学习方法
  • 进化算法在软件工程中的应用
  • 量子机器学习相关技术
  • 深度学习在代码分析中的应用

总体评价: 这是一篇技术创新性较强的论文,成功将多种前沿技术整合应用于软件缺陷预测问题。虽然在理论分析和验证完整性方面还有改进空间,但其实用价值和性能提升都很显著,对推动AI在软件质量工程中的应用具有重要意义。