Software Defect Prediction using Autoencoder Transformer Model
Barma, Hariharan, Arvapalli
An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.
academic
Softwarefehlvorhersage mit Autoencoder-Transformer-Modell
Dieser Artikel präsentiert eine auf AI-ML basierende Methode der Qualitätssicherung, die die Softwarequalitätsbewertung durch Fehlervorhersage verbessert. Um die Schwierigkeiten bestehender ML-Modelle bei der Verarbeitung verrauschter Daten, Datenunausgeglichenheit, Mustererkennung, Merkmalsextraktion und Verallgemeinerung zu überwinden, wurde ein auf adaptiver Differentialevolution (ADE) basierendes Quantum Variational Autoencoder-Transformer (QVAET)-Modell (ADE-QVAET) entwickelt. Das Modell kombiniert ADE-Optimierung und QVAET-Architektur, um hochdimensionale latente Merkmale zu erfassen und Sequenzabhängigkeiten beizubehalten, wodurch die Genauigkeit der Fehlervorhersage verbessert wird. Bei einem Trainingsverhältnis von 90% erreichte ADE-QVAET eine Genauigkeit von 98,08%, Präzision von 92,45%, Recall von 94,67% und F1-Score von 98,12%.
Hohe Softwaretestkosten: Softwaretests in Unternehmensumgebungen sehen sich mit komplexen Daten und Geschäftsanforderungen konfrontiert, wobei Qualitätsingenieure 30-40% ihrer Zeit für manuelle Testausführung aufwenden
Unzureichende Fehlerprävention: Traditionelle Testmethoden verlassen sich darauf, Fehler nach der Entwicklung zu entdecken, und übersehen potenzielle Ausfallstellen, die früher verhindert werden könnten
Unzureichende Modellgenauigkeit: Bestehende AI-ML-Technologien erreichen eine Fehlervorhersagegenauigkeit unter 80%
Isoliertes Wissen: Historisches Testwissen ist auf persönliches Fachwissen beschränkt und wird nicht als Organisationsvermögen genutzt
In komplexen Unternehmensystemen wie Cloud Computing, Microservices, IoT und AI-Implementierungen schaffen komplexe Geschäftslogik und technologische Abhängigkeiten exponentielle Komplexität, mit der traditionelle Methoden aufgrund von Halluzinationen, unzureichender Kontextgenerierung und Verlust kritischer Geschäftsbeziehungen bei Abrufprozessen nicht umgehen können.
Vorschlag des ADE-QVAET-Modells: Erstmalige Vereinigung von adaptiver Differentialevolution, Quantum Variational Autoencoder und Transformer-Architektur in einem einzigen Framework
Entwicklung des ANRA-Vorverarbeitungsrahmens: Adaptiver Rauschreduktions- und Datenerweiterungsrahmen zur Verbesserung der Datenqualität und Klassenausgeglichenheit
Implementierung dynamischer Hyperparameter-Optimierung: Der ADE-Algorithmus passt Skalierungsfaktor und Crossover-Rate dynamisch basierend auf der Evolutionsleistung von Kandidatenlösungen an
Erreichung signifikanter Leistungssteigerung: 7,73% Genauigkeitssteigerung und 18,63% Präzisionssteigerung im Vergleich zu traditionellen DE-Modellen
Eingabedatensatz: D = {x₁, x₂, ..., xₙ}
Vorverarbeitete Daten: D' = ANRA(D)
Das ANRA-Framework balanciert fehlerhafte und fehlerfreie Instanzen durch Rauschreduktion, Entfernung redundanter Informationen und Generierung synthetischer Daten.
Im Vergleich zu traditionellen VAEs nutzt QVAE Quantencomputerprinzipien zur Extraktion reichhaltigerer hochdimensionaler latenter Merkmale und kann komplexe Muster erfassen, die klassische Methoden schwer erkennen können.
Mutationsoperation: v_{i,g+1} = x_{r1,g} + F × (x_{r2,g} - x_{r3,g})
Crossover-Operation: u_{j,i,g+1} = {v_{j,i,g+1} if rand(0,1) ≤ CR, x_{j,i,g} otherwise}
Auswahloperation: x_{i,g+1} = u_{i,g+1} if f(u_{i,g+1}) ≤ f(x_{i,g})
ADE passt F (Skalierungsfaktor) und CR (Crossover-Rate) dynamisch basierend auf der Populationsentwicklung an und erreicht ein Gleichgewicht zwischen Exploration und Exploitation.
Traditionelle Machine-Learning-Methoden: Khalid et al. verwenden K-Means-Clustering zur Verbesserung der Fehlervorhersage, aber mit hohem Rechenaufwand
Evolutionäre Algorithmus-Optimierung: Tang et al. schlagen AVSSA-Algorithmus zur Behandlung unausgeglichener Daten vor, aber mit hoher Integrationskomplexität
Deep-Learning-Methoden: Khleel et al. kombinieren CNN und GRU, erfordern aber große Mengen an Daten und synthetischer Datengenerierung
Merkmalsauswahlverfahren: Mehmood et al. entwickeln auf Merkmalsauswahl basierende ML-Methoden, aber mit Risiko von Informationsverlust
Das Papier zitiert 21 relevante Referenzen, hauptsächlich umfassend:
Machine-Learning-Methoden zur Softwarefehlvorhersage
Anwendung evolutionärer Algorithmen in der Softwaretechnik
Quantum-Machine-Learning-Technologien
Deep Learning in der Codeanalyse
Gesamtbewertung: Dies ist ein Papier mit starker technischer Innovation, das erfolgreich mehrere Spitzentechnologien in einem einheitlichen Framework für das Softwarefehlvorhersageproblem integriert. Obwohl es noch Raum für Verbesserungen in theoretischer Analyse und Validierungsvollständigkeit gibt, sind sein praktischer Wert und die Leistungssteigerung sehr signifikant und haben wichtige Bedeutung für die Förderung der AI-Anwendung in der Softwarequalitätssicherung.