2025-11-18T04:28:13.955272

Software Defect Prediction using Autoencoder Transformer Model

Barma, Hariharan, Arvapalli

An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.

academic

Previsione dei Difetti Software utilizzando il Modello Autoencoder Transformer

Informazioni Fondamentali

ID Articolo: 2510.10840
Titolo: Software Defect Prediction using Adaptive Differential Evolution-based Quantum Variational Autoencoder-Transformer (ADE-QVAET) Model
Autori: Seshu Babu Barma, Mohanakrishnan Hariharan, Satish Arvapalli (Apple Inc.)
Classificazione: cs.SE cs.AI
Data di Pubblicazione/Conferenza: Preprint 2024
Link Articolo: https://arxiv.org/abs/2510.10840

Riassunto

Questo articolo propone un metodo di ingegneria della qualità basato su AI-ML che migliora la valutazione della qualità del software attraverso la previsione dei difetti. Affrontando le difficoltà dei modelli ML esistenti nel gestire dati rumorosi, squilibrio dei dati, riconoscimento di pattern, estrazione di caratteristiche e generalizzazione, è stato sviluppato il modello Quantum Variational Autoencoder-Transformer (QVAET) basato su Adaptive Differential Evolution (ADE) (ADE-QVAET). Il modello combina l'ottimizzazione ADE e l'architettura QVAET per acquisire caratteristiche latenti ad alta dimensionalità mantenendo le dipendenze sequenziali, migliorando così l'accuratezza della previsione dei difetti. Con un rapporto di addestramento del 90%, ADE-QVAET ha raggiunto un'accuratezza del 98,08%, una precisione del 92,45%, un richiamo del 94,67% e un punteggio F1 del 98,12%.

Contesto di Ricerca e Motivazione

Definizione del Problema

Costi elevati dei test software: I test software negli ambienti aziendali affrontano sfide dovute a dati complessi e requisiti aziendali, con ingegneri della qualità che spendono il 30-40% del tempo in esecuzione manuale dei test
Prevenzione dei difetti insufficiente: I metodi di test tradizionali si basano sulla scoperta di errori dopo lo sviluppo, trascurando i potenziali guasti che potrebbero essere prevenuti più precocemente
Accuratezza del modello insufficiente: Le tecnologie AI-ML esistenti hanno un'accuratezza di previsione dei difetti inferiore all'80%
Isolamento della conoscenza: La conoscenza dei test storici è limitata all'expertise individuale, non rappresentando un asset organizzativo

Importanza della Ricerca

Nei sistemi aziendali complessi come il cloud computing, i microservizi, l'IoT e l'implementazione dell'AI, la logica aziendale complessa e le dipendenze tecnologiche creano una complessità esponenziale, con i metodi tradizionali che affrontano limitazioni come allucinazioni, generazione di contesto insufficiente e perdita di relazioni aziendali critiche durante il processo di recupero.

Limitazioni dei Metodi Esistenti

Problemi di qualità dei dati: I dati non puliti contengono informazioni ridondanti che influenzano l'accuratezza dei modelli predittivi
Tendenza all'overfitting: I modelli di deep learning tendono a fare overfitting su dati limitati o rumorosi
Caratteristica black-box: Mancanza di interpretabilità, rendendo difficile la fiducia degli ingegneri della qualità
Requisiti di risorse computazionali: L'addestramento e l'inferenza richiedono risorse computazionali significative
Difficoltà di integrazione: Integrazione insufficiente con le piattaforme di sviluppo software esistenti

Contributi Principali

Proposta del modello ADE-QVAET: Prima unificazione di adaptive differential evolution, quantum variational autoencoder e architettura Transformer in un singolo framework
Sviluppo del framework di preprocessing ANRA: Framework di riduzione adattiva del rumore e aumento dei dati che migliora la qualità dei dati e l'equilibrio delle classi
Implementazione dell'ottimizzazione dinamica degli iperparametri: L'algoritmo ADE regola dinamicamente il fattore di scala e il tasso di crossover in base alle prestazioni evolutive delle soluzioni candidate
Raggiungimento di miglioramenti significativi delle prestazioni: Accuratezza aumentata del 7,73%, precisione aumentata del 18,63% rispetto ai modelli DE tradizionali

Dettagli del Metodo

Definizione del Compito

Input: Dataset di previsione dei difetti software contenente attributi di codice statico, indice di manutenibilità, complessità ciclomatica, linee di codice, caratteristiche di flusso del codice, ecc. Output: Risultato di classificazione binaria (modulo difettoso/modulo non difettoso) Obiettivo: Massimizzare l'accuratezza, la precisione, il richiamo e il punteggio F1 della previsione dei difetti

Architettura del Modello

1. Preprocessing dei Dati - Framework ANRA

Dataset di input: D = {x₁, x₂, ..., xₙ}
Dati dopo preprocessing: D' = ANRA(D)

Il framework ANRA bilancia le istanze difettose e non difettose attraverso riduzione del rumore, eliminazione di informazioni ridondanti e generazione di dati sintetici.

2. Quantum Variational Autoencoder (QVAE)

Estrazione di caratteristiche latenti: Z = QVAE(D')

QVAE estrae caratteristiche latenti ad alta dimensionalità dai dati di input, identificando pattern multidimensionali complessi.

3. Architettura Transformer

Elaborazione sequenziale: T = Transformer(Z)

Il Transformer elabora le caratteristiche latenti, identificando le dipendenze sequenziali e le relazioni di contesto tra le metriche software.

4. Strato di Previsione

Previsione finale: P = PredictionLayer(T)

Punti di Innovazione Tecnica

1. Estrazione di Caratteristiche Potenziata da Quantum

Rispetto ai VAE tradizionali, QVAE sfrutta i principi del calcolo quantistico per estrarre caratteristiche latenti più ricche e ad alta dimensionalità, catturando pattern complessi difficili da identificare con metodi classici.

2. Ottimizzazione Adaptive Differential Evolution

Operazione di mutazione: v_{i,g+1} = x_{r1,g} + F × (x_{r2,g} - x_{r3,g})
Operazione di crossover: u_{j,i,g+1} = {v_{j,i,g+1} if rand(0,1) ≤ CR, x_{j,i,g} otherwise}
Operazione di selezione: x_{i,g+1} = u_{i,g+1} if f(u_{i,g+1}) ≤ f(x_{i,g})

ADE regola dinamicamente F (fattore di scala) e CR (tasso di crossover) in base all'evoluzione della popolazione, raggiungendo un equilibrio tra esplorazione e sfruttamento.

3. Ottimizzazione End-to-End

Funzione obiettivo: θ* = argmin f(θ), dove θ include iperparametri critici come tasso di apprendimento, coefficiente di regolarizzazione, numero di strati, ecc.

Configurazione Sperimentale

Dataset

Fonte dei dati: Dataset di previsione dei difetti software da Kaggle Caratteristiche: Linee di codice (LOC), complessità ciclomatica, profondità dell'albero di ereditarietà (DIT), accoppiamento tra oggetti (CBO) e altri elementi strutturali Etichette: Classificazione binaria (difetto=1, non difetto=0) Sfide: Problema di squilibrio delle classi, con frequenza inferiore dei moduli difettosi

Metriche di Valutazione

Accuratezza (Accuracy): Proporzione di previsioni corrette
Precisione (Precision): Proporzione di difetti reali tra quelli predetti come difettosi
Richiamo (Recall): Proporzione di difetti reali correttamente identificati
Punteggio F1: Media armonica di precisione e richiamo

Metodi di Confronto

SVM (Support Vector Machine)
DT (Decision Tree)
RF (Random Forest)
LR (Logistic Regression)
QVA (Quantum Variational Autoencoder)
DE (Differential Evolution)

Dettagli di Implementazione

Rapporto di addestramento: 90%
Cicli di test: 100, 200, 300, 400, 500 epoch
Obiettivi di ottimizzazione: Massimizzare accuratezza, precisione, richiamo e punteggio F1

Risultati Sperimentali

Risultati Principali

Prestazioni in Diversi Cicli

Con un rapporto di addestramento del 90%, ADE-QVAET raggiunge le migliori prestazioni a 500 cicli:

Accuratezza: 98,67%
Precisione: 98,67%
Richiamo: 93,34%
Punteggio F1: 98,56%

Confronto con Metodi Baseline

Miglioramenti di ADE-QVAET rispetto al modello DE tradizionale con rapporto di addestramento del 90%:

Aumento di accuratezza: 7,73% (raggiungendo 98,08%)
Aumento di precisione: 18,63% (raggiungendo 92,45%)
Aumento di richiamo: 4,34% (raggiungendo 94,67%)
Aumento di punteggio F1: 15,63% (raggiungendo 98,12%)

Esperimenti di Ablazione

L'articolo verifica il contributo di ogni componente confrontando i modelli QVA e ADE-QVAET completo:

Componente QVAE: Fornisce capacità di estrazione di caratteristiche ad alta dimensionalità
Componente Transformer: Migliora la modellazione delle dipendenze sequenziali
Ottimizzazione ADE: Migliora significativamente la convergenza e le prestazioni predittive

Scoperte Sperimentali

Miglioramento della convergenza: La strategia di regolazione dinamica di ADE accelera significativamente la convergenza del modello
Robustezza al rumore: Il preprocessing ANRA migliora efficacemente la robustezza del modello ai dati rumorosi
Capacità di generalizzazione: Il modello dimostra buone prestazioni di generalizzazione tra diversi progetti software

Lavori Correlati

Principali Direzioni di Ricerca

Metodi di machine learning tradizionali: Khalid et al. utilizzano il clustering K-means per migliorare la previsione dei difetti, ma con elevato overhead computazionale
Ottimizzazione con algoritmi evolutivi: Tang et al. propongono l'algoritmo AVSSA per gestire dati sbilanciati, ma con elevata complessità di integrazione
Metodi di deep learning: Khleel et al. combinano CNN e GRU, richiedendo grandi quantità di calcolo e generazione di dati sintetici
Tecniche di selezione delle caratteristiche: Mehmood et al. sviluppano metodi ML basati sulla selezione delle caratteristiche, ma con rischio di perdita di informazioni

Vantaggi di questo Articolo

Rispetto ai lavori esistenti, ADE-QVAET risolve attraverso un framework unificato:

Problemi di complessità computazionale
Gestione di dati rumorosi e sbilanciati
Capacità di generalizzazione su progetti software in evoluzione

Conclusioni e Discussione

Conclusioni Principali

Avanzamento tecnologico: ADE-QVAET integra con successo i vantaggi del calcolo quantistico, del deep learning e degli algoritmi evolutivi
Prestazioni superiori: Supera significativamente i metodi esistenti su più metriche
Valore pratico: Fornisce una soluzione scalabile per l'ingegneria della qualità guidata dall'AI

Limitazioni

Complessità computazionale: L'autoencoder variazionale quantistico e l'architettura Transformer richiedono ancora risorse computazionali considerevoli
Dipendenza dai dati: Le prestazioni del modello dipendono fortemente da dati di alta qualità dopo il preprocessing
Interpretabilità: Come modello di deep learning, presenta ancora caratteristiche di black-box
Verifica della generalizzazione: Necessita di validazione su più tipi diversi di progetti software

Direzioni Future

Integrazione dell'apprendimento per rinforzo: Combinare deep learning e reinforcement learning per prevenire problemi software
Integrazione in tempo reale: Integrazione in tempo reale con sistemi di controllo versione e pipeline CI/CD
Miglioramento dell'interpretabilità: Sviluppare strumenti di test guidati dall'AI più interpretabili
Ottimizzazione per l'edge computing: Compressione e ottimizzazione del modello per ambienti con risorse limitate

Valutazione Approfondita

Punti di Forza

Forte innovazione metodologica: Prima unificazione di calcolo quantistico, autoencoder variazionale, Transformer e algoritmo evolutivo adattivo
Progettazione sperimentale completa: Esperimenti di confronto completi con più cicli e più baseline
Miglioramenti significativi delle prestazioni: Miglioramenti evidenti su tutti gli indicatori chiave
Valore di applicazione pratica: Ricerca industriale da Apple con potenziale di implementazione reale

Carenze

Analisi teorica insufficiente: Mancanza di spiegazione teorica degli effetti del potenziamento quantistico
Dataset singolo: Validazione solo su un dataset Kaggle, con generalizzazione da verificare
Analisi dei costi computazionali mancante: Mancanza di confronto tra tempo di addestramento e consumo di risorse computazionali
Problemi di riproducibilità: Descrizione insufficiente dei dettagli di implementazione della parte di calcolo quantistico

Impatto

Contributo accademico: Fornisce nuove prospettive per il campo dell'intersezione tra ingegneria del software e AI
Valore industriale: Applicabile direttamente alla gestione della qualità del software aziendale
Avanzamento tecnologico: Promuove l'applicazione del machine learning quantistico nell'ingegneria del software

Scenari di Applicazione

Sviluppo software aziendale su larga scala: Adatto alla gestione della qualità di sistemi aziendali complessi
Integrazione CI/CD: Integrabile nelle pipeline di integrazione continua/distribuzione continua
Monitoraggio della qualità in tempo reale: Supporta la previsione dei difetti in tempo reale durante il processo di sviluppo software
Gestione di progetti multipli: Adatto alla gestione della qualità di più progetti software paralleli

Bibliografia

Questo articolo cita 21 riferimenti correlati, principalmente includenti:

Metodi di machine learning per la previsione dei difetti software
Applicazione di algoritmi evolutivi nell'ingegneria del software
Tecnologie di machine learning quantistico
Applicazione del deep learning nell'analisi del codice

Valutazione Complessiva: Questo è un articolo con forte innovazione tecnologica che integra con successo molteplici tecnologie all'avanguardia nel problema della previsione dei difetti software. Sebbene vi sia spazio per miglioramenti nell'analisi teorica e nella completezza della verifica, il suo valore pratico e i miglioramenti delle prestazioni sono molto significativi, con importanza notevole nel promuovere l'applicazione dell'AI nell'ingegneria della qualità del software.