Software Defect Prediction using Autoencoder Transformer Model
Barma, Hariharan, Arvapalli
An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.
academic
ऑटोएनकोडर ट्रांसफॉर्मर मॉडल का उपयोग करके सॉफ्टवेयर दोष भविष्यवाणी
यह पेपर दोषों की भविष्यवाणी करके सॉफ्टवेयर गुणवत्ता मूल्यांकन को बढ़ाने के लिए एक AI-ML आधारित गुणवत्ता इंजीनियरिंग पद्धति प्रस्तावित करता है। शोरगुल वाले डेटा, डेटा असंतुलन, पैटर्न पहचान, विशेषता निष्कर्षण और सामान्यीकरण में मौजूदा ML मॉडल की कठिनाइयों को संबोधित करने के लिए, अनुकूली विभेदक विकास (ADE) आधारित क्वांटम भिन्नात्मक ऑटोएनकोडर-ट्रांसफॉर्मर (QVAET) मॉडल (ADE-QVAET) विकसित किया गया है। यह मॉडल ADE अनुकूलन और QVAET आर्किटेक्चर को जोड़ता है, उच्च-आयामी अव्यक्त विशेषताओं को प्राप्त करता है और अनुक्रम निर्भरता को बनाए रखता है, जिससे दोष भविष्यवाणी सटीकता में सुधार होता है। 90% प्रशिक्षण अनुपात पर, ADE-QVAET ने 98.08% सटीकता, 92.45% परिशुद्धता, 94.67% रिकॉल और 98.12% F1 स्कोर प्राप्त किया है।
सॉफ्टवेयर परीक्षण की उच्च लागत: एंटरप्राइज़ वातावरण में सॉफ्टवेयर परीक्षण जटिल डेटा और व्यावसायिक आवश्यकताओं की चुनौतियों का सामना करता है, गुणवत्ता इंजीनियरों को मैनुअल परीक्षण निष्पादन के लिए 30-40% समय व्यतीत करना पड़ता है
अपर्याप्त दोष निवारण: पारंपरिक परीक्षण विधियां विकास के बाद त्रुटियों की खोज पर निर्भर करती हैं, जो पहले से रोके जा सकने वाली संभावित विफलताओं को नजरअंदाज करती हैं
अपर्याप्त मॉडल सटीकता: मौजूदा AI-ML तकनीकें दोषों की भविष्यवाणी में 80% से कम सटीकता प्रदान करती हैं
ज्ञान अलगाववाद: ऐतिहासिक परीक्षण ज्ञान व्यक्तिगत विशेषज्ञता तक सीमित है, संगठनात्मक संपत्ति नहीं
क्लाउड कंप्यूटिंग, माइक्रोसर्विसेज़, IoT और AI कार्यान्वयन जैसी जटिल एंटरप्राइज़ प्रणालियों में, जटिल व्यावसायिक तर्क और तकनीकी निर्भरताएं घातीय जटिलता बनाती हैं, पारंपरिक विधियां भ्रम, अपर्याप्त संदर्भ पीढ़ी, पुनर्प्राप्ति प्रक्रिया में महत्वपूर्ण व्यावसायिक संबंधों की हानि जैसी सीमाओं का सामना करती हैं।
ADE-QVAET मॉडल प्रस्तावित करना: पहली बार अनुकूली विभेदक विकास, क्वांटम भिन्नात्मक ऑटोएनकोडर और ट्रांसफॉर्मर आर्किटेक्चर को एक एकीकृत ढांचे में एकीकृत करना
ANRA प्रीप्रोसेसिंग फ्रेमवर्क विकसित करना: अनुकूली शोर में कमी और डेटा वृद्धि फ्रेमवर्क, डेटा गुणवत्ता और वर्ग संतुलन में सुधार
गतिशील हाइपरपैरामीटर अनुकूलन लागू करना: ADE एल्गोरिदम उम्मीदवार समाधानों के विकास प्रदर्शन के आधार पर स्केलिंग कारक और क्रॉसओवर दर को गतिशील रूप से समायोजित करता है
महत्वपूर्ण प्रदर्शन सुधार प्राप्त करना: पारंपरिक DE मॉडल की तुलना में, सटीकता में 7.73% सुधार, परिशुद्धता में 18.63% सुधार
इनपुट: सॉफ्टवेयर दोष भविष्यवाणी डेटासेट, जिसमें स्थिर कोड विशेषताएं, रखरखाव सूचकांक, चक्रीय जटिलता, कोड की पंक्तियां, कोड चर्न विशेषताएं आदि शामिल हैं
आउटपुट: बाइनरी वर्गीकरण परिणाम (दोषपूर्ण मॉड्यूल/गैर-दोषपूर्ण मॉड्यूल)
उद्देश्य: दोष भविष्यवाणी की सटीकता, परिशुद्धता, रिकॉल और F1 स्कोर को अधिकतम करना
पारंपरिक VAE की तुलना में, QVAE क्वांटम कंप्यूटिंग सिद्धांतों का उपयोग करके अधिक समृद्ध उच्च-आयामी अव्यक्त विशेषताओं को निकालता है, जो शास्त्रीय विधियों द्वारा पहचाने जाने वाले जटिल पैटर्न को पकड़ सकता है।
डेटा स्रोत: Kaggle सॉफ्टवेयर दोष भविष्यवाणी डेटासेट
विशेषताएं: कोड की पंक्तियां (LOC), चक्रीय जटिलता, विरासत वृक्ष की गहराई (DIT), वस्तुओं के बीच युग्मन (CBO) आदि संरचनात्मक तत्व
लेबल: बाइनरी वर्गीकरण (दोष=1, गैर-दोष=0)
चुनौती: वर्ग असंतुलन समस्या, दोषपूर्ण मॉड्यूल कम आवृत्ति में होते हैं
यह पेपर 21 संबंधित संदर्भों का हवाला देता है, मुख्य रूप से शामिल हैं:
सॉफ्टवेयर दोष भविष्यवाणी की मशीन लर्निंग विधियां
सॉफ्टवेयर इंजीनियरिंग में विकासवादी एल्गोरिदम का अनुप्रयोग
क्वांटम मशीन लर्निंग संबंधित तकनीकें
कोड विश्लेषण में गहन शिक्षण का अनुप्रयोग
समग्र मूल्यांकन: यह तकनीकी नवाचार के साथ एक मजबूत पेपर है, जो सॉफ्टवेयर दोष भविष्यवाणी समस्या के लिए कई अत्याधुनिक तकनीकों को सफलतापूर्वक एकीकृत करता है। हालांकि सैद्धांतिक विश्लेषण और सत्यापन पूर्णता में सुधार की गुंजाइश है, इसका व्यावहारिक मूल्य और प्रदर्शन सुधार दोनों बहुत महत्वपूर्ण हैं, सॉफ्टवेयर गुणवत्ता इंजीनियरिंग में AI के अनुप्रयोग को आगे बढ़ाने में महत्वपूर्ण महत्व है।