Software Defect Prediction using Autoencoder Transformer Model
Barma, Hariharan, Arvapalli
An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.
academic
التنبؤ بعيوب البرمجيات باستخدام نموذج محول الترميز التلقائي
تقترح هذه الورقة منهجية هندسة الجودة القائمة على الذكاء الاصطناعي والتعلم الآلي لتعزيز تقييم جودة البرمجيات من خلال التنبؤ بالعيوب. لمعالجة الصعوبات التي تواجهها نماذج التعلم الآلي الحالية في التعامل مع البيانات الضوضائية وعدم التوازن وتعرّف الأنماط واستخراج الميزات والتعميم، تم تطوير نموذج محول الترميز التلقائي الكمي المتغير (QVAET) القائم على التطور الفارقي التكيفي (ADE) (ADE-QVAET). يجمع النموذج بين تحسين ADE وبنية QVAET للحصول على ميزات كامنة عالية الأبعاد مع الحفاظ على التبعيات التسلسلية، مما يعزز دقة التنبؤ بالعيوب. عند نسبة تدريب 90%، حقق ADE-QVAET دقة 98.08% وضبط 92.45% واستدعاء 94.67% ودرجة F1 بنسبة 98.12%.
تكاليف الاختبار العالية: يواجه اختبار البرمجيات في بيئات المؤسسات تحديات البيانات المعقدة والمتطلبات التجارية، حيث يقضي مهندسو الجودة 30-40% من وقتهم في تنفيذ الاختبارات اليدوية
عدم كفاية الوقاية من العيوب: تعتمد طرق الاختبار التقليدية على اكتشاف الأخطاء بعد انتهاء التطوير، متجاهلة الأعطال المحتملة التي يمكن منعها في وقت أبكر
عدم كفاية دقة النموذج: تحقق تقنيات الذكاء الاصطناعي والتعلم الآلي الحالية دقة أقل من 80% في التنبؤ بالعيوب
عزلة المعرفة: تقتصر المعرفة التاريخية بالاختبار على الخبرة الفردية بدلاً من أن تكون أصلاً تنظيمياً
في الأنظمة المؤسسية المعقدة مثل الحوسبة السحابية والخدمات الدقيقة وإنترنت الأشياء وتطبيقات الذكاء الاصطناعي، تخلق المنطق التجاري المعقد والتبعيات التقنية تعقيداً أسياً، مما يواجه الطرق التقليدية قيوداً مثل الهلوسة وعدم كفاية توليد السياق وفقدان العلاقات التجارية الحرجة أثناء عملية الاسترجاع.
الإدخال: مجموعة بيانات التنبؤ بعيوب البرمجيات، تحتوي على خصائص الكود الثابتة ومؤشرات الصيانة والتعقيد الدوري وعدد أسطر الكود وميزات تدفق الكود
الإخراج: نتيجة التصنيف الثنائي (وحدة معيبة/وحدة غير معيبة)
الهدف: تعظيم دقة واستدعاء وضبط ودرجة F1 للتنبؤ بالعيوب
بالمقارنة مع VAE التقليدي، يستفيد QVAE من مبادئ الحوسبة الكمية لاستخراج ميزات كامنة عالية الأبعاد أكثر ثراءً، مما يمكنه من التقاط الأنماط المعقدة التي يصعب على الطرق الكلاسيكية تحديدها.
مصدر البيانات: مجموعة بيانات Kaggle للتنبؤ بعيوب البرمجيات
الميزات: عدد أسطر الكود (LOC)، التعقيد الدوري، عمق شجرة الوراثة (DIT)، الاقتران بين الكائنات (CBO) وغيرها من العناصر الهيكلية
التسميات: تصنيف ثنائي (معيب=1، غير معيب=0)
التحديات: مشكلة عدم التوازن في الفئات، حيث تظهر الوحدات المعيبة بتكرار أقل
تستشهد الورقة بـ 21 مرجعاً ذا صلة، تتضمن بشكل أساسي:
طرق التعلم الآلي للتنبؤ بعيوب البرمجيات
تطبيق الخوارزميات التطورية في هندسة البرمجيات
تقنيات التعلم الآلي الكمي ذات الصلة
تطبيق التعلم العميق في تحليل الأكواد
التقييم الشامل: هذه ورقة بحثية ذات ابتكار تقني قوي، حيث نجحت في دمج تقنيات متقدمة متعددة وتطبيقها على مشكلة التنبؤ بعيوب البرمجيات. على الرغم من وجود مجال للتحسين في التحليل النظري واكتمال التحقق، إلا أن قيمتها العملية وتحسينات الأداء كبيرة جداً، مما يحمل أهمية كبيرة لتعزيز تطبيق الذكاء الاصطناعي في هندسة جودة البرمجيات.