2025-11-18T04:28:13.955272

Software Defect Prediction using Autoencoder Transformer Model

Barma, Hariharan, Arvapalli

An AI-ML-powered quality engineering approach uses AI-ML to enhance software quality assessments by predicting defects. Existing ML models struggle with noisy data types, imbalances, pattern recognition, feature extraction, and generalization. To address these challenges, we develop a new model, Adaptive Differential Evolution (ADE) based Quantum Variational Autoencoder-Transformer (QVAET) Model (ADE-QVAET). ADE combines with QVAET to obtain high-dimensional latent features and maintain sequential dependencies, resulting in enhanced defect prediction accuracy. ADE optimization enhances model convergence and predictive performance. ADE-QVAET integrates AI-ML techniques such as tuning hyperparameters for scalable and accurate software defect prediction, representing an AI-ML-driven technology for quality engineering. During training with a 90% training percentage, ADE-QVAET achieves high accuracy, precision, recall, and F1-score of 98.08%, 92.45%, 94.67%, and 98.12%, respectively, when compared to the Differential Evolution (DE) ML model.

academic

자동인코더 트랜스포머 모델을 이용한 소프트웨어 결함 예측

기본 정보

논문 ID: 2510.10840
제목: 적응형 차분 진화 기반 양자 변분 자동인코더-트랜스포머(ADE-QVAET) 모델을 이용한 소프트웨어 결함 예측
저자: Seshu Babu Barma, Mohanakrishnan Hariharan, Satish Arvapalli (Apple Inc.)
분류: cs.SE cs.AI
발표 시간/학회: 2024년 프리프린트
논문 링크: https://arxiv.org/abs/2510.10840

초록

본 논문은 결함 예측을 통해 소프트웨어 품질 평가를 강화하는 AI-ML 기반 품질 엔지니어링 방법을 제안한다. 기존 ML 모델이 노이즈 데이터, 데이터 불균형, 패턴 인식, 특징 추출 및 일반화 측면에서 겪는 어려움을 해결하기 위해 적응형 차분 진화(ADE) 기반의 양자 변분 자동인코더-트랜스포머(QVAET) 모델(ADE-QVAET)을 개발했다. 본 모델은 ADE 최적화와 QVAET 아키텍처를 결합하여 고차원 잠재 특징을 획득하고 시퀀스 의존성을 유지함으로써 결함 예측 정확도를 향상시킨다. 90% 훈련 비율에서 ADE-QVAET은 98.08%의 정확도, 92.45%의 정밀도, 94.67%의 재현율, 98.12%의 F1 점수를 달성했다.

연구 배경 및 동기

문제 정의

소프트웨어 테스트 비용 증가: 기업 환경의 소프트웨어 테스트는 복잡한 데이터와 비즈니스 요구사항의 도전에 직면하며, 품질 엔지니어는 수동 테스트 실행에 30-40%의 시간을 소비
결함 예방 부족: 전통적 테스트 방법은 개발 완료 후 오류 발견에 의존하며, 더 조기에 예방할 수 있는 잠재적 결함을 간과
모델 정확도 부족: 기존 AI-ML 기술의 결함 예측 정확도가 80% 미만
지식 고립: 과거 테스트 지식이 개인 전문성에 국한되어 조직 자산으로 활용되지 못함

연구의 중요성

클라우드 컴퓨팅, 마이크로서비스, IoT 및 AI 구현 등 복잡한 엔터프라이즈 시스템에서 복잡한 비즈니스 로직과 기술적 의존성은 지수적 복잡성을 야기하며, 전통적 방법은 환각, 불충분한 컨텍스트 생성, 검색 과정에서의 핵심 비즈니스 관계 손실 등의 한계에 직면

기존 방법의 한계

데이터 품질 문제: 정제되지 않은 데이터는 중복 정보를 포함하여 예측 모델 정확도에 영향
과적합 경향: 심층 학습 모델은 제한적이거나 노이즈가 있는 데이터에서 과적합되기 쉬움
블랙박스 특성: 해석 가능성 부족으로 품질 엔지니어의 신뢰 획득 어려움
계산 자원 요구: 훈련 및 추론에 많은 계산 자원 필요
통합 어려움: 기존 소프트웨어 개발 플랫폼과의 통합 부족

핵심 기여

ADE-QVAET 모델 제안: 적응형 차분 진화, 양자 변분 자동인코더, 트랜스포머 아키텍처를 단일 프레임워크에 통합한 최초 시도
ANRA 전처리 프레임워크 개발: 적응형 노이즈 감소 및 데이터 증강 프레임워크로 데이터 품질 및 클래스 균형 개선
동적 하이퍼파라미터 최적화 구현: ADE 알고리즘이 후보 해의 진화 성능에 따라 스케일링 인수 및 교차율을 동적으로 조정
현저한 성능 향상 달성: 기존 DE 모델 대비 정확도 7.73% 향상, 정밀도 18.63% 향상

방법론 상세 설명

작업 정의

입력: 정적 코드 속성, 유지보수성 지수, 순환 복잡도, 코드 라인 수, 코드 이탈 특징 등을 포함한 소프트웨어 결함 예측 데이터셋 출력: 이진 분류 결과(결함 모듈/비결함 모듈) 목표: 결함 예측의 정확도, 정밀도, 재현율 및 F1 점수 최대화

모델 아키텍처

1. 데이터 전처리 - ANRA 프레임워크

입력 데이터셋: D = {x₁, x₂, ..., xₙ}
전처리된 데이터: D' = ANRA(D)

ANRA 프레임워크는 노이즈 감소, 중복 정보 제거 및 합성 데이터 생성을 통해 결함 및 비결함 인스턴스의 균형을 맞춤.

2. 양자 변분 자동인코더(QVAE)

잠재 특징 추출: Z = QVAE(D')

QVAE는 입력 데이터에서 고차원 잠재 특징을 추출하여 복잡한 다차원 패턴을 식별.

3. 트랜스포머 아키텍처

시퀀스 처리: T = Transformer(Z)

트랜스포머는 잠재 특징을 처리하여 소프트웨어 지표 간의 시퀀스 의존성 및 컨텍스트 관계를 식별.

4. 예측 계층

최종 예측: P = PredictionLayer(T)

기술 혁신 포인트

1. 양자 강화 특징 추출

기존 VAE와 비교하여 QVAE는 양자 컴퓨팅 원리를 활용하여 더욱 풍부한 고차원 잠재 특징을 추출하며, 고전적 방법이 식별하기 어려운 복잡한 패턴을 포착할 수 있음.

2. 적응형 차분 진화 최적화

변이 연산: v_{i,g+1} = x_{r1,g} + F × (x_{r2,g} - x_{r3,g})
교차 연산: u_{j,i,g+1} = {v_{j,i,g+1} if rand(0,1) ≤ CR, x_{j,i,g} otherwise}
선택 연산: x_{i,g+1} = u_{i,g+1} if f(u_{i,g+1}) ≤ f(x_{i,g})

ADE는 모집단 진화에 따라 F(스케일링 인수)와 CR(교차율)을 동적으로 조정하여 탐색과 활용의 균형을 실현.

3. 엔드-투-엔드 최적화

목적 함수: θ* = argmin f(θ), 여기서 θ는 학습률, 정규화 계수, 계층 수 등 핵심 하이퍼파라미터 포함.

실험 설정

데이터셋

데이터 출처: Kaggle 소프트웨어 결함 예측 데이터셋 특징: 코드 라인 수(LOC), 순환 복잡도, 상속 트리 깊이(DIT), 객체 간 결합도(CBO) 등 구조적 요소 레이블: 이진 분류(결함=1, 비결함=0) 도전 과제: 클래스 불균형 문제, 결함 모듈의 낮은 출현 빈도

평가 지표

정확도(Accuracy): 올바르게 예측된 비율
정밀도(Precision): 결함으로 예측된 것 중 실제 결함의 비율
재현율(Recall): 실제 결함 중 올바르게 식별된 비율
F1 점수: 정밀도와 재현율의 조화 평균

비교 방법

SVM (Support Vector Machine)
DT (Decision Tree)
RF (Random Forest)
LR (Logistic Regression)
QVA (Quantum Variational Autoencoder)
DE (Differential Evolution)

구현 세부사항

훈련 비율: 90%
테스트 에포크: 100, 200, 300, 400, 500 에포크
최적화 목표: 정확도, 정밀도, 재현율 및 F1 점수 최대화

실험 결과

주요 결과

다양한 에포크에서의 성능

90% 훈련 비율에서 ADE-QVAET은 500 에포크에서 최고 성능 달성:

정확도: 98.67%
정밀도: 98.67%
재현율: 93.34%
F1 점수: 98.56%

기준 방법과의 비교

기존 DE 모델 대비 90% 훈련 비율에서 ADE-QVAET의 개선:

정확도 향상: 7.73% (98.08% 달성)
정밀도 향상: 18.63% (92.45% 달성)
재현율 향상: 4.34% (94.67% 달성)
F1 점수 향상: 15.63% (98.12% 달성)

절제 실험

논문은 QVA와 완전한 ADE-QVAET 모델을 비교하여 각 구성 요소의 기여도를 검증:

QVAE 구성 요소: 고차원 특징 추출 능력 제공
트랜스포머 구성 요소: 시퀀스 의존성 모델링 강화
ADE 최적화: 수렴성 및 예측 성능 현저히 개선

실험 발견

수렴성 개선: ADE 동적 조정 전략이 모델 수렴을 현저히 가속화
노이즈 견고성: ANRA 전처리가 노이즈 데이터에 대한 모델의 견고성을 효과적으로 향상
일반화 능력: 모델이 다양한 소프트웨어 프로젝트 간에 우수한 일반화 성능 시연

결론 및 논의

주요 결론

기술적 돌파: ADE-QVAET이 양자 컴퓨팅, 심층 학습 및 진화 알고리즘의 장점을 성공적으로 통합
우수한 성능: 여러 지표에서 기존 방법을 현저히 초과
실용적 가치: AI 기반 품질 엔지니어링을 위한 확장 가능한 솔루션 제공

한계

계산 복잡도: 양자 변분 자동인코더 및 트랜스포머 아키텍처는 여전히 상당한 계산 자원 필요
데이터 의존성: 모델 성능이 고품질 전처리 데이터에 크게 의존
해석 가능성: 심층 학습 모델로서 여전히 블랙박스 특성 존재
일반화 검증: 더 많은 다양한 유형의 소프트웨어 프로젝트에서 일반화 능력 검증 필요

향후 방향

강화 학습 통합: 심층 학습과 강화 학습을 결합하여 소프트웨어 문제 예방
실시간 통합: 버전 관리 시스템 및 CI/CD 파이프라인과의 실시간 통합
해석 가능성 개선: 더욱 해석 가능한 AI 기반 테스트 도구 개발
엣지 컴퓨팅 최적화: 자원 제약 환경을 위한 모델 압축 및 최적화

심층 평가

장점

방법론의 혁신성 강함: 양자 컴퓨팅, 변분 자동인코더, 트랜스포머 및 적응형 진화 알고리즘을 최초로 통합
실험 설계 완벽함: 다중 에포크, 다중 기준선의 포괄적 비교 실험
성능 향상 현저함: 모든 핵심 지표에서 명백한 개선
실제 응용 가치: Apple의 산업계 연구로 실제 배포 가능성 보유

부족한 점

이론적 분석 부족: 양자 강화 효과에 대한 이론적 설명 부재
데이터셋 단일성: 단일 Kaggle 데이터셋에서만 검증되어 일반화성 미검증
계산 비용 분석 누락: 훈련 시간 및 계산 자원 소비 비교 미제공
재현성 문제: 양자 컴퓨팅 부분의 구현 세부사항 설명 부족

영향력

학술적 기여: 소프트웨어 공학과 AI 교차 분야에 새로운 관점 제공
산업적 가치: 기업 소프트웨어 품질 관리에 직접 적용 가능
기술 진전: 소프트웨어 공학에서 양자 기계 학습 응용 추진

적용 시나리오

대규모 기업 소프트웨어 개발: 복잡한 엔터프라이즈 시스템의 품질 관리에 적합
CI/CD 통합: 지속적 통합/지속적 배포 파이프라인에 통합 가능
실시간 품질 모니터링: 소프트웨어 개발 과정 중 실시간 결함 예측 지원
다중 프로젝트 관리: 여러 병렬 소프트웨어 프로젝트의 품질 관리에 적용

참고 문헌

본 논문은 21편의 관련 문헌을 인용하며, 주요 내용은 다음을 포함:

소프트웨어 결함 예측의 기계 학습 방법
소프트웨어 공학에서의 진화 알고리즘 응용
양자 기계 학습 관련 기술
코드 분석에서의 심층 학습 응용

종합 평가: 본 논문은 기술 혁신성이 우수한 논문으로, 다양한 최첨단 기술을 소프트웨어 결함 예측 문제에 성공적으로 통합했다. 이론적 분석 및 검증 완전성 측면에서 개선 여지가 있지만, 실용적 가치와 성능 향상이 모두 현저하며, AI의 소프트웨어 품질 엔지니어링 응용 추진에 중요한 의미를 갖는다.