view in publisher's site
- خانه
- لیست مقالات
- چکیده
Software Defect Prediction Based on Selected Features Using Neural Network and Decision Tree
Software defect prediction is a vital part in software reliability field. Here, the software modules are identified as defective or non-defective based on selection of the right set of software metrics. Software quality has become an emerging area for researchers to deal with challenges like defect prediction, defect removal, bug severity etc. The objective of this paper is to apply Machine Learning techniques for feature selection to remove redundant metrics and build software defect prediction model to label the software modules. We use principal component analysis technique as feature selection technique to reduce the redundant features on basis of Eigen value. After identifying the best set of software metrics, we develop software defect prediction models to classify software modules using Artificial Neural Network (ANN) and Decision Tree (DT). We have worked on data sets collected from data repository available on GitHub. The best set of software metrics act as predictors, which are obtained after removing irrelevant software metrics and building model for software defect prediction. We also compare the two classifying techniques on the basis of F-score, AUC, precision and sensitivity and accuracy.
دفاع از نرمافزار پیشبینی براساس ویژگیهای انتخابشده با استفاده از شبکه عصبی و درخت تصمیمگیری
پیشبینی نقص نرمافزار بخش مهمی از حوزه قابلیت اطمینان نرمافزار است.
در اینجا، ماژولهای نرمافزاری به صورت ناقص یا غیر معیوب براساس انتخاب مجموعه درست از معیارهای نرمافزاری شناسایی میشوند.
کیفیت نرمافزار به یک حوزه در حال ظهور برای محققان تبدیل شدهاست تا با چالشهایی مانند پیشبینی نقص، حذف نقص، شدت اشکال و غیره مقابله کنند. هدف این مقاله استفاده از تکنیکهای یادگیری ماشینی برای انتخاب ویژگی برای حذف معیارهای اضافی و ساخت مدل پیشبینی نقص نرمافزار برای برچسب زدن به ماژولهای نرمافزار است.
ما از تکنیک تحلیل مولفههای اصلی به عنوان تکنیک انتخاب ویژگی برای کاهش ویژگیهای اضافی براساس مقدار ویژه استفاده میکنیم.
پس از شناسایی بهترین مجموعه از معیارهای نرمافزاری، ما مدلهای پیشبینی نقص نرمافزاری را توسعه میدهیم تا ماژولهای نرمافزاری را با استفاده از شبکه عصبی مصنوعی (ANN)و درخت تصمیمگیری (DT)طبقهبندی کنیم.
ما بر روی مجموعه دادههای جمعآوریشده از مخزن داده موجود در GitHub کار کردهایم.
بهترین مجموعه از معیارهای نرمافزاری به عنوان پیشگوییکنندهها عمل میکنند، که پس از حذف معیارهای نرمافزار نامربوط و ساخت مدل برای پیشبینی نقص نرمافزار به دست میآیند.
همچنین دو تکنیک طبقهبندی را براساس F - score، AUC، دقت و حساسیت و دقت مقایسه میکنیم.
ترجمه شده با 