从不平衡数据中学习以预测软件缺陷的数量

上传:rongq08731 浏览: 11 推荐: 0 文件:PDF 大小:457.88KB 上传时间:2021-05-03 05:06:14 版权申诉
在测试资源有限的情况下,预测软件模块中的缺陷数量可能会更有帮助。 目标变量值(即缺陷数量)的高度不平衡分布会降低用于预测缺陷数量的模型的性能。 作为深入研究的第一步,本文探索了使用重采样技术和集成学习技术从不平衡的缺陷数据中学习以预测缺陷数量的潜力。 我们研究了两种用于回归问题的扩展重采样策略(即SMOTE和RUS)和集成学习技术(即AdaBoost.R2算法)的使用,以处理不平衡的缺陷数据以预测缺陷的数量。 我们将SMOTE和RUS的扩展用于分别将缺陷数预测为SmoteND和RusND。 在具有两种性能指标的6个数据集上的实验结果表明,这些方法对于处理不平衡的缺陷数据是有效的。 为了进一步提高这些方法的性能,我们提出了两种新颖的混合重采样/增强算法,称为SmoteNDBoost和RusNDBoost,它们分别将SmoteND和RusND引入AdaBoost.R2算法。 实验结果表明,SmoteNDBoost和RusNDBoost的性能均优于各自的组件(即SmoteND,RusND和AdaBoost.R2)。
上传资源
用户评论
相关推荐
论文研究基于不平衡数据软件缺陷预测.pdf
为了解决数据的不平衡性这一问题,提出一种利用分布函数合成新样本的过抽样和随机向下抽样相结合的算法。算法对降维后的主成分进行分布函数拟合,然后利用分布函数生成随机数,并对生成的随机数进行筛选,最后与随机
PDF
869KB
2021-01-31 11:26
NASAMDP软件缺陷预测数据
1、NASAMDP数据集是软件缺陷预测使用的数据集;2、该数据集是向官方索取的,包含13个数据集文件,用于实验研究;3、数据集文件格式是arff格式。
ZIP
0B
2019-04-28 06:42
论文研究面向类不平衡数据软件缺陷预测模型.pdf
软件缺陷数据的类不平衡问题会影响缺陷预测分类的准确性,为解决类不平衡数据对预测分类的影响,针对如何优化数据预处理的算法执行顺序进行了研究,提出了一种有效提升分类效果的软件缺陷预测模型(ASRAdaBo
其他文档
0B
2019-08-01 23:22
从不平衡数据主动学习在线加权极限学习解决方案
从不平衡数据主动学习:在线加权极限学习机的解决方案
PDF
1.5MB
2021-05-03 05:06
基于迁移学习跨公司软件缺陷预测
为解决通常由公司内工程数据训练构建软件缺陷预测模型,而实际较缺乏本地缺陷数据的问题,借助迁移学习技术,提出使用不同公司工程数据构建缺陷预测模型的算法,实现跨公司软件缺陷预测。通过比较源工程训练数据和目
PDF
285KB
2021-04-19 18:50
软件缺陷预测综述
软件缺陷预测综述,张启航,武斌,软件缺陷预测是软件工程领域一个重要的问题,其结合人工智能方法对代码是否含有缺陷进行快速判断,提升了软件开发的效率和软件的
PDF
0B
2020-04-15 18:31
软件缺陷预测技术.pdf
软件已经成为影响国民经济、军事、政治乃至社会生活的重要因素.高可靠和复杂的软件系统非常依赖于其采用的软件的可靠性.软件的缺陷是导致相关系统出错、失效、崩溃甚至机毁人亡的潜在根源.例如,1996年6月,
PDF
0B
2019-04-08 07:38
性别预测为例谈谈数据挖掘分类问题
互联网的迅猛发展,催生了数据的爆炸式增长。面对海量的数据,如何挖掘数据的价值,成为一个越来越重要的问题。本文首先介绍数据挖掘的基本内容,然后按照数据挖掘基本的处理流程,以性别预测实例来讲解一个具体的数
PDF
350KB
2021-01-31 21:14
论文研究偏相关方法在软件缺陷预测应用.pdf
为了提高预测模型的性能,解决不同属性子集带来的分歧,提出了基本偏相关方法的预测模型。首先,该方法在公开数据集上分析出代码静态属性与缺陷数之间存在偏相关关系;然后基于偏相关系数值,计算出代码复杂性度密度
PDF
0B
2020-01-04 18:49
基于CS ANN软件缺陷预测模型研究
基于CS-ANN的软件缺陷预测模型研究
PDF
2.17MB
2021-03-28 12:37
基于ACO SVM软件缺陷预测模型研究
基于ACO-SVM的软件缺陷预测模型的研究
PDF
512KB
2021-04-07 15:30
最大化AUC学习加权朴素贝叶斯实现不平衡数据分类
不平衡的数据分类是许多实际应用程序中经常遇到的一个具有挑战性的问题.传统的分类算法通常旨在最大限度地提高整体准确性因此其有效性往往受到不平衡数据的阻碍.与其他传统分类器类似朴素贝叶斯NB有时由于对类分
pdf
2.87MB
2023-02-08 02:21
NASA CM1软件缺陷预测数据集及应用建议
NASA CM1软件缺陷预测数据集是探索软件缺陷预测领域的重要数据集,该数据集的基本信息和应用建议。首先,建议采用高级需求跟踪到低级需求的方式来提高预测准确率。其次,基于需求构建目标模型可以进一步提高
zip
143.97KB
2023-05-10 01:30
论文研究使用监督机器学习和集成技术软件缺陷预测比较研究
软件开发的基本目标是提前发现并修复在各种情况下可能出现的缺陷。 许多软件开发活动是由个人执行的,这可能会导致开发过程中发生不同的软件错误,从而在不久的将来引起失望。 因此,在第一阶段对软件缺陷的预测已
PDF
1.94MB
2020-07-30 23:06
软件缺陷软件缺陷
软件缺陷软件缺陷软件缺陷
RAR
0B
2020-04-15 18:31