论文研究 基于最近最远邻和互信息的特征选择方法.pdf

上传:houguof 浏览: 18 推荐: 0 文件:PDF 大小:1.4MB 上传时间:2020-07-21 17:19:14 版权申诉
随着数据量的增加,特征选择已经成为机器学习和数据挖掘领域的研究热点,提出一种基于最近最远邻的特征选择算法。一个数据点与其最近的邻点属于同一集群,与最远的邻点属于不同的集群,通过计算最近最远邻的特征距离可以得到一种判断特征重要性的指标;在此基础上运用互信息方法去除了特征之间的冗余;同时引入了Gradient boosting方法进行模型参数调优,提高了分类准确性。在UCI数据集上进行分类预测,结果表明该算法能够找到较优的特征子集,分类准确性得到一定提升。
上传资源
用户评论