论文研究不均衡数据集上文本分类方法研究.pdf

上传:qq_31102354 浏览: 33 推荐: 0 文件:unkonw 大小:500kb 上传时间:2020-03-02 12:48:53 版权申诉
文本分类中数据集的不均衡问题是一个在实际应用中普遍存在的问题。从特征选择优化和分类器性能提升两方面出发,提出了一种组合的不均衡数据集文本分类方法。在特征选择方面,综合考虑特征项与类别的正负相关特性及类别区分强度对传统CHI统计特征选择方法予以改进。在数据层上,采用数据重取样方法对不均衡训练语料的不平衡性过滤减少其对分类性能的影响。实验结果表明该方法对不均衡数据集上文本可达到较好分类效果。
上传资源
用户评论