文本分类算法改进

一种改进文本分类算法
文本分类技术是文本挖掘技术中的研究热点之一,但是传统KNN分类算法的时间复杂度高,在不均匀密度样本下分类准确率低。针对这些问题,提出一种在不均匀密度样本下的优化KNN算法:IKNN算法。首先选取样本分
PDF
1.1MB
2021-02-01 09:42
基于聚类改进的KNN 文本分类算法
传 统 的 KNN 文 本 分 类 算 法 是 一 种 无 监 督 的 、 无 参 数 的 、 简 单 的 、 较 流 行 的 且 容 易 实 现 的 分 类 算 法 。 但 是 KNN 算 法 在
PDF
0B
2018-12-09 19:17
文本分类算法
基于文本分类中特征提取的领域词语聚类 刘华 [摘要]本文以领域特征明显的词和短语作为聚类对象,在分类系统的大规模语料库中,利用文本分类的特征提取方法进行词语的领域聚类,从而获得大规模的领域知识,用于文
DOC
0B
2018-12-15 05:41
论文研究文本分类TFIDF算法改进研究.pdf
中国互联网环境的发展,让大量蕴含丰富信息的新词得以普及。而传统的特征词权重TF-IDF(TermFrequencyandInvertedDocumentFrequency)算法主要考虑TF和IDF两个
unkonw
0B
2020-03-02 12:48
论文研究用于文本分类改进KNN算法.pdf
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用tabu算法对此样
PDF
0B
2020-05-18 07:32
基于改进KNN算法的中文文本分类方法
介绍了中心向量算法和KNN算法两种分类方法。针对KNN分类方法在计算文本相似度时存在的不足,提出了改进方案。新方案引入了中心向量分类法的思想。通过实验,对改进的KNN算法、中心向量算法和传统的KNN算
PDF
434KB
2020-11-22 02:45
归并分类算法改进的归并分类算法和快速分类算法.zip
编程实现归并分类算法、改进的归并分类算法和快速分类算法代码,并能使用3000,5000,10000,30000,50000五种不同数据规模进行算法运算时间的对比分析。
ZIP
8.63MB
2020-08-20 23:50
K_近邻法的文本分类算法分析与改进
Analysis and Improvement of Text Classification Algorithm Based on K_Nearest Neighbor Method
PDF
0B
2019-06-22 04:54
K_近邻法的文本分类算法分析与改进
文本自动分类的相关技术是数据挖掘的一个分枝,K-近邻法是常用的文本分类算法之一。在研究K-近邻法的基础上,根据其使用情况分析了K-近邻法的不足之处,在满足一定的判定函数前提下,提出改进后的K-近邻法。
PDF
0B
2019-06-04 06:58
论文研究文本分类改进TFIDF加权算法研究.pdf
文本分类中改进TF-IDF加权算法研究,刘俊荣,,特征加权是文本分类重要的研究领域,本文分析了传统TF-IDF算法,该算法简单易实现,但它不能准确体现特征词对单个分类的贡献,对只��
PDF
0B
2020-04-01 08:46