中文短文本分类方法研究

上传:sinat_14208490 浏览: 38 推荐: 0 文件:KDH 大小:553.08KB 上传时间:2019-01-22 07:08:16 版权申诉
详细介绍了中文短文本分类的方法,并给出了相关的模型及算法。
上传资源
用户评论

lq75183 2019-01-22 07:08:16

不错,是我要的论文

相关推荐
论文研究猎鹰一种新颖的中文短文分类方法
对于自然语言处理问题,短文本分类仍然是研究的热点,在特征稀疏,高维文本数据和特征表示方面存在明显问题。 为了直接表达文本,提出了一种简单而又新颖的变体,它采用单维度低维度。 本文提出了一种基于Dens
PDF
1.18MB
2020-07-30 03:37
论文研究中文短文本去重方法研究.pdf
针对中文短文本冗余问题,提出了有效的去重算法框架。考虑到短文本海量性和简短性的特点,以及中文与英文之间的区别,引入了Bloom Filter、Trie树以及SimHash算法。算法框架的第一阶段由Bl
PDF
619KB
2020-07-18 13:14
论文研究基于CP CNN的中文短文分类研究.pdf
短文本具有长度短、特征稀疏以及上下文依赖强等特点,传统方法对其直接进行分类精度有限。针对此问题,提出了一种结合字符和词的双输入卷积神经网络模型CP-CNN。该模型通过加入一种用拼音序列表征字符级输入的
PDF
983KB
2021-04-18 08:21
短文分类
文档内容是短文本分类的外文期刊,提高英文阅读能力,获取国外分类技术信息
PDF
180KB
2020-12-22 03:25
基于两步策略的中文短文分类研究
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二
PDF
295KB
2021-02-23 15:22
一种基于特征扩展的中文短文分类方法
:针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP- Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概
CAJ
182KB
2020-09-21 03:44
论文研究基于自身特征扩展的短文分类方法.pdf
短文本具有特征稀疏、描述概念信号弱等特点,传统方法对短文本进行分类很难取得较好结果。针对上述问题,提出了一种基于自身特征扩展的短文本分类方法SC-FE。该方法首先基于类内离散度从每个类中选取高类别指示
unkonw
0B
2020-03-02 12:49
论文研究融合BTM主题特征的短文分类方法.pdf
针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种融合BTM主题特征和改进了特征权重计算的综合特征提取方法来进行短文本分类。方法中,在TF-IWF的基础上降低词频权重并
PDF
0B
2020-05-18 04:55
短文本数据分类
介绍了网络舆情中的短文本数据分类的关键技术。
PDF
0B
2019-02-27 08:59
短文分类
面向语义的文本分类是指在给定的分类体系下,根据文本的内容自动识别文本类别的过程。是一种基于朴素贝叶斯算法的分类技术应用与中文短文本分类。
RAR
0B
2019-06-01 06:35
JWPL基于维基百科的中文短文分类研究
JWPL(JavaWikipediaLibrary)是一个开源的访问wikipeida数据的javaapi包。该文讲述了如何使用JWPL
PDF
0B
2019-09-18 04:31
中文短文分类算法——基于BERT模型的研究与实践
一种基于BERT模型的中文短文本分类算法,并通过实验验证了其在文本分类任务中的有效性和性能优势。该算法不仅能够准确快速地对中文短文本进行分类,还能够处理不同领域和语种的文本数据。具体而言,该算法通过对
pdf
1.66MB
2023-07-22 18:35
中文网页分类方法研究
中文网页分类方法研究
DOC
0B
2019-07-11 17:12
基于搜索的短文分类算法研究
针对传统分类算法在处理短文本时的不足,提出了一种基于搜索的NaiveBayes文本分类方法。该分类方法对文本数据集规模、文档长度、类别数量、分布等情况综合考虑,对朴素贝叶斯算法进行改进,将搜索技术应用
PDF
300KB
2020-10-28 04:47
基于LDA主题模型的短文分类方法
针对短文本的特征稀疏性和上下文依赖性两个问题,提出一种基于隐含狄列克雷分配模型的短文本分类方法。利用模型生成的主题,一方面区分相同词的上下,降低权重;另一方面关联不同词以减少稀疏性,增加权重。
PDF
0B
2019-05-28 06:40