论文研究 基于CP CNN的中文短文本分类研究.pdf

上传:weixin_39882200 浏览: 10 推荐: 0 文件:PDF 大小:983.04KB 上传时间:2021-04-18 08:21:17 版权申诉
短文本具有长度短、特征稀疏以及上下文依赖强等特点,传统方法对其直接进行分类精度有限。针对此问题,提出了一种结合字符和词的双输入卷积神经网络模型CP-CNN。该模型通过加入一种用拼音序列表征字符级输入的方法,构建字符级和词级的双输入矩阵,并在采样层使用k-max采样方法,增强模型特征的表达能力。利用豆瓣电影评论数据集对该模型进行识别精度评估,实验结果表明,与传统分类模型和标准卷积神经网络模型相比,该模型可有效提高短文本分类效果。
上传资源
用户评论
相关推荐
论文研究基于LDA特征扩展短文分类.pdf
针对中文短文本篇幅较短、特征稀疏性等特征,提出了一种基于隐含狄利克雷分布模型的特征扩展的短文本分类方法。在短文本原始特征的基础上,利用LDA主题模型对短文本进行预测,得到对应的主题分布,把主题中的词作
PDF
0B
2019-10-14 08:45
论文研究基于wordembedding和CNN情感分类模型.pdf
尝试将wordembedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的wordembedding,然后将每条样本中出现的wordemb
PDF
0B
2020-01-02 17:35
中文短文分类方法研究
详细介绍了中文短文本分类的方法,并给出了相关的模型及算法。
KDH
0B
2019-01-22 07:08
论文研究基于自身特征扩展短文分类方法.pdf
短文本具有特征稀疏、描述概念信号弱等特点,传统方法对短文本进行分类很难取得较好结果。针对上述问题,提出了一种基于自身特征扩展的短文本分类方法SC-FE。该方法首先基于类内离散度从每个类中选取高类别指示
unkonw
0B
2020-03-02 12:49
论文研究中文短文本去重方法研究.pdf
针对中文短文本冗余问题,提出了有效的去重算法框架。考虑到短文本海量性和简短性的特点,以及中文与英文之间的区别,引入了Bloom Filter、Trie树以及SimHash算法。算法框架的第一阶段由Bl
PDF
619KB
2020-07-18 13:14
论文研究结合情感词网中文短文本情感分类.pdf
针对短文本特征稀疏、信息量少等问题,提出了结合情感词网的中文短文本情感分类方法。该方法利用大规模语料库和同义词集合构建可以表示词—词、词—对象之间关系的情感词网,通过此情感词网在权重以及特征集合对短文
PDF
0B
2019-12-31 14:38
论文研究CNNELM混合短文分类模型.pdf
针对目前自然语言处理研究中,使用卷积神经网络(CNN)进行短文本分类任务时可以结合不同神经网络结构与分类算法以提高分类性能的问题,提出了一种结合卷积神经网络与极速学习机的CNN-ELM混合短文本分类模
PDF
0B
2019-09-14 15:02
基于搜索短文分类算法研究
针对传统分类算法在处理短文本时的不足,提出了一种基于搜索的NaiveBayes文本分类方法。该分类方法对文本数据集规模、文档长度、类别数量、分布等情况综合考虑,对朴素贝叶斯算法进行改进,将搜索技术应用
PDF
300KB
2020-10-28 04:47
基于两步策略中文短文分类研究
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二
PDF
295KB
2021-02-23 15:22
论文研究基于AntTree算法短文本聚类研究.pdf
基于Ant-Tree算法的短文本聚类研究,吴勇,李仁发,短文本由于词频过低,使用常规的聚类算法如K-means效果不理想,难得到可接受的准确度。而最近结合使用生物启发及聚类内部有效性测��
unkonw
0B
2020-02-16 03:59
中文短文分类算法基于BERT模型应用研究.pdf
本文主要研究了基于BERT模型的中文短文本分类算法的应用。通过使用BERT模型,我们能够有效地对中文短文本进行分类和归类。具体而言,我们介绍了BERT模型的原理和技术特点,并详细阐述了在中文短文本分类
pdf
1.66MB
2023-09-04 00:56
论文研究基于CNN路面修补检测.pdf
基于CNN的路面修补检测,白胜,徐国胜,路面修补会对行车造成极大的安全风险,快速、准确的路面修补自动检测有助于评估路面完好性,提高道路养护水平,对保障行车安全具
.PDF
765KB
2020-07-20 06:53
JWPL基于维基百科中文短文分类研究
JWPL(JavaWikipediaLibrary)是一个开源的访问wikipeida数据的javaapi包。该文讲述了如何使用JWPL
PDF
0B
2019-09-18 04:31
中文短文分类算法——基于BERT模型研究与实践
一种基于BERT模型的中文短文本分类算法,并通过实验验证了其在文本分类任务中的有效性和性能优势。该算法不仅能够准确快速地对中文短文本进行分类,还能够处理不同领域和语种的文本数据。具体而言,该算法通过对
pdf
1.66MB
2023-07-22 18:35
论文研究融合BTM主题特征短文分类方法.pdf
针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种融合BTM主题特征和改进了特征权重计算的综合特征提取方法来进行短文本分类。方法中,在TF-IWF的基础上降低词频权重并
PDF
0B
2020-05-18 04:55