(JWPL)基于维基百科的中文短文本分类研究

上传:hzz18477 浏览: 26 推荐: 0 文件:PDF 大小:842.82KB 上传时间:2019-09-18 04:31:36 版权申诉
JWPL(JavaWikipediaLibrary)是一个开源的访问wikipeida数据的javaapi包。该文讲述了如何使用JWPL
上传资源
用户评论

settle93501 2019-05-04 00:11:28

一点都不好用

e95257dison 2019-05-04 00:11:28

略微改了改,谢谢分享

fordie1712 2019-05-04 00:11:28

很好的资源,谢谢分享,学习了

yoga18287 2019-05-04 00:11:28

很好的资源,谢谢分享

yixian62851 2019-05-04 00:11:28

最近看recyclerview的东西有点多 学习了

hongkid 2019-05-04 00:11:28

感谢,稍微修改就能用

weixinzhongxin 2019-05-04 00:11:28

写的很不错,对我很有用

pianist_87450 2019-05-04 00:11:28

很好的资源,谢谢分享

相关推荐
维基百科javaAPI_JWPL
维基百科java实现APIThejarsinthispackageareNOTdirectlyrunnable.Inordertorunthejars,youhavetoaddthejarsinthe
ZIP
0B
2019-05-21 18:02
中文短文分类方法研究
详细介绍了中文短文本分类的方法,并给出了相关的模型及算法。
KDH
0B
2019-01-22 07:08
论文研究基于CP CNN中文短文分类研究.pdf
短文本具有长度短、特征稀疏以及上下文依赖强等特点,传统方法对其直接进行分类精度有限。针对此问题,提出了一种结合字符和词的双输入卷积神经网络模型CP-CNN。该模型通过加入一种用拼音序列表征字符级输入的
PDF
983KB
2021-04-18 08:21
基于两步策略中文短文分类研究
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二
PDF
295KB
2021-02-23 15:22
基于搜索短文分类算法研究
针对传统分类算法在处理短文本时的不足,提出了一种基于搜索的NaiveBayes文本分类方法。该分类方法对文本数据集规模、文档长度、类别数量、分布等情况综合考虑,对朴素贝叶斯算法进行改进,将搜索技术应用
PDF
300KB
2020-10-28 04:47
中文短文分类算法——基于BERT模型研究与实践
一种基于BERT模型的中文短文本分类算法,并通过实验验证了其在文本分类任务中的有效性和性能优势。该算法不仅能够准确快速地对中文短文本进行分类,还能够处理不同领域和语种的文本数据。具体而言,该算法通过对
pdf
1.66MB
2023-07-22 18:35
基于FastText短文分类
在大数据背景下,如何快速准确的从庞大数据集中筛选过滤出有用信息一直是自然语言处理领域的一个研究目标,对用户所提问题进行意图识别能够帮助用户在向问答系统进行沟通的时候,根据用户提出的直接或者间接的信息来
PDF
1.47MB
2021-01-16 02:48
中文短文分类算法基于BERT模型应用研究.pdf
本文主要研究了基于BERT模型的中文短文本分类算法的应用。通过使用BERT模型,我们能够有效地对中文短文本进行分类和归类。具体而言,我们介绍了BERT模型的原理和技术特点,并详细阐述了在中文短文本分类
pdf
1.66MB
2023-09-04 00:56
基于CRFs中文分词和短文分类技术.pdf
本文的工作主要包括两部分:第一部分,我们借用了文本分类领域的特征选择算法对中文分词中的特征进行分析。分析结果表明,特征选择算法在中文分词的任务中也是适用的。在中文分词领域,基于字标注的方法得到广泛应用
PDF
0B
2018-12-26 05:55
论文研究基于LDA特征扩展短文分类.pdf
针对中文短文本篇幅较短、特征稀疏性等特征,提出了一种基于隐含狄利克雷分布模型的特征扩展的短文本分类方法。在短文本原始特征的基础上,利用LDA主题模型对短文本进行预测,得到对应的主题分布,把主题中的词作
PDF
0B
2019-10-14 08:45
基于领域词语本体短文分类
短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不
PDF
347KB
2021-02-23 15:23
一种基于特征扩展中文短文分类方法
:针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP- Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概
CAJ
182KB
2020-09-21 03:44
短文分类
文档内容是短文本分类的外文期刊,提高英文阅读能力,获取国外分类技术信息
PDF
180KB
2020-12-22 03:25
论文研究基于自身特征扩展短文分类方法.pdf
短文本具有特征稀疏、描述概念信号弱等特点,传统方法对短文本进行分类很难取得较好结果。针对上述问题,提出了一种基于自身特征扩展的短文本分类方法SC-FE。该方法首先基于类内离散度从每个类中选取高类别指示
unkonw
0B
2020-03-02 12:49
论文研究结合情感词网中文短文本情感分类.pdf
针对短文本特征稀疏、信息量少等问题,提出了结合情感词网的中文短文本情感分类方法。该方法利用大规模语料库和同义词集合构建可以表示词—词、词—对象之间关系的情感词网,通过此情感词网在权重以及特征集合对短文
PDF
0B
2019-12-31 14:38