基于改进互信息和邻接熵的微博新词发现方法

上传:三年二班小壮壮 浏览: 21 推荐: 0 文件:PDF 大小:1.71MB 上传时间:2019-09-14 00:10:35 版权申诉
基于改进互信息和邻接熵的微博新词发现方法,大数据,自然语言处理
上传资源
用户评论
相关推荐
论文研究基于互信息邻接新词发现算法.pdf
如何快速高效地识别新词是自然语言处理中一项非常重要的任务。针对当前新词发现存在的问题,提出了一种从左至右逐字在未切词的微博语料中发现新词的算法。通过计算候选词语与其右邻接字的互信息来逐字扩展,得到候选
PDF
0B
2019-09-14 00:10
Pythonpython3实现互信息左右新词发现
python3利用互信息和左右信息熵的中文分词新词发现
ZIP
0B
2019-09-27 19:19
融合规则与统计新词发现方法
结合微博新词的构词规则自由度大和极其复杂的特点,针对传统的C/NC-value方法抽取的结果新词边界的识别准确率不高,以及低频微博新词无法正确识别的问题,提出了一种融合人工启发式规则、C/NC-val
PDF
617KB
2021-04-24 10:10
新词发现方法
不错的新词发现方法,利用了pat-array, 倒排索引
PDF
0B
2018-12-18 16:36
SkipGram模型融合词向量投影新词发现
Skip-Gram模型融合词向量投影的微博新词发现。pdf,是关于自然语言处理中的问题研究文章
PDF
0B
2019-09-27 19:19
论文研究结合互信息主题模型话题发现方法.pdf
为了解决短文本信息流的特征稀疏性对热点话题发现带来的挑战,提出了结合词语互信息和概率主题模型的微博热点话题发现方法。通过建立词共现矩阵并应用对称非负矩阵分解算法获取词项-主题矩阵,再利用概率潜在语义分
PDF
0B
2020-05-04 11:32
基于古汉语语料新词发现方法.pdf
古汉语语料的新词发现方法
PDF
4.28MB
2020-07-17 21:07
论文研究基于数据新词识别.pdf
基于微博数据的新词识别,孙励,王小捷,新词识别是中文信息处理的一项重要任务,影响着机器翻译、文本分类等相关研究的性能。微博是目前网络用户最为广泛使用的交流方式
PDF
297KB
2020-07-16 09:36
论文研究基于视频搜索日志新词发现方法.pdf
基于视频搜索日志的新词发现方法,李啸宇,程渤, 在自然语言处理领域里面,新词发现一直以来就是一个具有重要意义的研究热点,在视频搜索日志上进行新词发现远比在一般语料库上要难
PDF
340KB
2020-07-17 21:07
基于大规模语料新词发现算法
基于大规模语料的新词发现算法,运用在大数据自然语言处理
DOCX
0B
2019-06-04 03:43
拓扑优化中基于图论邻接过滤方法
拓扑优化中基于图论的邻接熵过滤方法 邻接熵过滤法 采用邻接熵过滤法的拓扑优化 步骤1 通过程序进行有限元网格划分,定 义边界. 或通过ANSYS 的GUI 接口进行有限元 网格划分,定义边界. 步骤
PDF
1.02MB
2020-11-29 05:11
论文研究基于GN算法社区发现方法.pdf
基于GN算法的微博社区发现方法,韦庆杰,李京腾,随着互联网和移动通信技术的快速发展,微博已成为主流的在线社交网络平台。微博网络不只是简单的拓扑结构网络,它还包含信息交互
PDF
0B
2019-09-20 04:19
论文研究基于数据挖掘新词发现.pdf
利用文本挖掘技术提出了一种用于主题式搜索引擎的专业词典库发现新专业词汇的方法,详述了如何通过关联规则挖掘来实现专业词典库的扩展,并在此基础上进行了小样本实验,实验结果显示该方法有效可行。
PDF
263KB
2020-07-18 09:18
基于转移网络隐蔽关键用户分析方法.doc
发现微博关键用户是近几年的研究热点。关键用户有显式和隐蔽之分,前者的影响是直接的,而后者通过前者制造影响,因此后者的影响是间接的。现有的方法大都分析用户的直接影响力,发现的关键用户大都属于显式关键用户
DOC
13.27MB
2020-07-23 19:34
论文研究基于重叠社团发现话题检测方法.pdf
微博话题检测是当前研究的热点,提出一种基于复杂网络重叠社团发现的微博话题检测方法。该方法对一段时间内的微博数据进行预处理,在分词后,根据词性以及词的时域分布抽取出主题词,在相关度高的主题词之间构造边得
PDF
648KB
2020-07-16 05:16