基于有意义串聚类的微博热点话题发现方法

上传:douglasren 浏览: 12 推荐: 0 文件:PDF 大小:727.28KB 上传时间:2021-02-23 05:17:18 版权申诉
针对微博数据特征稀疏、内容碎片化的特点,提出一种基于有意义串聚类的热点话题发现方法。结合重复串计算、上下文邻接分析和语言规则过滤多种策略,提取能够表达独立完整语义的有意义串,并将微博数据建模在相对较小的有意义串空间,通过聚类产生候选话题,根据热度排序发现热点话题。微博数据实验结果表明,该方法在一定程度上实现对微博高维稀疏空间的降维,对于微博空间的热点话题发现有效可行。
上传资源
用户评论