疫情相关NLP微博数据集

上传:netop73776 浏览: 263 推荐: 0 文件:CSV 大小:330.33MB 上传时间:2020-08-10 18:52:48 版权申诉
数据集为依据与“新冠肺炎”相关的230个主题关键词进行随机数据采集的2020年1月1日—2020年2月20日期间共计100万条微博数据,公开数据集: 其中每列的含义: - id: 微博序号,主键 - weibo_id: 微博id - daytime: 微博发布时间, 从0000-2359 - name:发布人账号 - content:微博中文内容 - day:日期 - month:月份 - sentiments:使用snowNLP分析得出的情感数值,范围为-0.5 ~ 0.5,大于0为正面情感,小于0为负面情感; - keyword0-4:使用jieba分词提取的主题关键词,取前四位; 使用
上传资源
用户评论
相关推荐
疫情相关NLP情感分析数据
是一个6分类情感分析的数据集 包含: {"angry": 0, "happy": 1, "neural": 2, "surpris
ZIP
5.93MB
2021-03-28 22:41
疫情期间民众数据
爬取了疫情期间微博普通用户发表的动态,包括用户id,用户名,发表时间,点赞数,转发数,评论数等信息,可用作大数据分析数据源
CSV
56.78MB
2020-08-08 11:53
NLP中文人名地名提取数据分享
一份经过规范提取处理的微博数据集,按照人名、地名进行提取,方便NLP相关工作的使用和研究。数据集已经整理好放到了data文件夹中,欢迎交流分享。
zip
38.14MB
2023-03-28 11:38
最新数据
微博最新数据集,包含以下字段发表时间所用设备微博内容点赞数评论数转发数用户id用户名称vip等级关注数粉丝数性别微博认证(简介)等级阳光信用注册时间
XLSX
0B
2019-05-14 17:36
评论数据
Weibo comment data set
ZIP
0B
2019-06-22 01:07
新浪数据
一个新浪新浪微博内容数据集的压缩包,进行数据挖掘分析只用。
RAR
4.29MB
2020-09-28 01:14
NLP CC2013测评数据
NLP&CC;2013微博测评数据;包括中文微博观点要素抽取、中文微博情绪识别、跨语言情感分类、中文微博实体链接、中文语义依存关系分析五个测评。每个测评数据包括:评测大纲、评测样例、测试数据、评测结果
zip
0B
2019-07-08 19:46
美赛数据
数学建模数据。 美赛8万多条微博数据集总有你想要的。
docx
0B
2019-04-13 08:14
十万数据.rar
爬取的103个微博用户截止2019年8月发布的所有原创微博,以csv文件存储,每个用户对应一个csv文件。包括48位女性,55位男性,男女性分开存储。包括id、微博正文、微博原始图片URL、原始视频U
RAR
0B
2020-05-13 23:46
情感分析数据
微博情感200万条数据集,情感分析研究人员的很好的实验数据
rar
0B
2018-12-07 19:28
MSRA数据NLP
MSRA数据集NLP,用于NER任务,是命名实体识别最常用的中文数据库之一。有兴趣的话,欢迎下载尝试,一起交流学习。
RAR
2.78MB
2020-08-14 08:40
84168条新浪数据
84168条新浪微博数据集。 8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。包含63641个用户,文件为sql脚本,可直接导入数据库。 微博数据集 话题聚类
ZIP
0B
2019-03-14 17:10
实体链接分析数据
中文微博实体链接分析数据集,可以练习使用。
RAR
0B
2019-06-05 01:03
NLP CC2013情绪分析样例数据测试和标注
NLP&&CC2013;微博情绪分析样例数据测试集和标注该语料主要用于识别出整条微博所表达的情绪,不是简单的褒贬分类,而是涉及到多个细粒度情绪类别(例如悲伤、忧愁、快乐、兴奋等),属于细粒度的情感分类
RAR
0B
2019-09-13 16:07
8万多条新浪数据
8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。文件为sql脚本,方便直接导入数据库。
RAR
0B
2019-04-28 05:41