新浪微博数据集sql文件-标记了话题

上传:xubiao039721 浏览: 46 推荐: 0 文件:其他文档 大小:500kb 上传时间:2019-05-27 20:17:19 版权申诉
数据概述:本数据集为63641个用户的新浪微博数据集,包括以下内容:63641个新浪微博用户信息数据格式:用户uid,用户昵称,用户姓名,用户所在地,用户主页url,用户性别,用户粉丝数,用户关注数,用户微博数,用户收藏数,用户创建时间;84168条在2014-05-03至2014-05-11采的关于12个主题的微博信息数据格式:微博mid,发布时间,微博内容,微博来源,微博转发数,微博评论数,微博被赞数,发表用户uid,微博所属主题。12个主题包括魅族,小米,火箭队,林书豪,恒大,韩剧,雾霾,房价,同桌的你,公务员,贪官,转基因。1391718条用户好友关系每条记录由suid和tuid两个字段组成,表示suid关注tuid,由于新浪微博的限制,
上传资源
用户评论

pinge8432 2019-05-27 20:17:19

最近正在学习机器学习,这个数据集正好用来练习。使用方便。