python jieba库的基本使用

上传:qqarmor37980 浏览: 25 推荐: 0 文件:pdf 大小:106.21 KB 上传时间:2021-06-12 20:07:49 版权申诉

下面是《三国演义》人物数量统计代码的升级版,升级版中对于某些确定不是人名的词,即使做了词频统计,也要将它删除掉。使用寄一个集合excludes来接收一些确定不是人名但是又排序比较靠前的单词列进去。运行结果:可以看出还是有像“商议”、“如何”等不是人物的词出现在统计结果,我们将这些词加入到 excludes 中,多次运行程序后最后得到《三国演义》任务出场顺序前20:七、文本词频统计问题举一反三应用问题扩展

上传资源
用户评论