Python 数据分析第六期–文本数据分析

上传:wangluhy 浏览: 32 推荐: 0 文件:PDF 大小:172.82KB 上传时间:2021-01-15 15:46:15 版权申诉
Python 数据分析第六期–文本数据分析 1. Python 文本分析工具 NLTK NLTK (Natural Language Toolkit) NLP 领域最常用的一个 Python 库 , NLP(natural language process), 开源项目 , 自带分词,分类功能,强大的社区支持。 1.1 NLTK 安装 pip install nltk 语料库的安装,在命令行里安装,如果安装不成功,可离线下载。 import nltk nltk.download() 1.2 文本预处理 1.2.1 分词 ​ 将句子拆分成具有语言语义学上意义的词 , 英文
上传资源
用户评论