Python BeautifulSoup中文乱码问题的2种解决方法

上传:cyx25934 浏览: 19 推荐: 0 文件:PDF 大小:41.89KB 上传时间:2020-12-31 11:52:25 版权申诉
解决方法一: 使用python的BeautifulSoup来抓取网页然后输出网页标题,但是输出的总是乱码,找了好久找到解决办法,下面分享给大家首先是代码复制代码 代码如下:from bs4 import BeautifulSoupimport urllib2url = ‘//www.jb51.net/’page = urllib2.urlopen(url)soup = BeautifulSoup(page,from_encoding=”utf8′′)print soup.original_encodingprint (soup.title).encode(‘gb18030’)file = ope
上传资源
用户评论