用Python写网络爬虫(PDF版)

上传:hongsuqi 浏览: 46 推荐: 0 文件:ZIP 大小:9.41MB 上传时间:2019-05-02 09:14:07 版权申诉
本书讲解了如何使用Python来编写网络爬虫程序,内容包括网络爬虫简介,从页面中抓取数据的三种方法,提取缓存中的数据,使用多个线程和进程来进行并发抓取,如何抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia来进行数据抓取,并在最后使用本书介绍的数据抓取技术对几个真实的网站进行了抓取,旨在帮助读者活学活用书中介绍的技术。本书适合有一定Python编程经验,而且对爬虫技术感兴趣的读者阅读。
上传资源
用户评论