基于Python的网络爬虫技术

上传:qq_37193196 浏览: 40 推荐: 0 文件:PDF 大小:109.77KB 上传时间:2019-01-02 14:13:28 版权申诉
1基于Python的网络爬虫 网络爬虫又称网络蜘蛛,或网络机器人。网络爬虫通过网页的 链接地址来查找网页内容,并直接返回给用户所需要的数据,不需 要人工操纵浏览器获取。脚daon是一个广泛使用的脚本语言,其自 带了urllib、urllib2等爬虫最基本的库,Scrapy网络爬虫是基于 Python语言开发的开源爬虫软件,Serapy可在Windows,Linux等多 个操作系统运行。如果待抓取网页的HTML源码很多,需要下载大 量的内容,用户可在Serapy爬虫框架上定制开发部分模块实现爬虫 功能。
上传资源
用户评论

qqexcite66243 2019-01-02 14:13:30

真是个骗子