python爬虫之requests的使用

上传:abcdeedcba99324 浏览: 33 推荐: 0 文件:PDF 大小:225.5KB 上传时间:2020-12-22 20:09:33 版权申诉
先来看一下相关概念 爬虫的定义 网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。 只要是浏览器能做的事情,原则上,爬虫都能够做 通用爬虫和聚焦爬虫 通用爬虫:通用爬虫是搜索引擎抓取系统(百度、谷歌、搜狗等)的重要组成部分。主要是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 聚焦爬虫:是面向特定需求的一种网络爬虫程序,他与通用爬虫的区别在于:聚焦爬虫在实施网页抓取的时候会对内容进行筛选和处理,尽量保证只抓取与需求相关的网页信息。 通用爬虫的局限性 通用搜索引擎所返回的网页里90%的内容无用。 图片、
上传资源
用户评论