python爬虫之requests的使用

上传：abcdeedcba99324 浏览： 33 推荐： 0 文件：PDF 大小：225.5KB 上传时间：2020-12-22 20:09:33 版权申诉

先来看一下相关概念爬虫的定义网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。只要是浏览器能做的事情,原则上,爬虫都能够做通用爬虫和聚焦爬虫通用爬虫:通用爬虫是搜索引擎抓取系统(百度、谷歌、搜狗等)的重要组成部分。主要是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。聚焦爬虫:是面向特定需求的一种网络爬虫程序,他与通用爬虫的区别在于:聚焦爬虫在实施网页抓取的时候会对内容进行筛选和处理,尽量保证只抓取与需求相关的网页信息。通用爬虫的局限性通用搜索引擎所返回的网页里90%的内容无用。图片、