Scrapy框架CrawlSpiders的介绍以及使用详解

上传：tianzhilinma 浏览： 7 推荐： 0 文件：PDF 大小：177.58KB 上传时间：2020-12-30 06:47:10 版权申诉

在Scrapy基础——Spider中,我简要地说了一下Spider类。Spider基本上能做很多事情了,但是如果你想爬取知乎或者是简书全站的话,你可能需要一个更强大的武器。CrawlSpider基于Spider,但是可以说是为全站爬取而生。 CrawlSpiders是Spider的派生类,Spider类的设计原则是只爬取start_url列表中的网页,而CrawlSpider类定义了一些规则(rule)来提供跟进link的方便的机制,从爬取的网页中获取link并继续爬取的工作更适合。一、我们先来分析一下CrawlSpiders源码源码解析 class CrawlSpider(Spid