python编写网页爬虫脚本并实现APScheduler调度

上传:renxingyangzi 浏览: 9 推荐: 0 文件:PDF 大小:83.71KB 上传时间:2021-02-01 13:33:55 版权申诉
前段时间自学了python,作为新手就想着自己写个东西能练习一下,了解到python编写爬虫脚本非常方便,且最近又学习了MongoDB相关的知识,万事具备只欠东风。 程序的需求是这样的,爬虫爬的页面是京东的电子书网站页面,每天会更新一些免费的电子书,爬虫会把每天更新的免费的书名以第一时间通过邮件发给我,通知我去下载。 一、编写思路: 1.爬虫脚本获取当日免费书籍信息 2.把获取到的书籍信息与数据库中的已有信息作比较,如果书籍存在不做任何操作,书籍不存在,执行插入数据库的操作,把数据的信息存入MongoDB 3.执行数据库插入操作时,把更新的数据以邮件的形式发送出来 4.用APS
上传资源
用户评论