简单Java小爬虫–获取博主信息

上传:sinat_48217 浏览: 11 推荐: 0 文件:PDF 大小:257KB 上传时间:2020-12-30 19:21:39 版权申诉
为什么会写这篇博客,是因为我最近在写博客,对自己的博客浏览量比较好奇,总是会登上来看一下,正好我对爬虫感兴趣,所以就想着写一个爬虫来直接获取一下信息。 基本思路 这个爬虫的思路很简单,就是通过发起 HTTP 请求获取博主的我的博客的信息,来获取Ta的一些基本信息。我主要获取下面这幅图中,圆圈内的信息。 点击我的博客,就能看到这个页面,最上面是需要爬取的链接。 使用的jar包及遇到的问题 使用的jar包 我使用了 HttpClient 和 Jsoup 这两个工具,采用 maven 创建工程,下面是jar包的坐标。 org.apache.httpcomponents htt
上传资源
用户评论