采集 58同城 房产数据信息 | Java爬虫 & Jsoup

上传:ajun55457 浏览: 16 推荐: 0 文件:PDF 大小:423.53KB 上传时间:2020-12-23 00:39:30 版权申诉
一个数据采集系统(通俗的说就是爬虫),用来采集 58同城 房产 | 郑州中的房屋数据。使用 Java 语言和Jsoup库编写,这里分享给大家。 最后采集的数据结果 CSV 文件保存的,如下所示 说明 功能都集中在 spider.get58 包的如下4个类中: App: 应用驱动程序,控制爬虫的启动/运行逻辑和日志打印等; CrawUtil: 爬虫爬取单元,爬取特定的 url 返回 html 对象; DomParse: 从 html dom 中解析出需要的数据; House: Pojo,存储需要的数据信息。 用到的 Maven 依赖如下: org.jsou
上传资源
用户评论