perl抓取文件内容

作者:佚名 上传时间:2019-05-28 版权申诉

本文用Web::Scraper抓取新浪中的文本

#!/usr/bin/perl -w
use strict;
use utf8;
use URI;
use Web::Scraper;
binmode( STDOUT, ':encoding(utf8)' );
my $url   = " http://news.sina.com.cn/c/2010-06-04/203520413927.shtml ";
my $proce = scraper {
process '.blkContainerSblk >h1',   "news[]"  => "TEXT";
process '.blkContainerSblkCon >p', "texts[]" => "TEXT";
};
my $res = $proce->scrape( URI->new($url) );
for my $result ( @{ $res->{news} } ) {
print "$result\n";
}
for my $result ( @{ $res->{texts} } ) {
print "$result\n";
}

免责申明:文章和图片全部来源于公开网络,如有侵权,请通知删除 server@dude6.com

用户评论
相关推荐
perl
本文用Web::Scraper抓取新浪中的文本 #!/usr/bin/perl -w use strict; use utf8; use URI;
perl
本文用Web::Scraper抓取新浪中的文本 #!/usr/bin/perl -w use strict; use utf8; use URI;
如何在Perl中读
在Perl中读取文件内容可以通过内置的文件句柄和一些文件处理函数来实现。下面是一个示例代码,演示如何在Perl中读取文件内容:#!/usr/bin/perl# 打开文件open FILE, &
无限制
Perl
2023-04-05 16:44
Perl处理示例:读并统计行数
此示例代码演示了如何使用Perl编程语言读取文件内容并统计文件中的行数。它打开指定的文件,逐行读取文件内容,并统计文件中的行数,最后输出总行数。#!/usr/bin/perluse strict;
Perl 5.x
Perl编程语言
2023-12-03 07:48
Perl操作示例:读并计算行数
这个Perl示例代码演示了如何打开一个文件、逐行读取其内容并计算文件中行的数量。通过使用Perl的文件操作函数,可以轻松实现对文件的读取和简单的数据统计操作。#!/usr/bin/perluse
Perl 5.x
Perl编程语言
2023-12-16 08:23
Perl操作示例:读并统计行数
此Perl示例代码演示了如何打开文件、逐行读取文件内容并统计文件中的行数。通过使用Perl内置的文件操作函数,可以轻松地实现文件读取和行数统计。#!/usr/bin/perluse strict;
Perl 5
Perl解释器
2023-12-07 17:21
Perl操作示例:逐行读并处理
这个Perl示例演示了如何逐行读取文件内容并对每行进行处理。它打开指定的文件,逐行读取内容,并针对每行执行自定义操作,这里是简单地打印每行内容。#!/usr/bin/perluse strict
Perl 5
Perl 编程语言
2023-12-10 02:01
C#网页HTML
网上很多内容采集工具,今天就自己试着写一个,发现C#可以轻松的抓去网页的内容,进而通过正则来分离出自己感兴趣的数据。下面是抓去网页内容的代码: using System;usi
使用Perl从HTML中提
这段Perl代码演示了如何使用正则表达式从HTML中提取文本内容,使用模块HTML::TreeBuilder将HTML代码解析为树状结构,然后递归遍历树状结构,提取出对应文本。 #!/usr/bin
HTML::TreeBuilder 5.07
Perl语言
2023-04-18 21:16
使用Perl脚本实现提PDF中的
本示例展示了如何使用Perl脚本将PDF文件中的文本内容提取出来。通过PDF::OCR2模块将PDF转化为可识别的图像,再通过Tesseract OCR引擎进行文字识别,并将识别结果储存在文本文件中。
Perl 5.26.1, PDF::API2 2.034, PDF::OCR2 0.9.3, Tesseract OCR 5.0.0-alpha.20201127
Sublime Text 3
2023-05-20 01:37