NAME
Novel::Robot::Parser get novel / bbs content from website
小说站点解析引擎
INIT
site
支持小说站点
asxs 爱尚
dddbbb 豆豆
dingdian 顶点
jjwxc 绿晋江
luoqiu 落秋
kanunu 努努
qidian 起点
shunong 书农
snwx 少年文学
day66 天天小说
kanshu 要看书
hkslg 顺隆书院
tadu 塔读文学
zilang 紫琅文学
支持论坛站点
hjj 红晋江
tieba 百度贴吧
new
初始化解析模块
my $url = 'http://www.jjwxc.net/onebook.php?novelid=2456';
#直接指定站点
my $parser = Novel::Robot::Parser->new( site => 'jjwxc' );
#通过url自动检测站点
my $parser = Novel::Robot::Parser->new( site => $url );
get_item_ref 获取小说/贴子内容
my $r = $parser->get_item_ref($url, %opt);
NOVEL FUNCTION
get_novel_ref 获取小说内容
my $r = $parser->get_novel_ref($url, %opt);
get_index_ref 获取目录页信息
my $index_ref = $parser->get_index_ref($index_url, %opt);
parse_index 解析目录页
my $index_ref = $parser->parse_index($index_html_ref);
get_chapter_ref 获取章节页信息
my $chapter_url = 'http://m.jjwxc.net/book2/2456/2';
my $chapter_ref = $parser->get_chapter_ref($chapter_url, 2);
parse_chapter 解析章节页
my $chapter_ref = $parser->parse_chapter($chapter_html_ref);
TIEZI FUNCTION
get_tiezi_ref 获取贴子内容
my $r = $parser->get_tiezi_ref($url, %opt);
parse_tiezi 获取帖子信息
my $tz_ref = $parser->parse_tiezi($tz_html_ref);
parse_tiezi_floors 获取帖子楼层
my $floors = $parser->parse_tiezi_floors($tz_html_ref);
parse_tiezi_urls 获取帖子分页
my $urls = $parser->parse_tiezi_urls($tz_html_ref);
BOARD FUNCTION
get_board_ref 获取版块信息
my $r = $parser->get_board_ref($url, %opt);
parse_board 获取版块/作者专栏标题
my $board_ref = $parser->parse_board($board_html_ref);
parse_board_tiezis 获取版块内容url
my $tzs = $parser->parse_board_items($board_html_ref);
parse_board_urls 获取版块分页url
my $urls = $parser->parse_board_urls($board_html_ref);
parse_board_subboards 获取子版块url
my $subboards = $parser->parse_board_subboards($board_html_ref);
QUERY FUNCTION
get_query_ref 获取查询结果
my $query_type = '作者';
my $query_keyword = '顾漫';
my ($info, $items_ref) = $parser->get_query_ref( $query_keyword,
query_type => $query_type );
make_query_request 指定查询请求
my ($query_url, $post_data) =
$parser->make_query_request( $query_keyword,
query_type => $query_type );
parse_query 解析查询结果标题
my $query_title = $parser->parse_query($query_html_ref);
parse_query_items 解析查询结果列表,例如小说url
my $items_ref = $parser->parse_query_items($query_html_ref);
parse_query_urls 查询结果为分页url
my $urls_ref = $parser->parse_query_urls($query_html_ref);