acerdcl - 2014/4/21 14:12:27
RT,文章是整页的没问题,我会采集,分页就不知道怎么办了,只能采集到第一页,后边的页码连接会指向原网站,不可能对每一篇文章分别设立采集规则,那还不如复制粘贴效率高
xiyou - 2014/4/21 14:18:38
比如,index1.html,index2.html
列表规则那里你填写index*.html,页码1到2
acerdcl - 2014/4/21 14:26:53
比如,index1.html,index2.html 列表规则那里你填写index*.html,页码1到2 xiyou 发表于 2014-4-21 14:18:38  |
这样也等于是对每篇文章分别设立规则了吧。。。我是想对文章列表页设立规则,然后能够采集到列表中有分页的文章全部内容
比如搜狐教育,在文章规则列表网址中填
http://learning.sohu.com/jiaoyudongtai_31*.shtml,可以采集到搜狐教育的所有文章,但是假设其中某篇文章分页,也能采集到这篇文章,但就只能采集到这篇文章第一页了,后边的页码连接也采集到了,但是点击连接是指向原网站的,我知道后边的分页没有采集,所以一定指向原网站,那怎样才能不用对每篇文章设立规则但是也能全部采集到文章的其他分页呢。
acerdcl - 2014/4/21 14:46:43
研究了下,貌似pa的采集不带这个功能,火车头采集带分页功能,应该可以实现我说的