产品使用及交流论坛

首页 » 产品使用交流区 » 安装及使用交流 » 有老师能写一个文章采集的案例吗
google258 - 2016/3/12 11:51:12
自己看了很多之前论坛里写的文章采集的案例,多次尝试测试也不行,有没有哪个老师能再写一个案例的让大家一起学习的,谢谢了:D :)
google258 - 2016/3/12 21:22:12
帖子要沉了  顶起来:O
google258 - 2016/3/13 11:25:17
开始采集...
http://www.jnboiler.com.cnshow.aspx?id=6805&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6759&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6758&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6757&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6756&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6755&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
采集结束!
google258 - 2016/3/13 11:27:50
标题采集正则:<h1 class="aTitle">?<content></h1>
内容采集正则:<div id="content">?<content><ul id="digg" class="digg">
acerdcl - 2016/3/13 16:36:13

11109
11110
11111
自带的采集功能不好用,不能识别重复采集,不能采集分页,不能对代码进行复杂处理,不能。。。总之不好用,是非常简单的采集功能,我已经转用火车头了,专业强大的采集神器,免费版就可以满足一般应用
上边是我以前用的采集规则,现在还有效,自己看看研究下吧,不解释了。

http://roll.edu.sina.com.cn/more/gk/bkzn1/zyyjy/kaoshi/index.shtml
http://edu.sina.com.cn/gaokao/2015-11-18/doc-ifxksqis4945548.shtml
源代码代码对比规则就懂了
google258 - 2016/3/13 19:43:12
谢谢老师啊,我下午也在研究火车头的,貌似功能确实很强大,看如何和page的后台做对接
1
查看完整版本: 有老师能写一个文章采集的案例吗