产品使用及交流论坛

注册

 

QQ登录

只需一步,快速开始

发新话题 回复该主题

有老师能写一个文章采集的案例吗 [复制链接]

1#
自己看了很多之前论坛里写的文章采集的案例,多次尝试测试也不行,有没有哪个老师能再写一个案例的让大家一起学习的,谢谢了
分享 转发
TOP
2#

帖子要沉了  顶起来
TOP
3#

开始采集...
http://www.jnboiler.com.cnshow.aspx?id=6805&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6759&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6758&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6757&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6756&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
http://www.jnboiler.com.cnshow.aspx?id=6755&cid=16采集失败,错误:无法解析此远程名称: 'www.jnboiler.com.cnshow.aspx'
采集结束!
TOP
4#

标题采集正则:<h1 class="aTitle">?<content></h1>
内容采集正则:<div id="content">?<content><ul id="digg" class="digg">
TOP
5#





自带的采集功能不好用,不能识别重复采集,不能采集分页,不能对代码进行复杂处理,不能。。。总之不好用,是非常简单的采集功能,我已经转用火车头了,专业强大的采集神器,免费版就可以满足一般应用
上边是我以前用的采集规则,现在还有效,自己看看研究下吧,不解释了。

http://roll.edu.sina.com.cn/more/gk/bkzn1/zyyjy/kaoshi/index.shtml
http://edu.sina.com.cn/gaokao/2015-11-18/doc-ifxksqis4945548.shtml
源代码代码对比规则就懂了
TOP
6#

谢谢老师啊,我下午也在研究火车头的,貌似功能确实很强大,看如何和page的后台做对接
TOP
发新话题 回复该主题