产品使用及交流论坛

首页 » 产品使用交流区 » 安装及使用交流 » 管理能不能出个采集的教程
qdtad - 2014/3/2 10:38:53
如题:管理能不能出个采集的教程,采集功能一头雾水啊,举个例子吧:我要采集这个网站的新闻应该怎么弄 [url]http://www.china-railway.com.cn/xwc/ttxw/index_1.html[/url]
qdtad - 2014/3/2 10:45:27
管理帮帮忙吧!
qdtad - 2014/3/2 11:24:16
<td height="50" align="center" class="fontbiaoti">铁路迎来务工客流返程高峰</td>   像这种情况 怎么用正则表达只取 “铁路迎来务工客流返程高峰”出来
qdtad - 2014/3/3 11:59:04
管理 能不能 举个例子说明一下啊 ,或者帮帮忙 这个站应该怎么采集 [url]http://www.china-railway.com.cn/xwc/ttxw/index.html[/url]
xiyou - 2014/3/3 12:18:49
采集教程不好写,因为要看对方网站源代码找规则,每个网站规则都不一样

<td height="50" align="center" class="fontbiaoti">铁路迎来务工客流返程高峰</td>

你这样没有办法采集到,因为一个页面的</td>有很多,必须保证开头和结尾唯一才可以。中间要采集的内容用(?<content>.+)替换掉,我看你源代码里面有这段

<tr>
                <td height="50" align="center" class="fontbiaoti">铁路迎来务工客流返程高峰</td>
              </tr>
              <tr>
                <td align="center"><font color="#959595">
规则应该这样写:<td height="50" align="center" class="fontbiaoti">(?<content>.+)</td>\s*</tr>\s*<tr>\s*<td align="center"><font color="#959595">

空格或换行用\s*来表示,你用这个规则试试,我写的也不一样对。
qdtad - 2014/3/3 13:33:20
这个确实采集到了,这只是标题,不知道,能不能麻烦你一下,其余的来源:时间:内容都帮忙写写,因为我对这个真实一点不懂。先谢过了
wanqiliuyan - 2014/7/14 10:20:23
采集中  正则 pa:cllection 是什么意思?
1
查看完整版本: 管理能不能出个采集的教程