产品使用及交流论坛

注册

 

QQ登录

只需一步,快速开始

发新话题 回复该主题

管理能不能出个采集的教程 [复制链接]

1#
如题:管理能不能出个采集的教程,采集功能一头雾水啊,举个例子吧:我要采集这个网站的新闻应该怎么弄 [url]http://www.china-railway.com.cn/xwc/ttxw/index_1.html[/url]
分享 转发
TOP
2#

管理帮帮忙吧!
TOP
3#

<td height="50" align="center" class="fontbiaoti">铁路迎来务工客流返程高峰</td>   像这种情况 怎么用正则表达只取 “铁路迎来务工客流返程高峰”出来
TOP
4#

管理 能不能 举个例子说明一下啊 ,或者帮帮忙 这个站应该怎么采集 [url]http://www.china-railway.com.cn/xwc/ttxw/index.html[/url]
TOP
5#

采集教程不好写,因为要看对方网站源代码找规则,每个网站规则都不一样

<td height="50" align="center" class="fontbiaoti">铁路迎来务工客流返程高峰</td>

你这样没有办法采集到,因为一个页面的</td>有很多,必须保证开头和结尾唯一才可以。中间要采集的内容用(?<content>.+)替换掉,我看你源代码里面有这段

<tr>
                <td height="50" align="center" class="fontbiaoti">铁路迎来务工客流返程高峰</td>
              </tr>
              <tr>
                <td align="center"><font color="#959595">
规则应该这样写:<td height="50" align="center" class="fontbiaoti">(?<content>.+)</td>\s*</tr>\s*<tr>\s*<td align="center"><font color="#959595">

空格或换行用\s*来表示,你用这个规则试试,我写的也不一样对。
TOP
6#

这个确实采集到了,这只是标题,不知道,能不能麻烦你一下,其余的来源:时间:内容都帮忙写写,因为我对这个真实一点不懂。先谢过了
TOP
7#

采集中  正则 pa:cllection 是什么意思?
TOP
发新话题 回复该主题