热搜词
发表于 2016-1-11 20:26:06 | 显示全部楼层 |阅读模式
采集器:火车采集器 V9.0
------------------------------------------------------------------
网址采集规则:

起始网址:
http://www.shzbtb.com.cn/newshweb/gcjs/004001/default.aspx

提取规则:
<a href="/newshweb/infodetail/?infoid=[参数]Num=004001"

拼接地址:
http://www.shzbtb.com.cn/newshweb/infodetail/?infoid=[参数1]

开头字符串:

<TABLE  cellSpacing=0 cellPadding=0 width=100% align=center border=0 valign=top>


结尾字符串:

<TR height=10><td colspan="4"></td></tr>

----------------------------------------------------------------------------
内容采集规则:

标题:
开头字符串:<title>
结尾字符串:</title>

内容:
开头字符串: <td valign="top" class="infodetail" id="TDContent">
结尾字符串: <td height="30" align="center"><table width="500" border="0" cellspacing="0" cellpadding="0" align="center">



全部评论0
回复
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|手机版|小黑屋|管理员之家 ( 苏ICP备2023053177号-2 )

GMT+8, 2024-12-22 14:36 , Processed in 0.179116 second(s), 26 queries .

Powered by Discuz! X3.5

Cpoyright © 2001-2024 Discuz! Team