很多朋友在论坛上发贴询问采集器的制作方法和一些细节问题。为了使得更多的站长更加方便地使用SupeSite的采集功能,特作此教程。
网管论坛bbs_bitsCN_com
首先简单说一下制作采集器的基本原理和思路:
网管网www_bitscn_com
1、确定您要采集哪个页面的新闻,将这些页面的地址填入到“索引页面url地址(图4和5)”; 网管下载dl.bitscn.com
上图4
上图5 网管u家u.bitsCN.com
2、确定在这些页面您要采集的内容区域,因为不是一个网页所有的内容都要采集回来,而是采集一个网页的一部分内容,所以您必须告诉程序您要采集的区域,也就是“列表区域识别规则”;(图4和5)
网管u家u.bitsCN.com