采集网站:http://news.sina.com.cn
采集任务:新浪国内新闻
织梦内容管理系统
任务列表地址:http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_1.shtml 本文来自织梦
第一步:添加采集站点
操作:模块管理-》采集管理-》采集站点管理-》添加采集站点
两个属性:基本信息和站点规则,其中,基本信息为必填项。站点规则可以填写,也可以不填写。所以说这一步可以很简单,也可以稍微麻烦些(设置站点规则) 。 内容来自dedecms
A:基本信息填写:
站点名称:就是你给这个网站做的记号,便于以后管理所用。
站点 URL:就是网站的地址了。注意如果你采集的是网站的二级域名,比如
http://roll.news.sina.com.cn 那么,这里就填写二级域名。
站点描述:这个可以为空。
织梦内容管理系统
B:站点规则:
整个站点内容页(注意是内容页,就是文章的详细展示页面)的通用规则,这里如果设置好后,以后添加采集任务时,会自动继承这个规则,就会省很多工作量。
下载该教程:http://www.phpcms.cn/uploadfile/2009/0522/20090522023356492.rar
内容来自dedecms
