火车采集器文章采集教程
材料准备:火车头采集器、浏览器、目标网站(例:http://www.yingjia360.com/
1.找出目标网站文章分布规律,点击栏目,及栏目分页(不要用第一页,否则不易发现规律)
1.1发现规律
2.打开火车采集器,并新建任务
3.网址采集规则
3.1向导添加
3.1.1批量网址
3.1.2根据规律设置地址参数
3.2采集目标网址
3.2.1目标网址区域设置
3.2.2网址采集测试
4.内容采集规则
4.1文章标题采集
4.2文章内容采集
4.3如有其他需要,可参照文章标题、内容,添加标签列表内容
4.4采集数据处理
5.内容发布规则
6.采集