火车采集器使用教程介绍,采集规则写法介绍
时间:2021-03-12 13:15:17 作者:无名 浏览量:53
如果你经常会在大型的新闻或者资讯
网站中发表文章的话,一篇一篇的发送的话就会很耽误时间,同时也耽误我们工作的效率。为了提高更新网站的效率,这就能够使用火车头
采集器这款工具,在使用这款工具的过程中,需要提前设置采集规则,才能够有更高的效率进行发送。本篇文章给大家来分享的就是火车头采集器这款工具的采集规则写法介绍,帮助小伙伴们更快的上手进行使用,快来详细的了解一下吧!
方法介绍
1. 新建文章采集节点
我们打开火车采集器这款工具之后,成功登录这款工具之后,我们在软件主页面中依次点击“采集—采集节点管理—增加新节点—选择普通文章”,以上选项完成之后,点“确定”按钮进行下一步。
2. 填写采集列表规则
节点名称:在这里可以随便进行编写,但是需要用自己分清楚,因为节点多了会产生混乱。
匹配网址:是在采集目标列表页面中,更好的查看列表的规则。在使用过程中,建议大家从第二页开始进行采集查看,因为很多网站的列表的第一面跟其它内页是有很大的差别。
火车采集器使用教程介绍图二
区域结束的HTML:在采集目标列表页打开源代码!在要采集的文章标题后面的附近找一段在本页是唯一并且其它要采集的的页面也是唯一的html标签!
以上选项设置完成后,直接点击保存信息,更好的进入下一步。如果规则写作全部正确之后,就会出现内容的网址获取规则测试。
3. 采集内容规则
文章标题:在文章标题的前后找两个标签之后,能够帮助用户更好的识别标题。
火车采集器使用教程介绍图三
文章内容:在文章内容前后找两个标签,能识别出内容的!采集的网站的文章内容前后唯一标签是<div class=”content”>…<ul class=”page clearfix”>,所以就写成<div class=”content”>[内容]<ul class=”page clearfix”>。
对于其他的功能也不用管了,确定之后点击保存配置同时进行预览,如果前面的列表规则跟内容规则都写对了的话,那现在就会预览到内容。
- 软件性质:国产软件
- 授权方式:免费版
- 软件语言:简体中文
- 软件大小:23789 KB
- 下载次数:4599 次
- 更新时间:2021/3/11 12:34:25
- 运行平台:WinAll...
- 软件描述:火车采集器是使用人数比较多的互联网数据挖掘软件。能采集99%的网页,就算网页需要... [立即下载]
相关资讯
相关软件