时间:2017-03-28 14:20:46 作者:不思议游戏 浏览量:15
1.任务批量编辑
批量修改任务规则细节参数
2.任务批量处理
按照以下选项批量清理或导入数据。
3.远程管理
该功能可以通过http协议来对服务器上的采集器进行远程管理。 换言之,我们可以通过浏览器访问到我们的采集器来进行管理。
点击启动后如图:
访问地址后进行常用操作管理:
4.用户管理
该功能允许用户将自己写好的采集规则共享给一个或多个客户端用户。 可以通过服务器用户管理设置用户帐号,用来限定用户下载规则的权限和允许用户访问的分组。 客户端用户可以下载远程的采集规则,并可以有选择地更新任务,还可以一键更新所有远程的采集规则。 该功能对于一些非技术客户而言省去了写规则的麻烦,也帮助开设规则服务器的用户省去了远程指导的环节。
5.运行统计
用于统计用户运行的任务,可以以天、周、月或选择的时间段来查询, 包括采集到的网址、重复网址、采集成功、采集失败、发布成功、发布失败等数据。
6、同义词替换
此功能可以将采集内容中的词语进行替换,自定义替换规则。 但需注意:两个同义词之间要用英文半角逗号连接,比如将快乐替换成高兴,即如下图: “快乐,高兴” “美丽,漂亮”,然后保存,即可在数据处理中选择对应词库使用替换功能。
7.中文分词
用来测试中文分词以及关键词提取的效果。 可通过编辑用户词库,设置词性,词频,允许词,禁用词,来影响最终效果
8.数据转换
数据采集下来后可选择保存到sqlite、mysql、sqlserver三种类型的数据库中。 默认保存为sqlite数据库,可转换为其他类型,其中sqlite是可以保存在本地数据库的。 mysql、sqlserver既可以保存在本地数据库,也可以保存到远程数据库。
9.选项
可对全局选项、采集设置、配置备份和使用偏好等进行设置。
10.运行完自动关机
如勾选该项,则在任务运行完毕后自动关机。