火车采集器免费版使用技巧(2)
时间:2020-08-19 13:21:05 作者:无名 浏览量:50
采集规则制作的第一步骤,点击向导添加,①➯②,出现如图界面。
分3种方式:普通网址,批量网址,文本导入。
火车采集器免费版使用技巧图8
a、普通网址:以一行一个的形式直接加入网址,不做任何解析。
b、批量网址:以通用的表达式批量生成网址。
c、文本导入:以文本导入的形式,文本为一行一个的网址。
更新日志:
支持SSH(SFTP文件)上传;内容提取新增JSON提取方式,提取JSON数据更加简单
二级代理服务器新增Socks代理;任务运行过程中可修改线程数等参数,实时调节运行速度,添加可查看任务运行当前及总体速度功能;插件编辑器新增C#源码文件插件,类似PHP源码插件一样,编辑后直接生效,但比PHP源码插件支持更多的插件接口;软件闪退,支持保存未完成的任务进度
新增消息机制
V9将采网址和采内容的方式合并,列表采集及内容采集使用不同队列,优化采集流程,更新数据内容的方式由Update改为insert,大幅提升采集及入库速度;任务运行合并到统一界面,添加“实时数据”查看和“任务详情”统计;修改了原有的无限级列表页网址获取模式,使无限级配置操作更加简单;
字段重复性对比功能不再使用数据库unique方式,改为内存Md5_16对比,更加精准;标签数据的来源更加细致化,可设置从默认页、分页和多页的源码,URL地址及返回头信息中提取。
<上一页12
- 软件性质:国产软件
- 授权方式:免费版
- 软件语言:简体中文
- 软件大小:23789 KB
- 下载次数:4011 次
- 更新时间:2020/8/19 11:27:36
- 运行平台:WinAll...
- 软件描述:火车采集器是使用人数比较多的互联网数据挖掘软件。能采集99%的网页,就算网页需要... [立即下载]
相关资讯
相关软件