火车采集器是使用人数比较多的互联网数据挖掘软件。能采集99%的网页,就算网页需要验证码,,也难不倒火车采集器;而且火车采集器高效可靠,凭借快速的采集和准确的结果,成就了业界领先的品牌。并且得到广大用户的一致好评!
火车头采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。程序支持远程下载图片文件,支持网站登陆后的信息采集,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。
火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。
1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。
2、多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。
3、全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。
4、本地编辑:本地可视化编辑已采集的数据。
5、采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。
6、管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。
垂直搜索(或称为专业搜索)服务
信息汇聚和门户服务
企业网信息汇聚
商业情报采集
论坛或博客迁移
智能信息代理
个人信息检索
信息挖掘
1、公司集团
2、政府机关与军队
3、门户网站
4、新闻媒体
5、广告与市场研究机构
6、金融机构
7、电信移动联通
8、科学与技术研究单位
9、网站站长
10、电子商务(如淘宝店长等)
11、其他
1.优化效率修复运行大量任务时运行卡顿问题
2.修复大量代理时配置文件锁死程序退出问题
3.修复部分情况下mysql链接不上问题
4.其它界面和功能优化
文件信息
文件大小:30897036 字节
文件说明:火车采集器安装包
文件版本:9.9.19.424
MD5:094BF84188EF42B988A5F8F09A0B9488
SHA1:C15A6363DDC933B248C53CDB1E57369B423F3046
CRC32:DE4D1724
相关搜索:采集 LocoySpider
这时候,我们就进入了火车采集器的安装向导。安装向导将在您的电脑上安装火车采集器。在开始安装之前,建议先关闭其他所有应用程序。这将允许“安装程序”更新指定的系统文件,而不需要重新启动你的计算机。点击[下一步]继续安装;
这时候,需要阅读并接受火车采集器用户协议,如果你接受协议中的条款,单击 [我接受“许可证协议”中的条款] ,再点击[下一步]继续安装,如果你点击[取消],安装向导将会退出,取消安装火车采集器;
这一步需要用户选择火车采集器的安装路径,安装程序有默认提供安装路径,如果需要自定义安装路径,点击[浏览],选择自定义安装路径,选择好之后点击[安装],就可以开始安装火车采集器。
安装软件后双击火车采集器桌面快捷方式打开软件:
火车采集器是一款网页数据采集软件。使用火车采集器可以轻松采集网站上的数据。火车采集器需要使用账号密码登录。极速小编刚好有一个火车采集器账号,输入账号密码登录;
极速小编还这一次就给大家演示一下怎么使用火车采集器采集网页上的数据。火车采集器的界面虽然看起来非常复杂,但是火车采集器的采集功能是非常简单的,完全无需担心不会操作;
点击火车采集器顶部功能栏中的新建任务,打开新建任务窗口;
在新建任务窗口中,我们在起始网址中输入想要采集数据的网站域名地址。也可以直接在网页浏览器中复制网站地址使用。需要对任务进行命名才可以保存任务,在新建任务窗口左下方输入框中输入任务名,极速小编输入了“任务1”
任务规则设置完成,我们点击保存并退出就可以将任务保存;
接下来回到火车采集器主界面,点击任务列表中的任务1,然后点击火车采集器顶部工具栏中的开始任务就可以开始采集网页数据了;
火车采集器正在采集网页数据。