水淼淘宝商品采集器是水淼软件出品的一款淘宝天猫商品信息批量采集软件,软件直接采集淘宝搜索页面数据,包括商品的价格、销量、销售额、旺旺号、商品标题、商品地址等等,输出为电商数据报表(csv文件),可用于分析电商行情、同行销售业绩评估等用途。每个商品关键词支持100页,大约4400个商品的销售数据和宝贝属性。支持详细的搜索参数设置,支持多个商品关键词顺序采集,不同关键词使用/隔开
特别提示
淘宝弹出的窗口,第一次是用于登录,登录完成可以立刻关闭窗口继续采集;以后是用于输入验证码,支持自己打码和雇人打码(推荐雇人打码并等待)。如果验证码频出,则每次输入验证码后让窗口自动等待15分钟才能继续采集,否则就会一直弹窗口
本软件不支持导入淘宝助理的,请注意!
采集字段
默认字段搜索页面里直接显示的字段,如旺旺号、价格、销量、销售额、评论数、地区、运费、标题、地址、商品图、卖家信誉、好评率、如实描述、服务态度、物流速度、级别、标签、店铺地址
扩展字段有#标记的字段,如店铺名、原价格、成交记录、库存数、收藏数、产品参数、详情内容。如果采集此类字段会导致速度变慢
采集速度
软件是采集淘宝搜索页面数据(点击“浏览器打开”按钮就看到了),包括基本字段如价格、旺旺号、销量、标题、地址等等,不过有的扩展字段(#字段)不在搜索页面里,基本字段“销量”也不是实时值,就需要到多个数据源去读取扩展字段或基本字段的实时值
为了避免不同字段多个数据源一起采集影响整体采集速度,故有#的字段只有在被打钩的情况下才读取数据
其中“#原价格”“#成交记录”“#库存数”“读取销量实时值” 这四个字段某一项被打钩,其余3个都会一起读取(因为都来自同一个数据源,1个或4个项的读取速度是一样的,不同数据源才影响采集速度)
其中“#产品参数”“#详情内容”等扩展字段,“+购物车”“+有视频”等筛选条件均需访问商品页面再读取数据(二个步骤)
以上说明仅描述影响采集速度的各项因素,内部过程无需用户操心软件自动完成。
包含文件
FastVerCode.dll
LZConfig.ini
shuimiao.rc
水淼·淘宝商品采集器.exe---主程序
更新日志
3.1.3.0:修复搜索结果页数较少时后面页数空采集的问题。
3.1.5.0:修复淘宝个别页面故意不返回数据导致采集缺失的问题(应对策略是增加尝试次数和延时)。
3.1.6.0:再加尝试次数。
3.1.7.0:修复销售额计算错误的问题(价格被忽略小数的值导致);再加尝试次数。
3.1.8.0:修复成交记录无法采集的问题(因为验证码的原因速度很慢)。
相关搜索:采集