水淼万能文章采集器是一款简单易用的文章采集工具,用户只需要输入关键词就能够快速采集主要搜索引擎的新闻源和泛网页。本款网站文章采集器不仅具有采集速度快、操作简单的特点,它还可以精确提取网页里的正文部分保存为文章,并且支持去标签、链接、邮箱等格式化处理。
水淼软件出品的一款基于高精度正文识别算法的互联网文章采集器。支持按关键词采集各大搜索引擎的新闻和网页,还支持采集指定网站栏目下的全部文章。基于水淼自主研发的正文识别智能算法,能在互联网纷繁复杂的网页中尽可能准确地提取出正文内容。
正文识别有 3 种算法,“标准”、“严格”和“精确标签”。其中“标准”和“严格”是自动模式,能适应绝大多数网页的正文提取,而“精确标签”只需指定正文标签头,如“<div class="text">”,就能通吃所有网页的正文提取。
关键词采集目前支持的搜索引擎有:百度、搜狗、360、谷歌、必应、雅虎
采集指定网站文章的功能也非常简单,只需要稍微设置(不需要复杂的规则),就能批量采集目标网站的文章了。
因为墙的问题,要使用谷歌搜索和谷歌转译文章的功能,需要使用VPN换国外IP。
内置文章转译功能,也就是可以将文章从一种语言如中文转到另一种语言如英文,再从英文转回中文。
采集文章+翻译伪原创可以满足广大站长朋友们在各领域主题的文章需求。
而一些公关处理、信息调查公司所需的由专业公司开发的信息采集系统,售价往往达到上万甚至更多,而水淼的这款软件也是一款信息采集系统,功能跟市面上昂贵售价的软件有相通之处,但价格只有区区几百元,性价比如何试试就知。
功能特点
一、依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。
二、只需输入关键词,就能采集到百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎;可批量关键词全自动采集。
三、可定向采集指定网站栏目列表下的所有文章,智能化匹配,无需编写复杂规则。
四、文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。
五、史上比较简单比较智能文章采集器,支持全功能试用,效果如何一试就知!
更新日志
修复百度网页搜索时间设置失效问题并取消百度新闻时间设置(已不支持);微信采集时增加正文比较少字数的设置支持(原先只有自动识别的可以设置字数,而微信是内置精确标签的所以不能设置字数,现在可以了);文章查看切换显示时增加自动刷新目录树;关键词采集正文字数不足时补充提示设置的字数值。
文件信息
文件大小:2465792 字节
文件说明:万能文章采集器
文件版本:3.0.1.0
MD5:B6D60E618EB79DBEE6449FD26A0C362A
SHA1:338A8CBE74E769368127EF06FEF5B508A82E5B3B
CRC32:25314E18
包含文件
gzip.dll
shuimiao.rc
分页最大值.txt
水淼·万能文章采集器.exe-
优先标题标签.txt
正文最少字数.txt
指定标题位置.txt
水淼万能文章采集器是一款好用的全网在线文章搜索采集软件。我们可以使用水淼万能文章采集器输入关键词搜索全网的文章内容,并进行文章内容采集;
极速小编这一次就给大家演示一下怎么使用水淼万能文章采集器使用关键词搜索在线文章吧。点击软件主界面中的关键字输入框,就可以开始输入关键字了;
水淼万能文章采集器支持同时搜索多个关键字,每个关键字之间用符号“/”隔开。极速小编输入了“苹果/iPhone/ipad”;
接下来我们可以选择搜索的网页。我们可以选择百度网页、百度新闻、搜狗网页、搜狗新闻、搜狗微信、360网页、360新闻、谷歌网页、谷歌新闻、必应网页、必应新闻、雅虎、今日头条、一点资讯。极速小编选择了百度网页;
接下来我们可以设置采集的文章的保存路径。点击保存目录右边的选项按钮,打开文件夹浏览窗口,选择采集文章保存文件夹;
在文件夹浏览窗口中,找到想要用来保存采集得到的文章的文件夹,用鼠标点击选中文件夹后点击确定,就可以完成文章保存目录修改了;
接下来我们就可以开始进行文章采集了。点击开始采集就可以开始搜索百度网页中的文章内容;