首页 > 软件下载 > 刷机root > 水淼万能文章采集器 v3.5.5.0

水淼万能文章采集器v3.5.5.0

软件大小:7.54MB

软件语言:简体中文

软件授权:免费版

软件类别:刷机root

更新时间:2022-02-26 12:58:00

软件类型:国产软件

应用平台:WinALL

软件等级:★★★★☆

0

0

  • 软件介绍
  • 软件截图
  • 其他版本
  • 下载地址

水淼万能文章采集器破解版是一款可以对指定关键词文章进行批量采集下载的工具,可以帮助用户采集各大平台文章,也可以采集指定网站文章,非常方便快捷,对于做网站推广和优化的朋友来说是一款不可多得的使用工具。只需输入关键词即可采集,该软件操作简单,可以精确提取网页里的正文部分保存为文章,并且支持去标签、链接、邮箱等格式化处理,只需要短短的几分钟就可以采集你想要的任何文章。用户可以设置搜索间隔、采集类型、时间语言等选项,还可以对采集的文章进行过滤、插入关键词等等,能够大大提高我们的工作效率,有需要的用户快来下载使用吧!

水淼万能文章采集器绿色版软件特色:

1、依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。

2、只需输入关键词,就能采集到百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎;可批量关键词全自动采集。

3、可定向采集指定网站栏目列表下的所有文章,智能化匹配,无需编写复杂规则。

4、文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。

5、史上最简单最智能文章采集器,支持全功能试用,效果如何一试就知!

水淼万能文章采集器绿色版功能介绍:

一、采集分页:如果正文有分页显示,则自动采集分页合并。

二、删除链接:删除网页中锚文本的链接功能,只留下锚文本的标题。

三、txt 格式:保存成txt文本(自动清除HTML标签)。

四、调试模式:在正文的开头插入“调试模式:标题和链接”的内容,以方便进入原网页对比正文识别效果。

五、标题有关键词:只有标题中包含搜索关键词的网页才采集。

六、放弃短标题:当自动识别的标题的长度低于原始标题三分之一时,即为短标题,通常这种标题是错误的,因此可以勾选放弃它,这样就使用原始标题(此段遇到时自会理解)。

七、删除外层代码:使用自动识别和精确标签时,通常都会包含div标签这样的外层代码,如果不需要,那就要打勾删除。

水淼万能文章采集器绿色版更新日志:

1、全新增加正文过滤功能,可以屏蔽掉绝大多数不属于正文的内容;合并严格和标准的正文识别,并强化正文识别能力(现在识别的正文没有再带父层的div标签了,都是取内部的代码了);增强对部分特意伪装的网站标题的提取能力;其他更新。

2、采集文章URL,强化相对路径的处理,比如../ 和 ../../ 等,经过本版本强化处理后,相对路径将完全转化为绝对路径,与浏览器中鼠标移到链接上查看到的一致。

3、修复谷歌改动导致采集失败的问题。

4、修复关键词采集文章栏目选定精确标签时没有弹出输入的问题(前面版本造成);根据URL采集文章栏目新增删除外层代码可选选项(之前默认启用);调试模式更改为文章来源;疑点说明更新;其他。

5、修复微信采集失败问题。

6、增强分页采集识别能力。

7、新增谷歌地址前缀指定,可自行设置能使用的谷歌域名。

8、采集设置的正则替换支持使用<#sm#>隔开多个匹配和替换表达式。

9、增强正文识别能力,识别准确度有所提升;增加对特殊编码响应的识别。

10、增加对二次加载图片的新属性“original”识别转换。

11、外置文件更新谷歌翻译使用的域名;修正谷歌tk参数变动翻译失败的问题。

12、修复部分情况因系统原因无法跳转网址导致百度网页无法采集的问题;新增自动去除网址的#后缀部分,该部分会导致网页读取错误;采集文章URL新增左边和右边插入选项;修复前面版本导致的正文提取的过滤存在的一些问题;其他更新。

13、增强对部分采用跳转的网页识别。

14、增加标题字数限制为最多100字,以免字数超长导致的一些问题;其他更新。

软件截图