联系我们
广告位
万能文章采集器 v2.13.2.0
万能文章采集器 v2.13.2.0
软件类别:
网络软件
运行环境:
XP/2003/Vista/Win7
更新时间:
2016-9-14
演示地址:
暂无
浏览次数:
5210
详情介绍

万能 文章采集器是水淼软件出品的一款万能文章采集软件,可以只需输入关键字就能采集各种网页和新闻,还可以采集指定列表页(栏目页)的文章。

功能特点:
1. 依托于水淼软件独家万能正文识别智能算法,可实现任何网页正文自动提取准确率95%以上。
2. 只需输入关键词,就能采集到百度新闻和网页、搜狗新闻和网页、360新闻和网页、谷歌新闻和网页、必应新闻和网页、雅虎新闻和网页;可批量关键词全自动采集。
3. 可定向采集指定网站栏目列表下的所有文章(如百度经验、百度贴吧),智能化匹配,无需编写复杂规则。
4. 文章转译功能,可对采集好的文章,将其翻译到英文再翻译回中文,实现翻译伪原创,支持谷歌和有道翻译。
5. 史上最简单最智能文章采集器,更多特点一试就知!

注意:微信引擎限制严格,采集线程数请设置为1个,否则非常容易出验证码。

万能文章采集器 更新日志:
升级记录(2016-09-09):
2.9.0.0:全新增加正文过滤功能,可以屏蔽掉绝大多数不属于正文的内容;合并严格和标准的正文识别,并强化正文识别能力(现在识别的正文没有再带父层的div标签了,都是取内部的代码了);增强对部分特意伪装的网站标题的提取能力;其他更新。
2.9.1.0:采集文章URL,强化相对路径的处理,比如../ 和 ../../ 等,经过本版本强化处理后,相对路径将完全转化为绝对路径,与浏览器中鼠标移到链接上查看到的一致。
2.9.2.0:修复谷歌改动导致采集失败的问题。
2.9.3.0:修复关键词采集文章栏目选定精确标签时没有弹出输入的问题(前面版本造成);根据URL采集文章栏目新增删除外层代码可选选项(之前默认启用);调试模式更改为文章来源;疑点说明更新;其他。
2.9.5.0:修复微信采集失败问题。
2.9.6.0:增强分页采集识别能力。
2.9.7.0:新增谷歌地址前缀指定,可自行设置能使用的谷歌域名。
2.9.8.0:采集设置的正则替换支持使用<#sm#>隔开多个匹配和替换表达式。
2.9.9.0:增强正文识别能力,识别准确度有所提升;增加对特殊编码响应的识别。
2.9.10.0:增加对二次加载图片的新属性“original”识别转换。
2.9.11.0:外置文件更新谷歌翻译使用的域名;修正谷歌tk参数变动翻译失败的问题。
2.10.0.0:修复部分情况因系统原因无法跳转网址导致百度网页无法采集的问题;新增自动去除网址的#后缀部分,该部分会导致网页读取错误;采集文章URL新增左边和右边插入选项;修复前面版本导致的正文提取的过滤存在的一些问题;其他更新。
2.10.1.0:增强对部分采用跳转的网页识别。
2.10.2.0:增加标题字数限制为最多100字,以免字数超长导致的一些问题;其他更新。
2.10.3.0:修复必应新闻采集失败问题;修复部分网页的分页格式错误导致重复采集的问题;更换网页访问方式(以前https使用WiniNet,http使用WinHttp,现在都用WinHttp);其他更新。
2.10.5.0:修复软件对部分网页跳转代码错判而读取失败的问题;采集文章URL列表栏目的导入导出配置功能新增支持同步导入导出根据URL采集文章栏目的配置。
2.11.0.0:新增动态加载的列表页URL的采集功能(如今日头条toutiao.com);读取网页时增加USC2解码(如新浪微博需要解码才能采集);其他多项更新。
2.11.1.0:文章查看器的文件列表框改进以便看全长标题,并且如果读取的文件数量不全,请在切换目录读取时按住Ctrl键即可增强读取;采集文章URL列表的导入导出配置增加对生成列表页URL和采集列表页URL的配置同步功能(各窗口处于打开状态才能同步配置)。
2.11.2.0:修复过滤正文功能遇到个别网页的特殊代码过滤不正常的问题。
2.11.3.0:修复部分DZ论坛自动识别错误的问题;修复删除外层代码时个别页面自动识别错误的问题
2.11.3.1:修复class过滤的一个细节问题;默认打勾删除外层代码
2.12.0.0:增强分页采集对分页的识别能力(尤其是图片类的分页);生成列表页功能新增支持倒序生成
2.12.1.0:新增采集列表页的文章URL时支持POST方法
2.13.0.0:文章保存格式全新增加txt带图片排版;新增图片二次加载的新属性识别 data-original;文章来源改为在文章末尾追加;新增智能忽略版权信息被识别为正文;调整界面组件位置;其他更新。
2.13.1.0:修复xp系统不能采集淘宝网页的问题;修复//类型链接转换错误问题;更新谷歌地址前缀文件。
2.13.2.0:修复txt格式保存时没有自动转换网页转义符的问题

wannengcaijiqi

本文固定链接: https://www.codejie.net/4363.html
标签: 文章采集器 网站文章采集
图片展示
万能文章采集器 v2.13.2.0
下载地址

下载地址: 网盘下载  

提示:使用 WinRAR解压后再运行或安装,压缩包密码www.codejie.net, 如下载失败,请 联系我们。
您还感兴趣的文章
  • 淘宝推广大师 v1.7.6 下载
  • FotoSketcher3.20|图片素描工具绿色免安装版
  • 淘宝美工助理 v7.1017
  • 利搜网站排名 v2.02下载
  • WinRAR 64位 5.40 Beta4无广告汉化下载
  • 7-Zip(64位)16.04官方版免费下载
  • 网络人远程控制软件 办公版 v7.318
  • WPS Office 2016抢鲜版免费下载
  • 安易硬盘数据恢复软件 v8.76免费下载
  • Adobe 2019 2020 Home Screen FIX v3.5.8下载
  • 九度智能SEO优化软件 v12.5
  • VirtualBox 开源虚拟机 v5.1.0 for windows
图片压缩 在线工具 tools online

代做工资流水公司菏泽收入证明代开汕头打企业对公流水鞍山流水多少钱赣州薪资流水单代办邢台工资流水app截图开具咸阳流水代开汕头工资证明厦门房贷工资流水 开具重庆入职流水代开银川企业贷流水报价揭阳对公账户流水办理莆田打印车贷工资流水佛山银行流水PS代做保定薪资银行流水费用鞍山打消费贷流水济南车贷工资流水 办理兰州代办企业对公流水北京办背调工资流水保定做个人银行流水重庆银行流水PS代开西安做购房银行流水舟山对公账户流水费用太原查薪资流水衡阳车贷流水费用衡阳查在职证明青岛背调银行流水代开成都代办在职证明铜陵打印车贷流水盐城工资流水单模板开封查工作收入证明香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

代做工资流水公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化