善肯网页TXT采集器是一款来自我爱破解平台大神出品,它使用全新的正则表达式抓拿下载内容,准时小说站点加密或者没办法复制粘贴都可以成功采集,可下载、可实时预览、可文本替换,并可以将每一个章节存为TXT文件,很实用,有需要的朋友欢迎用。
所以我开发的这个软件就特地加了个预览功能,可以了解我到底能否获得网页数据,我获得后能否正确匹配出内容。
②规则设置用的是正则表达式匹配内容,有肯定基础最好,没基础也可以参考给的范例,简单学习下,无需深入学习正则。
③规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。④关于替换,有通用替换和定制替换,这里现在无需正则,普通替换就好,应该注意的是需要要输入值,空格也行。删除:选中整行,再按住delete键就好。内置\n再作为替换数据的时候代表换行。
⑤编码,现在只设置有GBK和UFT-8,差不多大部分网站就是这两种编码其中之一。2、分析与下载
①分析请按分析地址2按钮,1按钮现在任性不想删,后面要开发其他功能,②支持单章节下载和全文下载。
③支持添加章节数【有些小说没章节数的时候就能勾上】④支持在线看,但需要联网,此功能只不过辅助,并不是专业的看小说软件。
⑤下载进度和总需时间显示,内置多线程。3、关于软件
①其实只须.exe就好,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则,主如果测试的时候是用的。其他网站规则,大伙可以自己添加,或者支持开发者也行。②软件没加壳,c#开发的,没放病毒。不放心请勿用,我不背锅。
③关于软件里面有个www.52pojie.cn跳转到平台,我测试跳转的时候被360提示了,也大概是由于跳转的是360浏览器,不了解你们是否会有这个问题。④xml里面的内容,假如不了解的话还是不要动它,免得软件辨别失败显示错误。
⑤需要.net framework 4.5或者及以上版本框架支持,假如你电脑没的话,需要下载安装,框架不大的。4、其他
暂时没想到,后面想到再说。最后,不管如何,还是打滚求支持,不喜请不要喷。
这个是第一个版本,所以一定存在我之前测试没遇见的bug或者需要优化的问题,欢迎大伙温顺的反馈哈。理论上只须是目录页到内容页的形式的都可以用,不限于小说。
修复第一章不可以点击的bug。
TAG标签:采集(2)
转载请说明来源于当快软件园(https://www.lrvxg.com)
本文地址:https://www.lrvxg.com/soft/1653.html
郑重声明:文章来源于网络作为参考,本站仅用于分享不存储任何下载资源,如果网站中图片和文字侵犯了您的版权,请联系我们处理!邮箱3450399331@qq.com