火车采集器(万能网站内容采集神器) 9.0 安装版软件介绍
火车头采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件,通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。程序支持远程下载图片文件,支持网站登陆后的信息采集,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。
火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。
功能介绍:
1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。
2、多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。
3、全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。
4、本地编辑:本地可视化编辑已采集的数据。
5、采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。
6、管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。
应用范围:
垂直搜索(或称为专业搜索)服务
信息汇聚和门户服务
企业网信息汇聚
商业情报采集
论坛或博客迁移
智能信息代理
个人信息检索
信息挖掘
适用群体:
1、公司集团
2、政府机关与军队
3、门户网站
4、新闻媒体
5、广告与市场研究机构
6、金融机构
7、电信移动联通
8、科学与技术研究单位
9、网站站长
10、电子商务(如淘宝店长等)
11、其他
更新日志:
增加的功能
1.增加发布扩展功能,开发了很多CMS的发布扩展
2.增加获取更新远程采集规则功能,用户可以自建规则服务器,向自己客户提供采集规则
3.增加更多应用扩展,如E商统计,极速搜索,论坛采集器,微博数据助手等
4.二级代理增加页面缓存功能,方便短时间内对同一网页进行采集。
5.起始网址添加自定义语法,可以生成更多复杂网址
6.将google,bing,有道翻译集成到汉译英翻译模块中
7.本地库转换时增加了保留数据选项
8.POST采集网址部分增加了文本导入搜索词功能
9.增加网盘上传功能,一个文本可以同时上传多个网盘
10.增加将EXCEL数据导入采集器功能
11.POST获取网址部分增加了一个修改header功能
12.支持下载ftp中的文件
13.标签处理中加了一个运行C#代码功能
14.任务搜索功能中增加分组搜索
15.修改测试发布,增加入库以及应用扩展测试发布
16.入库和web发布添加了个复制配置右键菜单
17.系统托盘增加显示当前程序运行目录功能
18.本地替换增加可选操作整个数据库的选项
19.火车采集器任务右键菜单增加shift键功能
V8版本修改的Bug
1.解决explorer关闭重开后采集器图标找不到的问题
2.解决url地址中带.号获取内容失败的bug
3.修正多页抓取的时候UserAgent不统一造成cookie失效的情况
4.修正多页抓取的时候网站编码选择自动识别并且多页的网址编码不一致造成多页返回乱码的问题
5.处理了部分mysql数据库不能获取列表的问题
6.修复部分代理在二级代理中无效一级代理中有效的问题
7.修正图片下载地址不包含< 必须包含条件 失效的bug
4.解决打开程序报错,软件界面上图片显示红叉的问题
火车采集器(万能网站内容采集神器) 9.0 安装版下载地址