火车采集器是一款使网络内容采集工具,使用火车采集器,用户可以采集其他网站的内容,让用户瞬间建立一个拥有庞大内容的网站。该软件支持远程图片下载,图片批量水印,Flash下载,下载文件地址探测,自制作发表的cms模块参数,自定义发表的内容等等,是网络编辑的必备神器!
火车采集器是一款专业的互联网数据抓取、处理、分析,挖掘软件。使用火车采集器,用户可以灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据,能帮助用户快速的建立自己的数据系统,也就是说使用火车采集器用户可以迅速填充网站内容,构件庞大的网站。
1.丰富的插件功能:新版中PHP插件和C#插件可以在采网址时,采内容时,采完内容后使用插件,而不限是什么插件.同时对对插件开发提供了更加详细的开发手册,可以方便用户实现自己的特殊要求.
2.任务运行日志:程序将对运行的日志进行保存,方便用户在自动更新时查看采集器的工作情况.
3.更多的数据保存方式.程序可以将数据保存在access,sqlite,mssql,mysql,oracle数据库中,更快的速度,更方便的管理.
4.更方便的升级及.程序对文件目录格式进行了重新设置,用户如果不使用升级程序,只需要复制几个文件夹就可以经松完成升级.
5.支持可选的加密狗授权方式.
6.命令行模式.可以使用参数启动程序执行任务.可以通过计划任务的来实验定时采集,在采集结束后退出程序
7.中文分词增加用户词库,可以添加用户排除的词库.可以只使用用户词库.
8.本地采集数据管理里加入了图片预览功能.
9.标签可以上下进行排序.生成CSV时,就按该排序生成csv文件.测试时,返回的结果也以标签的排序进行显示.
10.图片和flash下载排除功能.对于符合条件的文件不进行下载.
11.文件上传标签里可以针对多个标签进行文件上传.
12.采网址部分在使用2级网址时可以设置列表页包含区域
13.循环采集时可以使用提取关键字,摘要等功能。
14.列表标签可以进行编辑,如排除和过滤,下载等。。
( 0 ˲)