

我已经激活成功了..但是它提示病毒库过期... 安装的是它提示 可以用到2008年1月 但上面提示病毒库过期(2006年5月18)
然后更新不能完成 事件里显示 选择下载出错..该怎么做啊..大哥/..我已经注册你论坛了。.但还在验证中...
该版本只能在.net framework 1.1下运行
火车采集器一直致力于向做最好最强的采集器看齐,本期版本V1.2.0也是蓄势已久,在原来的版本上大胆创新,使新版本相当于原版本做了一次革命性的系统结构转变。本期版本耗费了我的大量心血,但考虑许多问题,并不将它做成收费,继续提供给大家,由于软件基本上是一个人开发,根本没有什么时间写完全的帮助文档,软件都是在办公室完成的,上网很慢,家里电脑没装网,所以无法提供大量的规则和网址供大家测试,希望大家能多多共享自己的规则和cms模块出来,为完善采集器做出一点贡献。
大家向我反映火车采集器上手比较麻烦,可能是这样,我在做用户界面水平不高,希望大家多多帮助,多多交流使用,发掘火车采集器的各项潜能。
【更新说明】火车采集器V1.2.0 build 2006-02-06
1、重构了用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器。
独立出来由用户自定义提交自定义的登陆,刷新和发表的参数。各个cms系统都作成一个cms模块文件,放入程序文件夹下的/module/即可。
系统现自带了几个主流cms系统:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。
2、全新版的规则定义方式
①自定义标签:使用标签形式定义采集名,系统以后不再局限于老版本的标题,作者,出处,时间和内容5个标签,想定义多少个就多少。
②自定义标签下限定内容的个数,每个标签下用以限定采集内容使用的开始字符串,结束字符串,排除,替换,自定义个数,不再局限于老版本中的5个排除,2个替换。、
③可以选定是采集内容还是采集连接。采集连接时程序自动分析里面的地址,HTTP形式的地址可以分析并探测得到真实地址。
3、完全去掉了大家比较头疼的正则表达式。改用系统内置通配符(*),无论是开始字符串,结束字符串,排除,替换遇到不确定的内容时,一个(*)全部可以代替。
4、强大的内容分页识别
您要做的只是用开始字符串和结束字符串定义一下 页面内分页的区域。支持可变内容通配符(*) ,然后选定一下该页面分页的形式:全部列出分页,上下页形式(较少),程序就会分析页面里的内容将所有分页合并起来。
新版分页功能支持自定义分页连接代码,如果结合到你强大的cms,比如dedecms分页代码为#P#,选择自定义合并分页后可以完全按原文章的样子,你采集生成的页面同样有多少页!
5、加入了内容标签循环采集功能
通常一个页面采集时只采集第一次匹配成功的内容,比如对论坛来说定义好规则后只能采集到第一楼的内容,您可以定义循环采集次数n,来限定采集多少次匹配的内容,0为采集全部匹配内容,默认为1次。
6、加入对来源网站和发表文章的目标系统的各种编码的支持
7、网址倒排序发表功能
8、完成系统自动探测地址,并实现对大文件的分块断点多线程下载 考虑到版权问题软件下载只到本地,不改连接,需要的PM我。
9、加入了设置代理服务器采集的功能。
10、由于用户可以根据自定义的标签对应修改提交的POST参数,相当于导入数据库指定表的功能,且不是对本地操作,因此该版本去掉了不甚完善的数据库导入功能。
本采集器采用Visual C#编写,可以在Windows2003下运行,若在Windows2000,Xp下运行请先到微软官方下载一个.net framework1.1或更高环境组件:
附:.net framework 1.1下载地址:http://www.chinacode.com/files/ChinaCodeFile457.shtml





