2007年12月24日平安夜,亮点软件团队旗下软件产品LvStudio2.0震撼发布了,作为信息采集软件的提供商,亮点始终致力于通过不断优化产品基础架构、增强系统功能,来帮助用户构建稳定、完善且功能强大的采集软件,实现各类信息维护的自动化、快速化。
2.0版本整体全部重新开发,保持原有1.0所有功能外,增加了很多强大功能,诸如采集论坛和论坛回复并发表到论坛等功能,2.0以家族软件身份出现,包括以下软件:
·LvSpider 2.0(亮点采集器2.0)
·LvPoster 2.0 (亮点在线发布器2.0)
·LvScheduler 2.0 (亮点任务调度器)
·LvPostModuel 2.0(亮点发布模块编辑器2.0)
·LvPostSetting 2.0(亮点在线发布配置中心2.0)
·LvHtmlView 2.0(亮点源码查看器2.0)
·LvUrlCode 2.0(亮点网址编解码器2.0)
安装说明1、前提:您的电脑必须安装 .Net Framework1.1 框架.
[
点击下载.Net Framework1.1]
2、软件一直坚持自带配置文件,安装及使用过程不操作注册表及系统文件,完全绿色免安装软件,直接解压软件包即可使用。
软件功能详细说明LvSpider 2.0(亮点采集器2.0)LvSpider2.0版本比在1.0版本上介面上做了很大的改动,添加了规则目录树,区分运行区、任务文件夹等,介面看起来更舒服,而且增加了很多新的功能,具体功能如下:
一、“文件”菜单
1.“查看结果”,“清空结果”:即用户采集完数据后,如果有设定规则里的“启用数据库保存”,此时“查看结果”就是查看采集后保存在数据库里的数据.
2.“查看历史记录”与“清空历史记录”:即用户采集后的内容URL地址(也就是1.0版本中的地址库,当时没有查看功能),用户可以对其进行数据的查找与删除,其中查找可以时间查找,时间精确到分钟,此功能有利于用户是否要重复采集内容,进行的操作。
二、“视图”菜单
1.“工具栏”:显视与隐藏软件介面上的工具栏。
2.“状态栏”:显视与隐藏软件介面上的状态栏。
三、“文件夹”菜单
1.新建
2.重命名
3.删除
四、“任务”菜单
1.开始、暂停、停止
2.新建、编辑、删除
3.复制、粘贴
4.导入、导出:即用户可以将自己编辑好的任务规则,以文件的方式导出或导出,给其他用户共享或使用。
五、“设置”菜单
1.“HTML标记”:作用于用户编辑规则里的“标签”时,用户可以选取要保留或排除的HTML标签的选项,在这里主要是让用户扩展其可使用的HTML标记。
2.“网站编码”:就是采集网站或提交网站,所使用的字符编码,作用于作用于用户编辑规则里用户可以自己选择“网站编码”在这里主要是让用户扩展其可使用的网站编码。
3.“时间格式”:作用于用户编辑规则里的“标签”时,用户自定义数据里的“系统时间”,在这里主要是让用户扩展其可使用的时间格式。
4.“爬虫标记”:作用于“选项”下的“选择爬虫,就是让采集器伪装成Baidu蜘蛛,GOOGLE蜘蛛等搜索引擎爬虫进行采集,让对方的站以为是收搜引擎在收入他的站,防止IP等被屏蔽,在这里主要是让用户扩展其可使用的爬虫标记。
5.“文件扩展名”:作用于编辑规则时“启用保存为本地文件”如"*.html,*.txt",让其生成的文件为指定的扩展名,在这里主要是让用户扩展其可使用的文件扩展名。
6.“选项”设定软件的相关功能,如是否开启托盘图标,采集后关机的方式,采集所使用的相关组件,及设定采集时用的爬虫。
六、“工具”菜单
1.在线发布器:用户采集完数据后,保存在本地数据库里的数据进行二次发布。
2.任务调度器:也就是计划任务,用户设定好规则与运行的时间就可以定时采集。
3.源文件查看器:查看网站上的HTML数据。
4.网址编解码器:对URL地址进行编解码。
5.发布模块编辑器:新增与修改在线发布模块。
6.在线发布配置中心:配置要发布的网站格式与数据 。
七、“帮助”菜单
1.软件注册
2.在线帮助
3.亮点论坛
4.关于亮点
八、工具栏(按工具栏顺序)
1.开始任务、暂停任务、停止任务
2.新建任务、编辑任务、删除任务
3.选项设置,关于我们,在线帮助
4.所有任务完成后关机、退出程序
九、文件夹目录树
用户可以直接用鼠标进行托放操作,其鼠标右建也带有(1.新建 2.重命名 3.删除)等文件夹操作功能
十、任务列表
显视当前任务状态,总共要提取的列表地址(启始地址),当前已完成的列表地址,当前提取的内容地址数,已完成的内容地址数,重复采集数,发布成功及失败数,采集任务所用的时间长度,及上次运行的时间.
十一、任务编辑功能
在1.0版本的基础上做了不少的改动,
1.新增了备注说明
2.开启调式模式此功能在采集时可以输出更多的有用信息如错误信息。
3.列表地址与内容地址功能做了一些改动,支持正则(*)匹配与排除。
4.标签循环匹配新增,即每个匹配的方式“使用分隔符分开”,“添加为新记录”,“论坛新贴与回复”
5.下载附件新增随机文件名
6.HTML标签排除与保留
7.加入用户定义保存的数据库路径
8.在线发布做了一些改动,注:当用户 选择“标签循环匹配”下的“论坛新贴与回复”,这里的发布配置只能有一项。
十二、
在软件菜单上新增了,快捷键方便用户的键盘操作,
以下的新增加的辅助软件LvPoster 2.0 (亮点在线发布器2.0) 此软件是为了采集后数所进行二次发布时使用的,用户采集完数据后,保存在本地数据库里的数据进行二次发布,当然用户也可以将采集后的数据共享给他用户进行二次的发布,都要利用到这个软件的。
一、“文件”菜单
1.“选择本地数据库”:选择要发布的数据库对像.
2.“获取Cookie”:提取发布的网站Cookie。
二、“视图”菜单
1.“工具栏”:显视与隐藏软件介面上的工具栏。
2.“状态栏”:显视与隐藏软件介面上的状态栏。
三、“发布”菜单
1.开始、暂停、停止
四、“帮助”菜单
1.在线帮助
2.亮点论坛
3.关于亮点
五、工具栏(按工具栏顺序)
1.开始任务、暂停任务、停止任务
2.关于我们,在线帮助
3.所有任务完成后关机、退出程序
LvScheduler 2.0 (亮点任务调度器) 亮点任务调度器也就是计划任务,用户设定好规则与运行的时间就可以定时采集。
一、”文件“菜单
1.选项:设定任务调度器启动时是否最小化,与开机后是否自动启动任务调度器。
二、“视图”菜单
1.“工具栏”:显视与隐藏软件介面上的工具栏。
2.“状态栏”:显视与隐藏软件介面上的状态栏。
三、“计划”菜单
1.新建、编辑、删除
2.停止
四、“帮助”菜单
1.在线帮助
2.亮点论坛
3.关于亮点
五、工具栏(按工具栏顺序)
1.新建计划、编辑计划、删除计划
2.关于我们,在线帮助
3.退出程序
六、计划编辑
用户可以按,每天,每周,一次,每隔N分来进行任务的运行,指定它的启动时间,运行时段,以及每星期几的运行。
七、其他
软件介面以列表方式显视其当前的计划任务运行情况,及下一次启动的时间、运行时长,在状态栏下显视CPU内存使用情况外,还有软件运行的时长。
LvPostModuel 2.0(亮点发布模块编辑器2.0) 新增与修改在线发布模块,在原1.0版本以数据库方式保存,在2.0上改成了文件保存方式,这样方便用户的文件共享。
一、论坛回复模块
这个是配合用户在设定当用户 选择“标签循环匹配”下的“论坛新贴与回复”时使用的,当采集软件循环到第二匹配时,将配到的数据做为第一循环的跟贴,在这里当然论坛回贴要取得跟贴的ID及其他数据,所以“论坛回复标签”就是做用于在此了。
二、标签参数
用户可以自己加载用户设定的规则下的“保存为本地数据库”里的字段做为标签参数。
三、错误标记更改为多种错误的标记。
LvPostSetting 2.0(亮点在线发布配置中心2.0) 亮点在线发布配置中心2.0功能是为配置要发布的网站格式与数据,功能上与1.0的发布配置基本上是一样的。
LvHtmlView 2.0(亮点源码查看器2.0) 亮点源码查看器2.0功能查看网站上的HTML数据,有些HTML数据在IE看不方便,借助此软件模拟爬虫,来源页面,及发送自定义的数据进行提取所需的HTML源码,还有查找字符串的功能。
LvUrlCode 2.0(亮点网址编解码器2.0) 亮点网址编解码器2.0对URL地址进行编解码,有些在HTML源码里的数据是编码过的,或自己想编码(解码)指定的网址,都可以利用这个软件进行编解码。