站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
▼
建站程序
开发
服务器
办公软件
开发教程
▼
服务器教程
软件使用教程
运营教程
热门电子书
▼
CSS教程
WordPress教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
热点词条
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
火车头
”(章节)
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
==系统特征== *'''规则自定义''' 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 *'''多任务,多线程 可以同时进行多个信息采集任务,每个任务可以使用多个线程。 *'''所见即所得''' 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。 *'''数据保存''' 数据边采集边自动保存到关系[[数据库]]中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。 *'''断点续采''' 信息采集任务可以在停止后从断点开始继续采集,从此用不再担心采集任务意外中断了。 *'''网站登录 ''' 支持网站[[Cookie]],支持网站可视化登录,即使登录时需要[[验证码]]的网站也能采集。 *'''计划任务''' 通过这个功能可以让的采集任务定时、定量或者一直循环执行。 *'''采集范围限制 可以根据采集的深度和[[网址]]的标识来限制采集的范围。 *'''文件下载''' 可以将采集到的[[二进制]]文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。 *'''结果替换''' 可以将采集的结果根据规则替换成你定义的内容。 *'''条件保存''' 可以根据某个条件来决定那些信息保存,那些信息过滤。 *'''过滤重复内容''' 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。 *'''特殊链接识别''' 运用此功能可以将用[[JavaScript]]动态生成的链接或其他更古怪的连接识别出来。 *'''数据发布''' 可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库([[access]], [[MSSQL|sql server]],[[my sql]],[[oracle]]) ,静态[[htm]]文件。 *'''预留编程接口''' 定义多个编程接口,用户可以在事件中利用[[PHP]],[[C#]]语言进行编程,扩充采集功能。
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)