个人工具
名字空间
变换
操作

SiteFactoryCMS:采集流程第一步

来自站长百科
跳转到: 导航, 搜索

导航: 上一页 | 首页 | DedeCMS | 帝国CMS | Drupal | PHPCMS | PHP168 | Xoops | Joomla | SupeSite

本节将以采集动易官方网站“公司动态”栏目为例讲解添加采集项目并进行信息采集的全过程。

如果您第一次接触采集功能,请认真阅读操作步骤及并理解相关说明,按以下步骤一一操作以建立所需采集的项目。

第一步:采集项目设置

依次点击“内容管理”->“采集管理”->“采集管理”功能链接,在出现的管理界面中,单击左侧管理操作导航中“添加采集项目”功能链接,系统出现“添加采集项目设置”管理界面,以设置所需新建的采集项目的名称、采集网站、编码等基本设置信息。

Sf541.jpg

重要参数说明:

·项目名称:填写自定义采集项目的名称(如“动易公司动态”)。

·对应本站栏目:点选设置所采集的数据保存到本站所对应的栏目节点名(如“文章中心”)。

·对应内容模型:点选设置对应栏目的模型(如“文章模型”)。

温馨提示:若后续在采集项目完成后,再更改了所对应的模型,系统将自动删除采集第三步所有字段的规则。

·采集网站:填写所需采集目标网站的名称(如“动易官网”)。

·采集URL:填写采集网页网址(以 http:// 开头,如“http://www.powereasy.net/Announce/index.html”)。

·编码选择:提供GB2312UTF-8Big5三种编码格式。国内的网站基本都是GB2312,若采集香港、台湾的网站请选择Big5编码,若采集海外网站则选择UTF-8编码(如“动易技术中心”选择“GB2312” 编码)。

·指定采集数量:指定采集的数量,不指定为采集全部数据。

·采集顺序:设置按倒序或正序方式进行采集(系统默认为倒序采集)。

·采集简介:填写本采集项目的简要介绍信息(如“动易官方网站动易公司动态信息”)。

设置好相关选项后,单击页面底部“下一步”功能按钮进行采集列表项目信息设置。

温馨提示:若目标网站的信息需要登录后才可查阅与采集,请参阅动易技术中心(http://tech. powereasy.net/)中的相关说明以进行设置。

留言