LeadWit CMS系统操作汇总

来自站长百科
跳转至: 导航、​ 搜索

导航:返回上一页


设置采集属性[ ]

采集站点名称为助记名称,你可以任意填写,

但要写得清楚明朗,使人一看就明白从哪里采集的

  • 设置采集站地址:

要正确填写你要采集站点的URL网址。 如要采集动网新闻系统里的文章,那么这里就设置http://news.dvbbs.net/,注意一定要带“/”

  • 设置采集列表页地址:

输入你要采集的有文章标题列表的页面的URL网址。

如要采集这一页“文章标题”下25篇文章,采集列表页地址就一定填: http://news.dvbbs.net/infoList/Catalog_6_1.html

  • 设置采集分类:

采集分类是归类名称,你可以任意填写


  • 设置采集到:

目前只要填写前两项,即:频道ID和栏目ID

选LZ8_Article表示采集到的内容入文章版块的栏目(栏目编号为你所填写的ClassID)中

选LZ8_News表示采集到的内容入新闻版块的栏目(栏目编号为你所填写的ClassID)中

  • 设置列表开始/结束字符:(这个比较关键,要查看“列表页”原代码)

就是要将要采集的列表的位置确定下来,缩小采集范围

如要采集刚才提到的DV的25篇文章,

列表开始字符:就是第一条(“全正则的检测IP是否合法的函数”)前的部分字符

列表结束字符:就是最后一条(“MD5算法研究(2)”)后的部分字符


  • 设置列表URL开始/结束字符(这个也比较关键,要查看“列表页”原代码)

将标题的所转向页面的URL地址用“列表URL开始字符”和“列表URL结束字符”确定下来,

如“自動化檢查 IIS 5.0 的安全漏洞“是<a href="../infoview/Article_2921.html">

则“列表URL开始字符”是 href="../

则“列表URL结束字符”是 "> ,这样就把URL确定下来了

自動化檢查 IIS 5.0 的安全漏洞“ 内容页URL地址就是

采集站地址(http://news.dvbbs.net/)+(infoview/Article_2921.html)“

  • 设置标题开始/结束字符 (这个也比较关键,要查看“内容页”的原代码)

随便打开一个内容页如(http://news.dvbbs.net/infoview/Article_2921.html)

用“标题字符”和“标题结束字符”将标题确定下来


  • 设置内容开始/结束字符 (这个也比较关键,要查看“内容页”的原代码)

仍旧在这一页(http://news.dvbbs.net/infoview/Article_2921.html)

用“内容开始/字符”和“内容结束字符”将标题确定下来


  • 其他的几项,从"列表开始字符"到"文章关键字",都是一样设置

最后按”设置”按纽保存。设置完毕


就开始采集[ ]

只要你按“开始采集”按纽就可以了,转到一些采集常数的页面,

你可以默认,这样采集完成后的数据就到了采集数据库(Collect.mdb)。

你还要点击“处理采集数据-》入采集库xxx”入库。

如果选“马上入库(不入采集库)”则数据直接进入了你所设置的文章(LZ8_Article)或新闻(LZ8_News)数据表中了

你可以打开“文章管理-》管理”或“新闻管理-》管理”查看,一定在里面。


就开始采集[ ]

不说了,自动进行。


参考来源[ ]