个人工具
名字空间
变换
操作

SiteFactoryCMS:采集过滤管理

来自站长百科
跳转到: 导航, 搜索

导航: 上一页 | 首页 | DedeCMS | 帝国CMS | Drupal | PHPCMS | PHP168 | Xoops | Joomla | SupeSite

采集过滤提供采集的内容页中的标题和正文中字符进行自动过滤的功能。如果采集项目中字段设置选择了此过滤项目, 系统采集录入该字段时会过滤采集过滤设置的内容。

依次点击“内容管理”->“采集管理”->“采集过滤管理”功能链接,在出现管理界面中,左侧管理操作导航中显示“添加采集过滤”、“管理采集过滤”功能链接。

添加采集过滤

左侧管理操作导航中显示“添加采集过滤”功能链接,出现“添加采集过滤”管理界面。左侧为测试文本框,可填写要过滤的测试内容,右侧用以设置过滤指定代码。

设置好相应选项后单击页面底部的“保存”按钮以保存设置。

重要参数说明:

·过滤名称:填写自定义的过滤名称。

·过滤指定代码:可设置为简单过滤和高级过滤二种类型。

>> 简单过滤:

点选“简单过滤”选项,在“要过滤的代码”和“要替换的代码”两个内容框中填写相应代码。如要过滤“法轮功”字样:“要过滤的代码”填写“法轮功”,“要替换的代码”什么都不填写,则系统会在采集过程中将标题或正文所有含有“法轮功”的字符过滤删除。

Sf545.jpg
>> 高级过滤:

点选“高级过滤”选项,在“要过滤的开始代码”、“要过滤的结束代码”和“要替换的代码”三个内容框中填写相应代码。高级过滤主要用于一段内容的替换,如过滤采集内容中广告。如要过滤以下代码:

<OBJECT classid=“clsid:D27CDB6E-AE6D-11cf-96B8-444553540000”
codebase=“http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=5,0,0,0” WIDTH=“750”
HEIGHT=“80”><PARAM NAME=movie VALUE=“http://xxxxxxxx/200505/10/17870_xxxxx-xxxx-ent-0511-75080.swf”>
</OBJECT>

则填写的开始代码、结束代码和替换代码为:

要过滤的开始代码:“<OBJECT>”。

要过滤的结束代码:“</OBJECT>”。

要替换的代码:“”(即什么都不填写)。

则系统会在采集过程中自动过滤采集内容页中的广告内容。

温馨提示:在设置好过滤设置后,可在测试文本框中填写要测试的代码,单击页面底部的“预览”按钮预览过滤的效果。

管理采集过滤

系统以分页列表的方式显示了采集过滤项目的ID、名称、类型和操作等信息。在“操作”列可对相应的过滤项目进行修改和删除的操作。页面下方提供了“批量删除选定采集过滤项目”功能按钮以方便批量删除采集过滤项目。

留言