站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
▼
建站程序
开发
服务器
办公软件
开发教程
▼
服务器教程
软件使用教程
运营教程
热门电子书
▼
CSS教程
WordPress教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
热点词条
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
ECMS 6.6/使用采集
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
{{ECMS 6.6 top}} 每个系统模型都有自己的采集,无论是内置的还是用户自定义的系统模型,新闻系统有新闻系统采集,[[下载]]系统有下载系统采集等等。 下面讲解新闻系统模型的采集,其它系统模型采集基本雷同,用户可举一反三。 ==采集页面地址== 本例要采集的页面地址:http://www.phome.net/tmp/cjpage/list.html ==开始采集== 采集一般步骤: 1、增加采集节点; 2、预览采集正则是否正确; 3、开始采集; 4、对采集的数据进行审核并入库; 5、生成栏目及内容[[HTML]]页面。 ===增加采集节点:=== 1、登录后台->“栏目”>“采集管理”>“增加采集节点”; 2、“选择要增加采集的栏目”(选择终极栏目); [[文件:Cjexp1.jpg]] 3、“选择要增加采集的栏目”后进入增加采集节点页面; 4、打开要采集的列表页面:http://www.phome.net/tmp/cjpage/list.html [[文件:Cjexp2.gif]] 点击查看“源文件” [[文件:Cjexp3.gif]] 点击查看,列表页源代码为如下: [[文件:Cjexp4.gif]] 5、开始设置采集节点及列表页正则: (1)、输入节点名称:采集实例 [[文件:Cjexp5.gif]] (2)、采集页面地址:http://www.phome.net/tmp/cjpage/list.html [[文件:Cjexp6.gif]] (3)、由列表页的源代码:“<a href="page1.html" target="_blank">”,我们得出“内容页地址前缀”为:http://www.phome.net /tmp/cjpage/ [[文件:Cjexp7.gif]] (4)、设置“信息页链接正则”:由列表页的源代码得出。 图1:页面源代码 [[文件:Cjexp8.gif]] 图2:得出的信息页链接正则 [[文件:Cjexp9.gif]] 6、点击采集的内容页页面并查看源文件:http://www.phome.net/tmp/cjpage/page4.html 图1:内容页页面 [[文件:Cjexp10.gif]] 图2:内容页源代码 [[文件:Cjexp11.gif]] 7、设置内容页内容正则:(标题及内容正则) (1)、标题正则:由源代码内容我们得出“新闻标题”正则为: 图1:页面源代码 [[文件:Cjexp12.gif]] 图2:得出的标题正则 [[文件:Cjexp13.gif]] (2)、内容正则:由源代码内容我们得出“新闻内容”正则为: 图1:页面源代码 [[文件:Cjexp14.gif]] 图2:得出的新闻内容正则 [[文件:Cjexp15.gif]] 8、点击“提交”按钮即可增加节点完毕,整个表单最终效果如下: ===预览采集正则是否正确:=== 1、上面增加采集节点后,我们返回“管理节点”页面,如下: [[文件:Cjexp16.gif]] 2、点击“预览”采集,进入节点正则预览与验证: 图1:采集页面地址列表 [[文件:Cjexp17.gif]] 图2:信息链接列表 [[文件:Cjexp18.gif]] 图3:采集的内容页内容 [[文件:Cjexp19.gif]] 3、上面链接列表页及内容页内容预览无误后方可进行采集操作。 ===开始采集:=== 1、上面的采集节点正则预览无误后,我们返回“管理节点”页面: [[文件:Cjexp20.gif]] 2、点击上面的“开始采集”链接,开始进行采集; 3、采集信息完成后,系统会转向采集入库页面,如下: [[文件:Cjexp21.gif]] ===对采集的数据进行审核并入库:=== [[文件:Cjexp22.gif]] 即可完成入库操作: [[文件:Cjexp23.gif]] 管理栏目信息也可以看到我们刚才入库的信息: [[文件:Cjexp24.gif]] ===生成栏目及内容HTML页面:=== 点击“系统”>“数据更新”>“数据更新中心”,进入数据更新中心页面: 1、生成首页:点击“刷新首页”。 [[文件:Cjexp25.gif]] 2、生成栏目页:“刷新多栏目页面”选择“国内新闻”这个栏目,然后点击“开始刷新”。 [[文件:Cjexp26.gif]] 3、生成内容页:“按条件生成信息内容页面”: [[文件:Cjexp27.gif]] ===预览前台页面=== 首页: [[文件:Cjex28.gif]] 列表页: [[文件:Cjex30.gif]] 信息内容页: [[文件:Cjex29.gif]] 至此本实例讲解完毕。 ==常见问题== 1、提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in 答:你的采集正则变量名写错导致,请检查你的正则变量。 == 参考来源 == *http://www.phome.net/doc/manual/editor/ {{ECMS 6.6}} [[category:ECMS 6.6使用手册]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:ECMS 6.6
(
编辑
)
模板:ECMS 6.6 top
(
编辑
)