模板:今日头条/2009年第17期

来自站长百科
跳转至: 导航、​ 搜索
Wutu.jpg

采集,这里的采集指的是网站内容的采集,故又称为:网站采集。网站采集是一种网站内容编辑模式。采集是复制粘贴的升级,指利用工具,按照一定的规则,定时或一次性批量的复制其他网站的内容。采集一般的步骤是设置采集规则,采集目标网站,然后程序去自动抓取内容,写入网站数据库。采集与离线浏览器下载不同,离线浏览器只是把网站所有的内容下载到本地硬盘,而采集只抓取有用的内容,然后一般是写入网站数据库,和网站是一体的,就像是一个机器人自动的为你的网站添加内容。

目前的采集方式一般有:“CMS自带采集系统”,如 动易 帝国CMS DedeCMS等;“第三方采集软件”,如比较知名的火车头采集器。