站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
▼
建站程序
开发
服务器
办公软件
开发教程
▼
服务器教程
软件使用教程
运营教程
热门电子书
▼
CSS教程
WordPress教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
热点词条
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
采集
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
'''采集''',这里的采集指的是[[网站]]内容的采集,故又称为:网站采集。网站采集是一种网站内容编辑模式。采集是复制粘贴的升级,指利用工具,按照一定的规则,定时或一次性批量的复制其他网站的内容。采集一般的步骤是设置采集规则,采集目标网站,然后程序去自动抓取内容,写入网站数据库。采集与[[离线浏览器]][[下载]]不同,离线浏览器只是把网站所有的内容下载到本地硬盘,而采集只抓取有用的内容,然后一般是写入网站[[数据库]],和网站是一体的,就像是一个机器人自动的为你的网站添加内容。 ==采集的方式== 采集一般用如下方式: ===CMS自带采集系统=== 目前国内几大[[CMS]]系统都自带采集模块,例如 [[PowerEasy|动易]] [[帝国CMS]] [[DedeCMS]]等等。 ===第三方采集软件=== 有些专门开发的采集软件,典型的有[[火车头]]采集器。 ==采集的优缺点== 优点: *自动添加网站内容,维护成本低 *可在短期内迅速增加网站内容 缺点: *涉及版权问题。目前国内对这方面不重视,但是采集就是对所采集网站的劳动成果的窃取,如果一个网站一直依靠采集是无法发展壮大的 *服务器消耗资源大。如果是用CMS自带模块进行采集,采集之后生成静态页面,资源消耗是非常厉害的,所以不少主机商是禁止采集的。 *大量重复内容,容易被[[搜索引擎惩罚]] *可能遭到所采集网站的各种报复,例如起诉,攻击等等。 ==采集的版权及道德问题== *采集一般侵犯了对方网站的版权 *采集增加了对方服务器的资源消耗,如果对方是个人网站,使用的是虚拟主机,很可能引起资源消耗太大,被主机商关闭[[空间]] *采集窃取了对方的劳动成果,并且在搜索引擎等地方与对方形成竞争关系 [[category:采集|C]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)