网站分析

来自站长百科
跳转至: 导航、​ 搜索

网站分析 (Web Analytics) 是种网站访客行为的研究。于商务应用背景来说,网站分析特别指的是来自某网站搜集来的资料之使用,以决定网站布局是否符合商业目标;例如,哪个登陆页面比较容易刺激顾客购买欲。

这些搜集来的资料几乎总是包括网站流量报告,也可能包括电子邮件回应率、直接邮件活动资料、销售与客户资料、使用者效能资料如点击热点地图、或者其他自订需求资讯。这些资料通常与关键绩效指标比较以得效能资讯,并且可用来改善网站或者行销活动里观众的反映情况。

网站分析简介[ ]

网站分析(Web Analytics)主要指的是基于网站的用户浏览行为和网站运营状况,对网站的点击流数据和运营数据进行分析,以监控网站的运营状况,实现网站的优化。

网站分析从用户的行为角度进行分析,充分体现了“以用户为中心”的理念,对提高网站的质量和用户体验提供了有效的决策依据。

网站分析的价值主要体现在:通过统计网站日常的PVUV,监控网站的运营状况;通过转化率Bounce Rate等指标优化网站的交互流程和页面设计;

通过分析用户的行为帮助网站定位目标市场和目标用户,实行有针对的推广策略,尤其对于电子商务类网站价值明显;通过来源和搜索关键词分析优化SEOSEM策略。

网站分析技术[ ]

目前有两种主要收集网站分析资料的技术手段。第一种方法,即所谓"网站日志分析"──即读入服务器纪录其所有交易的日志进行处理。第二种方法,加网页标签──利用插入Javascript于每一页来告知第三方的服务器某页被网页浏览器所读取。

日志分析[ ]

市面上各家网页服务器自发展初随时都会纪录其所有的交易于一个日志档里头。这种特性不久就被网管意识到可以透过软件读取它,以提供网页流行度的相关资料;从而造成网站日志分析软件的兴起。

90年代早期,网站统计资料仅是简单的客户端对网站服务器请求 (或者访问) 的记数值。一开始这是挺合理的方法,因为每个网站通常只有单一个[HTML]档案。然而,随着图形进入 HTML 标准,以及网站扩增至多重 HTML 档案,这种记数变得没什么帮助。最早真正的商用日志分析器于1994年由 IPRO 发行。

90年代中期,两种计量单位被引入以更准确的估计人类于网站服务器上的活动总数。它们是网页点阅数(Page Views) 以及访问量 (Visits,或者节区Session)。一次的网页点阅数定义为客户端对服务器提出某单一网页读取请求,恰好为对某一图形请求的相反;而一次的访问量则定义为来自于某一唯一已识别的客户端对服务器一连串请求直到闲置一段时间──通常为30分钟为止。网页点阅数与访问量仍旧在报告上十分常见,不过现今它们被当作是过于简单的量度。

90年代末期,随着网络蜘蛛与机器人问世,伴随着大型企业以及互联网服务提供商使用代理服务器与动态指定IP地址,鉴别某网站单一访客变得更困难。对此,日志分析器以指定Cookie作为追踪访问量的对策,并忽略已知的蜘蛛机器人的读取请求。

网页快取的广泛使用也造成日志分析上的问题。如果某人再度造访某页,第二次的读取请求通常由网页浏览器快取达成,因此网站服务器端不会接受到此请求。这意味着该访问者浏览过该站的“足迹”丢失。快取与否可于设定网站服务器时克服,不过这可能导致降低该网站的效能。

加网页标签[ ]

由于对日志档案分析于快取存在下准确性的关注,以及渴望能实现把网站分析当作是种外包的服务,导致第二种资料收集方法:加网页标签,或称网虫(Web bug) 的出现。

90年代中期,网页计数器已经普及──这些计数器以包含在网页中的图像出现,显示多少次该图像被读取过。而图像内容就是显示大约该页被拜访次数的数目。90年代晚期,这种做法延伸至包括一个微小不可见图像,而非可见的。并且,透过 JavaScript,图像请求的某些关于网页和访客的讯息被传递到第三方服务器方。这些资料随后被网站分析公司处理并产生详细的统计资料。

网站分析服务也代管指定cookie到使用者的过程。这种方式可以鉴别各个唯一访客初次以及随后的拜访。

随着Ajax为主解决方案普及,一种利用不可见图像的替代方案实现了从读取页面“回电”服务器的机制。在这个情况下,当某网页被网页浏览器读取,该页某部分Ajax 代码将致电回服务器并递送有关用户端的资讯,随后被送到网站分析公司做汇整。这在某些方面还是有漏洞,因为某些浏览器限定哪种XmlHttpRequest物件可与服务器联系。

网站日志分析与加网页标签的比较[ ]

网站日志分析与加网页标签两者都已经很成熟可供有意公司进行网站分析。在许多情况下,同一家网站分析公司甚至同时提供这两种方法。那问题便回到公司该选用哪种方法。两种方法各有优缺:

网站日志分析优点[ ]

网站日志分析较加网页标签为优的主要有下列几点:

  • 网页服务器一般已经产生日志档案,故原始资料已经存在。而透过加网页标签方式搜集资料网站得做些改变。
  • 网页服务器依靠每次网页需求与回应的处理发生。加网页标签依靠访客网页浏览器帮助。而占某些比例的浏览器可能达不到 (浏览器禁用 JavaScript 便是一例)。
  • 搜集来的资料位于公司自己的服务器,而且它是标准格式,而不是某种私有格式。这使得该公司日后要换它种分析程式,或者与其他程式整合,以分析过去历史资料变得容易。加网页标签方案可能遭服务商封锁。
  • 日志档亦包括来自搜寻引擎蜘蛛的访问资讯。虽然无法被归为客户行为的一部分,这些资料对搜寻引擎最佳化来说很重要。
  • 日志档亦包括请求失败的资讯,加网页标签只有纪录该网页成功被读取时的事件。

加网页标签优点[ ]

加网页标签较网站日志分析为优的主要有下列几点:

  • 每当网页加载时 JavaScript 会自动执行。因此对快取顾虑较少。
  • 加入额外资讯到 JavsScript 比较容易。这些稍后可以被远端服务器搜集。举例来说,访客的屏幕大小,或者购买的商品单价。而网站日志分析,网站服务器无法正常的搜集到的资讯只可透过改变网址来搜集到。
  • 加网页标签可回报对网站服务器不发生请求的事件,例如与Flash影片片段间的互动。
  • 加网页标签服务管理了指定cookie给访客的过程;至于日志分析,服务器得特别设定才能达成。
  • 加网页标签能帮助没有自己网站服务器的某些中小公司。

经济因素[ ]

网站日志分析大部分总是在公司内部进行;加网页标签也可以,但它以第三方提供的服务方式更为常见。介于这两种模式的经济方面差异亦常为公司考量采用因素。

网站日志分析传统包括一次性软件购买。然而,许多软件商也采用最大年度网页浏览数为主的、处理额外资讯额外付费的计价方式。

加网页标签大部分采月费模式,虽然某些厂商提供安装加网页标签不另收网页浏览数费用的方案 (例如 Google Analytics)。

至于哪种方案比较便宜常常取决于公司内对此道技术专精程度、选择哪家厂商、欲对网站活动了解程度、欲对资讯型态了解深度、以及个别网站本身对统计资料的种种需求而定。

网站分析的基本度量[ ]

  • 点击(Hit)

一次对来自网页服务器上档案的请求。只有在网站日志分析才有。网站有多少点击量通常用来声称该站流行度,不过该数目极度的使人误解并且戏剧性的过度高估其流行度。

单一网页通常包括多重 (通常一打) 个别的档案。每个档案随网页的下载亦被记入点击,故点击量实际是个过度武断的数字,它反映了个别网页的复杂度,而非实际上的流行度。访客总数或者网页点阅数提供更实际与正确的流行度估计。

  • Page Views

即PV,页面浏览数,页面被打开(请求)的次数,是网站分析中最常见的度量。注意Ajax架构或Flash下同一URL下可以浏览多个页面,进行多个操作,这些都无法在PV中体现。还需要注意Unique Page的定义,当一个页面被刷新多次时,其实用户浏览的始终是同一页面,所以这时的Unique Page Views还是1。

  • Visits

访问量,也是常见度量之一,用于衡量用户的一次访问(从打开进入网站到离开网站,其中可能浏览了多个页面(PV))的数量,也就是网站Session的个数。

  • Unique Visitors

UV,被用于标识访问网站的唯一用户数,注意一个Unique Visitors可能会有多个Visits。

  • 首次访问 / 首次节区 (First Visit / First Session)

一次来自从未曾造访过访客的访问。

  • 重复访客 (Repeat Visitor)

某访客至少有一次先前造访纪录。介于现行与最近造访期间被称做访客崭新度 (visitor recency),它以天计算。

  • Time on Page

页面停留时间,即用户从打开页面到离开页面的时间间隔,这个度量一般只有当用户在你的网站中点击了下一个页面时才会有记录,否则是0,所以所有Visits的最后一个页面的Time on Page一般都为0。所以在计算页面平均停留时间(Avg. on Page)的时候一般会过滤Time on Page=0的记录。

  • Time on site

即每个Visits的停留时间,一个Session的开始到结束。跟Time on Page同样需要注意其计算中存在的误差,取平均的时候注意过滤长度为1的session。

  • Bounce Rate and Conversion Rate

关于Bounce Rate ,有一句很形象的描述——“I came, I puked, I left.” ,进入网站,什么事都没干就直接离开了,即用户该次访问的浏览页面数为1,或者用户该次访问的停留时间小于10秒或5秒。

如果一个访问没有Bounce,那么就可以跟踪其访问足迹统计Conversion Rate,即从上一步进入的访问率(Current Visits/ Previous Visits)。转化率对于某些网站的关键流程的优化可以起到重要作用,比如电子商务网站的购买流程等。

  • Entrances and Exit Rate

Entrances一般用户衡量网站首页或Landing Page的进入情况,指First Page of Visits。Exit Rate可以作为每个页面的基本度量,衡量从该页面离开的比率,即该页面是整个Visits的最后一个页面。

网站分析方法[ ]

Cookie的问题[ ]

在历史上,加网页标签分析解决方案供应商已经使用了第三方的 Cookie,就是 Cookie 是由供应商网域送出而非点阅网站本身的网域。第三方的 cookie 可以处理越过公司内部多重无关网域的访客,因为 cookie 总是由供应商服务器处理。

然而,第三方 cookie 在原理上允许穿过不同公司网站追踪个别使用者,这让分析供应商能从某些客户合法授权保留资料的网站活动萃取个人资讯,以帮助该用户认为他是匿名浏览的其他网站做活动分析。虽然网站分析公司否认干这档事,其他公司像做网站广告条幅公司已经这样做了。对cookie隐私的关注因此导致显著的少数派使用者屏闭或者删除第三方的cookie。

大部分加网页标签解决方案供应商现在转移至提供至少使用第一方cookie (cookie由被访问网站子网域指定) 的选择方案。另一个问题是 cookie 删除。当网站分析依靠 cookie 来鉴别唯一访客,统计资料便依靠持续存在的 cookie 作为容纳唯一使用者辨识码的载体。当使用者删除 cookie 时,他们通常同时删除第一方与第三方的 cookie。如果这件事在与网站互动的时期发生,使用者将在他们下次互动点被视为首次访客。没有持续存在与唯一的访客识别码,转换率、点击流分析、以及其他随时间依靠唯一访客活动的变量系统,不可能正确。

Cookie 常用是因为 IP 地址对使用者而言并不一定是唯一的,并且它可能与很大的一群机器或者代理服务器分享。其他识别唯一使用者的方法技术上具有挑战性,并且可追踪的观众有限,或者可视为不可靠的。Cookie 会被选上是因为,排除使用某些科技如间谍软件之外,它有着门槛最低的共通来源。

活动追踪,唯一登陆页与引荐页间的比较[ ]

于大部分网站分析包里透过外部网站引荐的广告关系产生活动数量的追踪报告显著的比利用登陆页面来得不准确。 引荐页是不可靠的资讯来源其原因如下:

  • 它们可能是或可能不是由网页浏览器所提供。
  • 它们可能是或可能不是由网页服务器所纪录。
  • 它们可能被网页浏览器有意的扰乱过,以达成使用者希望匿名浏览的目标。
  • 它们可能被重定向扭曲或者隐藏,不管有意或者无意。

网站分析步骤[ ]

正确的网站分析方法,可以在最快的时间内了解一个网站的整体结构状态,为了下一步展开优化计划进行信息准备。当我们开始分析一个网站的时候,我们首先要经过第三方的手段进行网站的外围分析,这其中具体包括:收录情况、大体流量以及流量趋向、参考排名、外链结构、同类网站对比等等。

有了以上的数据,我们可以对与网站有一个初步的了解,了解以上的资料以后,就可以进行网站的内部分析了,这其中具体包括:网站内容结构、层级结构、内链结构、前端代码结构、关键词部署情况等等。

外围分析[ ]

1.收录情况:网站在搜索引擎的收录情况往往能够直接反映网站在搜索引擎数据库中所被收录的数据量,这个量化概念自然就可以想像到网站在搜索引擎当中的表现了。

如何得到这个收录情况呢?搜索引擎支持的高级搜索功能当中就包含这个功能,在搜索引擎当中输入“site:yoursite.com”,使用这种搜索方式就可以查询到网站在当前搜索引擎当中被收录的数量,就在搜索结果页面的右上方,有一个页面总和,不同的搜索引擎收录结果也不一样,所以要针对你所要优化的针对引擎来分析。

2.大体流量以及流量趋势:网站的大体流量可以通过第三方统计工具提供的数据来进行分析,如果得到权限就可以参考网站申请过的数据统计服务,如果没有权限可以参照Alexa提供的网站分析系统,但是数据会有一定的出入,只能做为大体参考。

网站的流量趋势根据几个阶段进行分析,全年阶段的流量数据变化、月流量数据变化、多周数据变化。根据整体的数据流量变化趋势来分析网站的目前状况,结合网站的更新历史和调整时间点来看流量变化,有变化异常的地方需要标注出来并查出造成趋势异常的原因。根据流量的折线图来找到网站的流量规律,全年流量重心、特殊日期流量重心以及周流量规律。

3.参考排名:参考排名主要是要对当前网站在网络上的排名有一个大体概念,目前网络排名还是依靠Alexa网站的排名指数,但是需要提醒的是,该网站提供的排名由于算法考虑并不是很完善并且有着其他因素的影响,排名尽供参考。另外。你需要针对同类别网站的排名进行分析,仔细分析你的对手,才能够增加自己的分析经验。

4.外链结构:外部链接结构指的是网站的导入链接结构和数量,外链结构的强大可以增加网站的权重并带来一定的流量,但是外链不是越多越好,要注意外链的质量。

如何查询外链呢?在搜索引擎当中输入“link:yoursite.com”,这样的搜索方法可以得到网站在相关搜索引擎当中被收录的导入链接数量和导入链接列表。分析列表当中的网站,就可以得到网站的反链增加策略,更有效的来调整优化方案。

5.同类网站对比:古人有云,知己知彼,百战不殆。得知对手的策略和有效方案,更能够让你在竞争对手当中合理调整自己的策略,分析对手和同类网站的多项数据对比绝对是必要的。对比方法根据需要优化的方向来进行数据分析。

内部分析[ ]

1.网站内容结构:网站的内容构成有很多种,你要看你是属于那一种网站,交互类、咨询类、商务类、内容类等等,根据不同的构成来确定网站的优化方案是很必要的,如:如果网站是内容类的,对于网站内容的丰富和扩展就是很有必要的,突出网站的内容特点调整合适的关键词策略;如果网站是交互类的,引导用户的咨询分类和调整交互的有效信息版面结构就是很重要的。

2.层级结构:网站都是有一个层级的概念,如果我们把网站看做一棵大树,那么网站的层级结构就是枝干,我们把从根部到枝干的路径清晰简捷,并且枝干间的连接通畅,就能把网站的结构拉向扁平化,这样更有利于蜘蛛的爬取。

3.内链结构:内链结构指的就是网站的内部链接相互结构,强壮的内链结构可以造成网站链接多而不乱,有序拉平网站层级的效果。

4.前端代码结构:通过查看页面源码来分析网站的前端代码结构,包括CSS、JS等等,并且要分析这些代码结构是否合理,如何优化内容和代码的比例等等。

5.关键词部署:分析网站的核心关键词和辅助关键词,并且通过查看网站的Meta属性、Title属性、网站内容结构等等来检查这些关键词部署是否合理。

常用网站分析工具介绍[ ]

  • Google Analytics:被称为目前最好最著名的免费网站统计和解析工具。它尽可能提供一切你求之不得的数据。主要优点是没有任何限制。
  • W3counter:这是另一个强大免费的网站统计和分析利器。该网站提供了一揽子常见的统计分析功能:网站总访问数和页面访问数、 Feed 状态分析、访问者地区,访问者用的系统、浏览器、屏幕分辨率。
  • Addfreestats:它可以媲美 Google Analytics 。但它要求你放置它们的图标并链接到它的网站。
  • StatCounter:很受欢迎的免费统计和分析工具,缺点是分析日志的上限是 100 条。
  • Reinvigorate:特点是数据的图表分析非常直观。

国内的统计工具如:CNZZ51la百度统计

相关条目[ ]

参考来源[ ]