自1987年从中国发出了第一封电子邮件以来,中国互联网产业的发展已有将近15年的时间。中国互联网市场也已发展为仅次于美国的全球第二大市场。网民规模已经超过1.3亿(CNNIC2007年报告),中文也成为了互联网第二大语言,在传统互联网产业(新闻、搜索引擎、电子邮件等)保持高速增长的同时,各类新兴的网络服务产业(如网络视频、WEB2.0、博客网)也风起云涌,丰富了互联网服务的应用领域。
网络的飞速发展也使信息共享和获取更加方便快捷。而具体如何将网站的信息进行统计汇总,从而作为我们进行决策的依据,一直是国内企业关注的焦点。但是,我们也应当看到在国内互联网市场高速成长的同时,相关网络流量的评估与分析工作却一直滞后。特别是缺少一个对网站流量进行综合排名的权威工整机构,使得中国网站长期依赖国外网站流量分析机构ALEXA(www.alexa.com)的统计数据。
所谓第三方网站流量排名服务,就是通过一个完全中立性的第三方平台对所有网站的流量进行监测,在利用自己的一套算法对网站流量进行评估统计,由此得出网站排名的先后顺序。网站流量的统计、排名、调查、分析和推广在国内早已有之,但却是混乱和极不规范的,不仅缺少一个统一的标准,大家也都按照各自的理解确定名词,因此大家在讨论和交流时就缺少必要的基础。国际上在这方面比较成功的案例是ALEXA。ALEXA是以发布世界网站排名而引人注目的一个网站,创建于1996年4月,1999年被亚马逊收购,他们的目标是让INTERNET冲浪者在分享虚拟世界的资源同时,更多的参与INTERNET资源的组织。作为一个商业单位,ALEXA的数据在国外也仅仅是作为一个参考,国外的企业更注重对流量的深入分析,而非简单的排名。但在中国,ALEXA的排名却长期被行业奉为圭臬,那么ALEXA适合中国的网站对于流量排名的需求吗?事实上,自2006年以来ALEXA的中国网站排名数据已经越来越被广泛质疑,其原因如下:
1、ALEXA对中国互联网了解不够
虽然互联网倡导“连接无极限”,但不意味着不会受到疆域或地域的影响。语言、文化、习俗、意识形态、经济基础等因素的差异,都会导致各地区网民的上网习惯、浏览取向、网上消费习惯的不同,最终体现为各地区网站流量的特点差异。例如:在国外非常普及的维基百科类网站,在国内基本局限于小众群体。而在国内拥有大量人气的纯社区类网站(如百度贴吧、天涯、猫扑等),在国外也远不如在国内那么有市场。再例如:国内网民的习惯“看文章、发表评论”,会经常出现一个网站因为发表一篇文章,导致流量大幅度增长,而在国外则很少会有这样的情况发生,所以做网站排名必须要结合本地特点来制定标准。而ALEXA对中国互联网的现状长期缺乏了解,也很少和国内互联网产业进行交流,在2007年8月,根据自身的标准,单方面大幅度降低中国地区网站的排名就是个明显的例子。
2、统计模式的先天不足
而在统计方法上ALEXA也存在明显的缺陷。对任何网站的统计一般有两种方法:一是客户端统计(我们称之为K统计)和因此得到的客户端排名(我们称之为K排名);二是网站端统计(我们称之为W统计)和据此得到的网站端排名(即W排名)。K统计的方式是在网民的电脑上安装一个统计插件,该插件可以自动记录网民浏览网页的行为,如登录哪些网站、打开哪些网页、打开网页的时间等,这些记录会自动被统计插件保存并发送到流量统计平台,该平台根据自身算法将所有网民终端发回的记录进行统计,计算出网站的流量排名。ALEXA就属于这类模式。由此可见,K统计是一种抽样统计方法,结果质量完全取决于安装统计插件的网民数量,由于在所有网民的电脑上都安装统计插件是无法在现实中完成的,所以统计样本(安装统计插件的网民)的地区分布和水平分布非常关键。W统计即网站端统计,是指在网站服务器端安装相应的统计软件,并记录所有客户的访问情况,对访问量进行统计分析。这两类方法在统计上都有自己的特点,但也各有局限之处。我们可以在如下几个主要方面做一个对比:
方法 评比方面 |
客户端统计( 统计) |
网站端统计( W 统计) |
真实访问流量 |
做抽样访问,只统计大致比例 |
能记录当天全部访问量 |
流量忠实度 |
能对流量忠实率进行统计 |
无法判断统计 IP 是否来自几个用户,或者不同 IP 是否代表一个用户,所以无法统计流量忠实率 |
对用户做跟踪分析 |
可以进行长时间跟踪分析,只要安装统计插件的用户在线 |
无法跟踪网民的访问行为,只记录当天访问记录 |
统计误差率 |
较低 |
高 |
由此我们可以看出,客户端统计的优势在于对访问量的深度分析,特别是对不同特征的网民群体做个性化分析方面(如商业用户群体),而网站端统计则在流量宏观统计上有先天优势。我们可以用一个形象的方式来说明两类方式的优势,假设在一个人声鼎沸的会场里,网站端统计可以统计声音分贝高低,而客户端则是分析不同人群主要说什么,如果这两类方式能结合使用,将会极大地提升网站流量排名的精确度和深度。