作者:何田 来源:鱼戏莲叶东—何田博客 酷勤网收集 2008-05-24
获得引擎长尾流量有两个途径:自然检索和付费检索,下面谈的是如何通过数据分析整体性地提高自然搜索流量的品质,思路同样可以应用于付费检索。
提升自然检索长尾流量的三个核心是增加收录、增加权重和提高搜索命中率,提高搜索命中率主要依靠网页标题(title)。
网页标题决定了搜索命中率,因此也就决定了b2c搜索流量的品质——对销售的促进价值。
许多b2c的网页title都是:原标题+匹配要素词,以尽量命中用户的搜索短语。例如大拿网的商品页title是这样的:SONY DCR-SR300E(SONY DCR-SR300E)数码摄像机报价 价格 驱动【DCR-SR300E】(大拿网) 。
凭什么确定“数码摄像机 报价 价格 驱动”这些匹配要素词呢?对于购物网站,“驱动”这个词来的流量有销售促进意义吗?
网页标题的优化,是获得高品质引擎检索流量的基础,如果b2c的标题编辑者有相当有商业洞察力和行业经验,并且肯在这上面花费大量精力,自然会获得优质长尾流量上获得超越竞争对手的优势。
如果没有这个条件,那么批量优化标题的匹配要素词,可能就是整体性提高检索长尾流量品质的最省心而有效的办法。其要点就是通过数据,而不是人眼观察、拍脑袋来选择匹配要素词。
下面是一个通过数据分析优化匹配要素词的简单流程。这个流程不需要任何开发,十分容易执行。
第一步:统计
所有网页装上Google Analytics统计代码。之所以用Google Analytics而不是51.la或者cnzz,是因为后两者缺乏关键信息。
第二步:分词及词频
把一个时期的所有搜索关键词组和短句,记录到一个txt文件。
用一个分词软件或服务,对该txt分词并计算词频,词频代表该词出现在搜索用语中的几率。
这样的软件和服务,在网上有很多。这里有一个免费程序:http://hi.baidu.com/%D3%A2%D3%EF%B4%CA%C6%B5/blog/item/416543a8cf220fb2ca130c62.html,分词不算太好,勉强可用。
第三步:分析
在Google Analytics的关键词分析中,采用“包含某词”进行搜索,检索出包含该词的所有关键词合在一起总的流量比率、平均访问页数、平均跳出率和平均停留时间。
这样我们就得到了这样一个列表:某某词,词频,流量比率、平均跳出率、平均访问页数、平均停留时间
结合历史带来的流量和百度指数(参考意义不大),先选出带流量能力较高的词。这些词中,有一些是跳出率很高、访问页数和停留时间很低的,对本站没什么意义,把这些词剔除掉。最后得到的词,就是较有效的匹配要素词,可以尽量自然地组合进网页标题中。
如果图省事,可以所有商品页采用同样的组合词,直接写到程序里即可。追求精细的话,可以根据不同的商品、商品类来引导编辑组合不同的词。
上述流程的核心是词频分析,通过对用户的搜索用语进行分词后进行词频分析,可以找到最常被用于组合检索的匹配要素词,词频高的,代表被用于组合检索的机会高。
我自己的实践体会是,在词频分析基础上再结合用户行为分析,很可能会发现原来完全想不到的优质匹配要素词,否定原来肉眼观察出来的以及同类站常用的一些词。
这些优质匹配要素词的采用,对于提高访客平均跳出率、平均停留时间、订单转化率等流量品质指标,有相当的帮助。
上述流程不需要编程即可实现,但数据来源的缺点也很明显:很多本站没有出现过的匹配词,无法发现。
解决办法以后讨论。

