作者:长天暮鼓 来源:晨钟暮鼓 酷勤网收集 2008-03-13

有道昨天发布了其博客搜索的ping接口,而且在介绍文字中明确说明当你使用ping服务之后,有道阅读与有道博客搜索会在很短的时间内更新新文章。由此可以猜测,有道阅读与博客搜索应该是使用同一套爬虫系统。
其实这也很好理解,在线RSS阅读器与博客搜索的更新原因基本上是完全一样的,就是用爬虫去抓取 Feed,然后再进行相关处理。不知大家有没有注意到,如果在 WordPress 中设置了Google 博客搜索的 ping 地址,或者是 FeedBurner 的 ping 地址。这样在 Google Reader 中很快就能看到博客原生 Feed 与 FeedBurner 地址的更新。
说到这儿大家应该已发现,诸如 FeedBurner 这样的 Feed 烧录服务其实和前面提到的在线RSS阅读与博客搜索也完全可以公用一套爬虫系统。我不敢确定 Google 在收购 FeedBurner 后是否已经进行了这方面的统一,不过我相信未来一定会的。而如果掌握了上述的三种 Feed 工具,就牢牢掌握了现有 Feed 体系中发行渠道、接受终端、信息检索三个重要过程。这也就是为什么说 Google 在成功收购 FeedBuner以及 Reader 市场占有率越来越高情况下强大地有些可怕的原因。
从 Feed 技术的诞生到逐渐普及,过程还是比较漫长的,这当然也和每一种新技术一样。又特别是在国内,过程则更是漫长,目前也只能算是一个非常小众的应用。不过从大环境上讲,我觉得 Feed 应用在诸如 Google 等公司的推动之下,比然后进入一个高速发展的阶段。
而在国内,随着网易,腾讯等主流网络公司的介入,Feed 普及的速度也会更快。因此如果有一天,有道或者腾讯推出 Feed 烧录服务或者收购这方面的团队,丝毫不用感到惊讶。正如以前提到过,如果2年前大家还在说百度是中国的 Google,而现在我更愿意说有道更像 Google。

