作者:车东 来源:车东[Blog^2] 酷勤网收集 2008-04-15
摘要
用户数量1万人,每人平均有20个RSS(每个人有5-100个RSS) FEED(总计有10万个不同RSS,想办法从谷歌博客搜索上搜集一下); 更新频度:所有FEED平均每天至少2次,其中热门FEED每小时同步一次(占5%);估算一下存储量,访问速度和RSS解析(SimplePie)的容错问题等。
如果你在实习:可以考虑以下这个题目(一个月内学习并完成)
一个每天十万级访问的RSS阅读器(每秒2处理完成个请求);
用户数量1万人,每人平均有20个RSS(每个人有5-100个RSS) FEED(总计有10万个不同RSS,想办法从google blogsearch上搜集一下);
更新频度:所有FEED平均每天至少2次,其中热门FEED每小时同步一次(占5%);
估算一下存储量,访问速度和RSS解析(SimplePie)的容错问题等。
基于LAMP平台+MemCached ,目前我们的PHP开发编辑器是: Komodo Edit 服务器端直接用vim编辑;
版本控制是Subversion/SVN和Windows客户端 TortoiseSVN
Windows下的远程登录是PuTTY
大部分操作都是在Linux命令行下操作,所以awk / perl/ grep之类的需要能够熟练到代替简单的过滤排序等SQL操作;

