作者:百度 来源:百度空间   酷勤网收集 2008-04-06

摘要
  题目描述:你尝试过在百度上使用site inurl语法查询吗? 如果还没有的话可以试一下,如输入 site:www.baidu.com inurl:new 则会搜出所有在www.baidu.com站点上的包含"news"子串的url。现在我们有两份数据,一份是site_inurl.txt 一份是url.txt...

题目描述:


你尝试过在百度上使用site inurl语法查询吗? 如果还没有的话可以试一下:)

如输入 site:www.baidu.com inurl:news

则会搜出所有在www.baidu.com站点上的包含"news"子串的url。

现在我们有两份数据,一份是site_inurl.txt 一份是url.txt

site_inurl.txt中每行是一个site inurl语法组成的查询串,url.txt中保存的是url列表。

你能否在url列表中找出所有能被site_inurl.txt中的查询串检索到的url?


如site_inurl.txt内容如下:

site:www.baidu.com inurl:/more

site:zhidao.baidu.com inurl:/browse/

site:www.sina.com.cn inurl:www20041223am


url.txt内容如下:

http://www.baidu.com/more/

http://www.baidu.com/guding/more.html

http://www.baidu.com/events/20060105/photomore.html

http://hi.baidu.com/browse/

http://hi.baidu.com/baidu/

http://www.sina.com.cn/head/www20021123am.shtml

http://www.sina.com.cn/head/www20041223am.shtml


则你的程序运行完输出的结果应该为:

http://www.baidu.com/more/

http://www.baidu.com/guding/more.html

http://www.sina.com.cn/head/www20041223am.shtml


程序以命令行形式传入这两个文件名,第一个参数为site_inurl文件对应的文件名,第二个参数为url列表对应的文件名,程序的输出请输出到标准输出。

来自:http://hi.baidu.com/astar/blog/item/3a17728baf934b13c8fc7ae8.html

分类: IT竞赛比赛 培训考证

上一篇:2006年百度之星程序设计大赛总决赛题目   下一篇:2007年百度之星程序设计大赛初赛题目:实习生小胖的百度网页过滤器