首页 > IT业界 > 正文

Google新索引系统Caffeine领先业界

2010-06-10 11:56 来源:cnBeta

      Google公司的软件工程师格里梅斯(Carrie Grimes)周二(6月8日)在Google的官方博客中宣布,Google已经开发出速度更快、检索结果更准确的新型网络内容索引系统 Caffeine。

      格里梅斯在博客中写道,当前Google使用的索引技术相比,Caffeine检索结果时效性会提高50%。无论是网络新闻,还是博客文章以及论 坛发帖内容,一旦这些内容发布,Caffeine将能马上收录这些内容的相应链接。

Google的老式索引系统采用了多层技术,那种情况下部份索引层的内容更新快于其他层面;主索引层通常是每隔数周更新一次。如果要更新其中的某个索引层,就是必须对整个互联网进行分析。如此一来,网民所搜索到的结果,与互联网的实际内容之间会有一个时间差。 

      Caffeine技术将互联网划分为不同的部份,然后对不同部份内容在全球范围内进行持续的升级。一旦发现了新内容,就将其添加到当前索引当中。这就是说,你在使用Google搜索过程中,所获得的结果与互联网实际内容的时间差已经非常小。 

      Caffeine技术也可以实现对网络内容索引的规模化。格里梅斯称,Caffeine每秒钟可同时处理数十万个网页。如果这些网页是现实生活中的纸张,则这些纸张每秒钟将堆成3英里高。Caffeine在一个数据库中可处理近1亿GB的存储信息,且每天存储信息量都在大幅增长。你需要使用62.5万部容量最大的iPod音乐播放器才能存储这些信息,如果将这些iPod并排放置,则可长达40英里。 

      去年8月期间,Google首次对外公布了Caffeine的部份技术细节。Google开发Caffeine的主要原因是:应对来自微软必应(Bing)、“知识引擎”Wolfram Alpha等竞争对手的挑战,以保持Google在搜索引擎技术产业的领先地位。 

      Caffeine不仅仅提高了网络索引的时效性,而且使组建性能更强大的搜索引擎成为可能,籍此向网民提供质量更好的搜索服务。

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected]