据《纽约时报》报道,雅虎周二宣布剥离数据分析服务Hadoop,与硅谷风投公司Benchmark Capital合资组建一家名为Hortonworks的公司,负责继续开发该技术。在雅虎最近的重组业务努力中,成功的例子少之又少。但Hadoop却是个例外,至少在硅谷工程师眼中,该公司在开发负责管理大量信息的免费软件Hadoop的作用不容抹杀。
该技术在facebook、eBay和Netflix等大公司中获得迅速发展,被用于分析海量数据,但对雅虎在财务上没有多大贡献。雅虎是在2005年投资开发了Hadoop的早期原型,一年后将其用于数据中心的分析。
如今,Hadoop负责雅虎在线广告系统的定价和预测,过滤垃圾邮件以及个性化雅虎主页。以下数字更好地理解其处理数据的规模。雅虎有42000台服务器供Hadoop运行,服务器每4天存储的数据相当于整个美国国会图书馆的信息量。
雅虎云平台组高级副总裁杰·罗斯特(Jay Rossiter)在介绍Hadoop时,将其称为“基本上是雅虎运行的引擎”。雅虎和Benchmark Capital拒绝透露在Hortonworks上的投资和持股情况。
Hortonworks公司将有约25名职员,其中大多来自雅虎,其中前雅虎软件工程副总裁埃里克·巴尔德施维勒(Eric Baldeschwieler),将担任该公司CEO。