ITBear旗下自媒体矩阵:

连破四项世界纪录 阿里云重证技术名

   时间:2015-10-29 13:57:52 来源:搜狐科技编辑:星辉 发表评论无障碍通道

关于阿里云技术能力的误解,很多。

从阿里巴巴的角度,业界对俗称BAT的三巨头有这样的认知:阿里的运营,腾讯的产品,百度的技术。这种认知一度产生了对阿里云的错误判断:阿里云有钱任性,靠的是起步早,规模大。而让人一度忽略了阿里云的技术。

可是,10月28日,Sort Benchmark在官方网站公布了2015年排序竞赛的最终成绩时。我发现,阿里云飞天分布式计算系统在其含金量最高的两项比赛中,打破全部四项世界纪录。

很显然,并不是阿里云无技术,而是阿里的强运营掩盖了阿里云的强技术。事实就摆在那里,你到底要怎么看?

怎么理解SortBenchmark的含金量?

很多人也许有疑问,Sort Benchmark是什么机构?它凭什么可以代表云计算的技术能力?

也许你没听过Sort Benchmark,但你应该了解Jim Gray。

这位1998年图灵奖的获得者,极具传奇色彩。作为计算机的传统主流方向,数据库只有三位图灵奖得主,都是大名鼎鼎的人物,开创了属于自己的时代。三巨头之一的E.F.Codd于2003年逝世,数据库之父Bachman也是早早退休,没成想硕果仅存的Jim Gray于2007年1月28日早上独自乘船离开San Francisco Bay,去一个叫Farallon小岛洒他母亲的骨灰,不幸在外海失踪。

Sort Benchmark,就是是由Jim Gray负责主办和管理的排序基准评估比赛。该机构每年都会举办一次排序基准评估比赛,被誉为计算界的奥运会。所以,很多公司和学术机构都会带着他们最新的研究成果来参加这个比赛,以评估他们的研究成果。

据了解,Sort Benchmark的排序竞赛包含4项比赛,其中GraySort和MinuteSort主要评测计算系统的规模和效率,是4项比赛中含金量最高的两项。每一项比赛又分通用目的排序(Daytona)和专用目的排序(Indy)两个类别。

根据Sort Benchmark官方数据显示,阿里云飞天分布式计算系统分别在GraySort和MinuteSort的两个类别中打破世界纪录。

简单描述一下这两项排序的概念。其中,MinuteSort,比较容易理解,顾名思义,就是看你在一分钟内能排序多大的数据;GraySort,则是为纪念Sort Benchmark的发起者Jim Gray而起的名字,它的目标就是评测大规模排序的性能,它的评测单位是TB/min。

要知道,排序是最基础的数据算法,能够反映平台的整体计算性能。Sort Benchmark也是大数据处理能力公认的标准。过去对比Spark 和 Hadoop的效能时,就会在Sort Benchmark上排序的速度最为一个重要的参照指标。

所以,Sort Benchmark的纪录,意味着在过去一年里,在数据处理的技术上,阿里云已经走到了世界领先的水平。那么,要怎么看阿里云这四项世界记录的实际意义呢?

连破世界纪录的意义何在?

第一,阿里云得以为公有云再次证名。

在GraySort通用目的排序测评中,阿里云以15.9TB/分钟,将这一排序的纪录提升了3倍多。去年的冠军Apache Spark成绩为4.35TB/分钟。

去年,Apache Spark基于Spark搭建的系统用了207台Amazon EC2上的虚拟机,在23分钟内排序了100TB的数据。去年的冠军Hadoop用了2100台Yahoo内置的机器,花了72分钟,排序速度是Hadoop的三倍。阿里云则让排序的速度再度快了三倍。

这个纪录的的意义很深远。去年Apache Spark,是该比赛历史上第一次基于公有云的系统获得了第一。而今年的阿里云也是以公有云系统创造新的记录,这表示公有云在数据处理方面的能力已经到了世界最高水平,这等于为公有云再次证名。

第二,技术流的强强对话,分量更重。

Sort Benchmark纪录最大的价值,是与世界上最顶尖的技术公司和机构,在统一的标准下强强对碰,这种纪录才是真正的计算奥运会。

可以看到,在GraySort被阿里云击败的公司包括了去年的冠军Apache Spark。Apache Spark是个开源和兼容Hadoop的集群计算平台。由加州大学伯克利分校的AMPLabs开发,作为Berkeley Data Analytics Stack(BDAS)的一部分,由大数据公司Databricks拥有。这是全球最有前途的大数据技术公司。

在MinuteSort通用目的排序测评中,阿里云飞天的速度为7.7TB/分钟,击败去年速度为3.7TB/分钟冠军三星。三星这家酷爱全产业链的公司,对技术的投入一直巨大,并在2013年开始进军大数据。

另外,在GraySort和MinuteSort的Indy排序中战胜的都是BAT中,一直享受技术派名誉的百度。百度也是国内顶级的数据处理公司,大数据一直是公司的核心战略之一。

在强者如林的竞争对手中,连破四项世界纪录,这足以让业界对阿里云的整体印象重新认定。阿里云,不仅有阿里巴巴好的资金支持,优秀的运营团队,更有领先一步的技术能力。

第三,证明了可以成为DT世界的驱动力

马云不止一次的提到DT世界,提到阿里是一个数据公司,他甚至认为,未来世界,数据将取代石油,成为整个世界的最大能源。

可是,实现DT世界,需要有两个前提。一是大数据技术逐渐成熟,并应用于所有行业。二是数据的处理能力,也就是计算的能力足够强,足够快。

云计算作为数据世界的根本驱动力,阿里云逐渐成为了马云实现DT世界最有力的推手。从年中宣布60亿投资阿里云,到连续两个季度财报中,阿里巴巴成长最快的业务。阿里云,赖以成长的根本,并不仅是资本推动的,而是技术推动的。

Sort Benchmark的纪录,正从侧面证明了这一点,使得让数据的世界,拥有了最快最稳定的数据处理能力,让马云DT世界的目标,似乎又近了一步。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version
关闭
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群