在人工智能、虚拟现实这拨热潮来临的时候,有无数创业公司开始重新审视自己的定位,并将原有项目或业务向人工智能、虚拟现实等方向倾斜。更多的公司还在寻找适合自己的商业模式,在盈利的路上披荆斩棘。而对于上游芯片厂商来讲,虽然风口在不断变幻,但各个行业对于计算的要求并没有转移,相反需求量仍然持续增长。
黄仁勋创立的NVIDIA(英伟达)在1999年发明GPU的时候,他当时并没有意识到GPU在未来人工智能、虚拟现实等领域会有如此大的发展空间。凭借着GPU的威力,NVIDIA也正在从一个图形芯片公司,向AI计算公司转型。
新技术计算需求给芯片公司带来新机会
在2014年之前,在消费级市场,GPU主要应用于游戏特效的渲染,在商用市场也局限于工业设计、影视制作、超级计算机等领域。黄仁勋在GTC开发者大会中国站透露,近三年来,业界对GPU计算的需求出现了爆炸式增长。其中,与人工智能息息相关的深度学习计算,负载需求增长了16倍,这个数字要比摩尔定律还要高出很多。而仅仅两年的时间,下载基于GPU的深度神经网络实验室引擎开发者数量就增长了25倍 ,从2014年的2200次,迅速增长到目前的5.5万次。
据称,使用深度神经网络的开发人员,有很多是人工智能的研究人员。黄仁勋称,现在所有的实验室都会使用NVIDIA的GPU平台来做AI研究,这里面既有软件公司,也有互联网软件提供商,还有互联网公司、汽车公司、政府、医疗成像、财务、制造等公司。其中,百度近几年来一直在使用GPU做AI人工智能方面的研究。据称,目前使用语音识别在手机上进行输入,速度已经达到了键盘输入的3倍。而这样的成绩,离不开给百度后台提供强大计算能力的硬件设备。
业界对计算能力的需求,集中体现在对芯片的采购上,这从上游芯片公司的财报就能一窥端倪。
英特尔最新财报显示,2016年二季度营收为135亿美元,同比增长3%,净利润为13亿美元,同比下滑51%,按非美国通用会计准则(Non-GAAP),净利润为29亿美元,比上年同期的31亿美元下滑6%。英特尔净利下滑的主要原因是二季度的财报中加入了约14亿美元的重组费用。英特尔计划2017年年中前裁员1.2万人,以便削减成本,专注于目前需求强劲的服务器芯片和物联网芯片业务。
如果分解来看,客户计算集团二季度净营收为73.38亿美元,去年同期为75.37亿美元;运营利润为19.71亿美元,去年同期为16.03亿美元。数据中心集团二季度营收为40.27亿美元,去年同期为38.52亿美元;运营利润为17.65亿美元,去年同期为18.43亿美元。物联网集团二季度营收为5.72亿美元,去年同期为5.59亿美元;运营利润为8900万美元,去年同期为1.45亿美元。其中对新兴技术有重要影响的数据中心集团、物联网集团运营数据都比较突出。
NVIDIA的数据则更夸张,根据其2017财年二季度财报显示,当季收入14.3亿美元,同比增长24%,净利2.53亿美元,同比增长873%。同时,为了鼓励创业,NVIDIA发布了Inception Program创始计划,以便让参与其中的成员能够利用NVIDIA 的技术与专长来助力初创企业的成长,在深度学习与数据科学领域实现突破。黄仁勋对搜狐科技表示,目前全球人工智能方面的创业公司已经超过1500多家,创始计划发布以来,已经有700多家企业与NVIDIA展开合作,除了能获得NVIDIA的技术和专家支持外,这些企业还能得到其全球市场营销平台的支持,也有获得投资的机会。
高通2016年第三财季净利润同比也出现了大幅度的增长。数据显示,当季其营收为60.44亿美元,同比增长4%。净利润为14.44亿美元,同比增长22%,增长势头明显。高通CEO莫伦科夫称,高通的芯片业务增长,主要受益于各级厂商推出了更多新产品,尤其是快速成长的中国OEM厂商。据了解,当季高通的芯片出货量超过2亿片。
企业对计算能力需求有多高?
百度首席科学家吴恩达多年来一直在进行人工智能方面的研究。2014年,在训练语音识别时,模型中有2500万个参数,训练的材料是7000小时,语音识别的错误率为8%,大约每12个词中就有一个是错的。而到了2015年,语音识别训练的数据量是之前的2倍,深度学习的网络是原来的4倍大,错误率降低到了5%。在1年的时间里,错误率与之前相比降低了40%左右。这背后,需要强大的计算能力支持,错误率仅仅降低3个百分点,就需要20万亿次浮点运算的支持。
在谈到深度学习对计算的需求时,吴恩达表示,通过百度多年来的经验,单纯使用云计算并不能真正促进深度学习发展。使用HPC高性能计算,以及使用超级计算机才是更能促进深度学习算法进步的一个方向,因此,现在最先进的深度学习系统已经开始使用高性能算法。吴恩达称,百度是全球第一个为深度学习建立GPU集群的公司。通过AI训练,百度也将取得的成果不断应用到实际当中。据了解,目前百度语音识别、自动驾驶、百度大脑等项目已经取得很大的发展。在今年的百度世界大会上,人工智能贯穿会议的整个过程,成为大会的核心主题。李彦宏甚至强调,人工智能是百度核心中的核心。
为了能够满足电商平台的计算需求,京东在两年前曾与英特尔达成战略合作。双方在基础架构、服务器、系统软件、硬件优化、网络系统、云平台等领域联合开发,以提升电商平台的技术水准。
日前,京东与NVIDIA也宣布战略合作,双方将加强在人工智能领域的全面合作,加速智能电商时代到来。据京东集团首席技术顾问翁志介绍,京东电商平台每天上传的图像超过500万张,对图像进行甄别需要优秀的算法和计算资源支持。现在机器学习已深入到图像识别、大数据处理、个性化推荐等方方面面。在京东发布VR、AR战略后,更是离不开GPU加速计算的支持。据了解,目前京东的机器学习多半都建立在GPU计算之上。
对阿里巴巴来讲,云计算与大数据已经成为其战略重点之一,阿里甚至希望其平台能够为中国互联网70%的流量完成相关的计算任务。阿里巴巴技术保障部系统研发总监高山渊称,阿里的业务增长速度远远超过摩尔定律。数据显示,2015年“双11”阿里平台交易额达到912亿元,订单的创建峰值达到每秒14万笔,支付宝支付的峰值达到每秒8.59万笔。在这些数字的背后都需要非常强大的计算平台去支撑。据了解,阿里云计算平台已经服务于全球180万家企业,在全球有30多个数据中心。
为了满足计算性能的需求,阿里甚至与英特尔合作定义了一套评价CPU性能指标的体系,并命名为“AliBench”。在这套体系背后,综合了电商、金融平台、物流、娱乐、云计算、大数据等一系列的需求,来综合评价一个指标,并评价一款CPU是否符合阿里的要求。据搜狐科技了解,为了满足阿里的计算需求,阿里与英特尔合作,专门定制至强CPU,以便在性能功耗比方面有更好的提升。
英伟达要革英特尔的命?
目前流行的人工智能、VR、AR等技术,都离不开GPU的加速计算支持。从NVIDIA的数据来看,在这些领域,GPU的效率远超CPU。此前NVIDIA推出了一款DGX-1超级计算机,这款专为深度学习设计的系统,吞吐量相当于250台CPU服务器及其相应的网络、线缆和机架,可以将深度学习的培训速度加快75倍,将CPU性能提升56倍。
本月初,IBM发布了新款Power LC服务器,这款采用了NVIDIA技术与POWER8平台的产品专注于加速人工智能、深度学习及高级分析应用。IBM方面称,这款处理器能实现比其他平台高5倍的数据处理速度,与最新的x86服务器相比,每花费一美元能获得高于x86服务器80%的性能。
从服务器性能及企业对GPU加速计算的需求来看,似乎CPU已经明显处理劣势。不过,黄仁勋并不这么认为。据搜狐科技了解,多年来,黄仁勋曾在不同的场合,多次强调GPU与CPU的关系。这两种产品之间并不是你死我活的竞争对手,而是各有所长。
黄仁勋对搜狐科技表示,CPU和GPU在工作过程中要相互配合,而不是各自分开。两者是非常不同的处理器,它们相互擅长的是不一样的。CPU往往会是几个性能非常高的处理器集成在一起,而GPU可能是数以千计、非常小,但是功耗比较低、能效非常高的小处理器。两者的内存架构、网络连接的架构都不一样,编程模式也是明显不同,因此需要互相配合。
黄仁勋同时强调,很多应用并不需要GPU存在,只能依靠CPU来完成。据称,GPU在两个领域比较强大,一个是计算图形、虚拟现实领域,另一个是人工智能领域,尤其是深度学习领域。黄仁勋称,NVIDIA的战略并不是要取代CPU,而是GPU和CPU协同发挥作用,让CPU和GPU各自去完成自己所擅长的功能。另外,NVIDIA市场重点也不是传统的计算,不是手机和PC,而是游戏平台、自动驾驶汽车、AI、数据中心等领域,因此,NVIDIA仍然需要与CPU来合作。
英特尔中国研究院智能互联创新中心总监、首席研究员张益民对搜狐科技表示,GPU和CPU要看应用需求及设备功耗。一般PC等客户端直接用CPU就可以完成计算。据称,GPU适合于大量数据并行的计算,而CPU则适合于通用计算,人工智能计算则两种计算方式都包括。相对而言,CPU在进行计算时更加灵活。如果要加速AI,并保持很好的能效比,可能CPU加上专用加速器更合适。除了通用CPU外,英特尔近来来也开始布局FPGA,并收购了Altera,最近又收购了AI创业公司Nervana,这些产品都在提供专用加速器的能力。
英特尔要从一家PC公司转型为一家驱动云计算和数以亿计的智能互联计算设备的公司。数据显示,目前所有出货的服务器当中,有7%可以做机器学习和深度学习,其中95%都是基于英特尔架构的产品。据英特尔销售与市场事业部副总裁夏乐蓓介绍,英特尔在中国市场发布了全新的至强融核处理器。Altera也将其解决方案融入到英特尔产品线当中,通过融合FPGA的技术,能够实现在人工智能方面更强大的处理能力。
对于英特尔与NVIDIA在高性能方面的竞争,夏乐蓓对搜狐科技表示,对于任何一个行业来说竞争都是好事,因为竞争会带来下一轮创新的浪潮。人工智能毫无疑问是下一代计算创新浪潮所在,而在这个浪潮当中中国发挥着非常重要的作用。英特尔一直秉承开放的态度,构建广泛的创新平台并开放给所有开发人员。因此,英特尔所采取的方式方法是不同的,英特尔并不仅关注深度学习,还关注人工智能作为一个整体的行业发展,所以它既包括了深度学习,也包括机器学习及与人工智能有关的方方面面。英特尔希望把人工智能整体技术发展所带来的好处转化成更好的、更优化的商业上的成效,从而把人工智能的好处真正带给最终消费者。
英特尔中国研究院院长宋继强称,在机器智能化发展方面,将经历从联网、智能到自主的三个过程,英特尔构造了一个良性的循环网络,从云端到最终的客户端设备都有不同级别的硬件去支持其做智能化的演进。在云端有至强融核、Nervana技术;中间层有至强和FPGA,在前端有酷睿级别的产品,并带有图形加速,可以做深度学习、智能加速。同时还有小型化的产品,如最新发布的Euclid,这种把Atom级别的处理器和Real Sense摄像头完全整合的模块,就非常适合让无人机、小型机器人直接使用,并同时可以做小型人工智能计算。之前发布的Curie模块,也自带了108个神经原,可以直接把人体的动作做分类。因此,在人工智能领域,英特尔有完善的硬件产品做支持。同时,存储、5G、安全等与人工智能息息相关的领域英特尔也有完整的方案。
上游厂商在人工智能、虚拟现实这一热潮来临之时,之间仍然充满了竞争,不变的是各种技术对计算需求的增长,同时,云计算、人工智能、VR等新技术也给了创业公司更多的发展机会。