2001年6月,著名导演斯皮尔伯格执导的《人工智能》(英文名:《AI》)面世,影片讲述了机器人小男孩大卫为了寻找自我、探索人性而踏上旅途,并努力缩短机器人与人类差距而奋斗的故事。
这部电影上映16年后,虽然情感和意识机器人的诞生还遥遥无期,但AI却成了全球范围内最火热的话题,它战胜了棋坛霸主、它服务着人类的生活、它改造着各种传统产业、它成了人们创业的风口……
近日,一则新闻再次挑动了人们的神经,因不少厂商使用其旗下GeForce游戏卡替代Quadro系列、Tesla系列等图形工作、深度学习方面的产品,为了避免产品线混乱、削弱利润,芯片巨头NVIDIA(英伟达)规定,不许将GeForce游戏卡卖给专业厂商或者用于专业领域,有推测华硕、微星、技嘉等同时拥有显卡和服务器业务的伙伴将是其重点监视对象。
(图片来源于网络)
此消息一出,业界哗然,有人称“产品上市后自然会出现各种情况,英伟达应该做的是提高各系产品的不可替代性,而不是借助巨头地位卡别人脖子”,有人表示“毕竟Quadro、Tesla等价格昂贵而GeForce游戏卡价格低廉,站在企业立场,英伟达这么做也无可厚非”,也有评论称“英伟达一贯强势,该规定一出,绝大多数AIC厂商、经销商都会严格遵守,否则有可能被减少甚至停止供货,得不偿失”,更有媒体对中小企业和AI创业者表示同情“供应商倒还好,但服务器和工作站会有点小麻烦,采购成本肯定会大大增加,虽然AMD、英特尔等也有专业卡产品,但在性能和技术支持上会稍逊一筹”……,总之,用一句话来总结,都是钱闹的!
事实上,不管是图形工作、深度学习,还是人机交互、高性能计算,乃至于大数据处理、云数据存储,甚至是虚拟现实、虚拟增强,都属于AI的细分领域或者不可缺少的支持环节,而在AI创业领域,除了技术和人才,成本高、配套贵是制约企业高速发展的瓶颈之一。
AI创业,怎一个“贵”字了得!
当前,AI在媒体上出现的频率越来越高,依照现有科技的迭代速度,不久的将来它就能深入生活的方方面面和社会的各个角落,而随着AI产业的兴起,它在图像(物体识别、人脸识别等)、自然语言(语音识别、翻译、对话机器人)、智能医疗、智能推荐(广告、新闻、视频)等领域取得了快速发展,带动了一波又一波的创业潮,与此同时,AI技术对计算资源的需求也在飞速增加。
通常来说,构建AI服务包括三个步骤:大数据收集与处理、AI模型训练、AI模型在线服务,每一个环节都需要投入海量计算资源,其中牵扯到的最关键要素,就是成本。
举个例子,构建Hadoop平台可能就需要5个以上的节点,Hadoop节点对于硬件性能要求高,大量的节点数量又增加维护成本。AI对应不同的应用场景,需要用不同的海量数据来训练模型,目前大多数AI企业的做法是采用不同参数来训练同一批模型,寻找最优解,为了加快训练速度,减少产品研发周期,许多人选择GPU进行训练,甚至是一次训练任务使用多张GPU,而一张英伟达P40成本8000美金,即使家用级的1080ti也需要700美金,再加上每张卡250w的功率,每卡每天耗电6度,不算维护的人工,对于初创阶段的企业来说,电费就是一笔不小的开支。
总而言之,除了一次性的硬件购买需要投入大量资金以外,要让AI系统正常工作一般需要涉及电路改造,需要专业的硬件和操作系统运维工程师,日常电费开销、运维成本等也不低,还要面临着自行采购GPU可能无法充分利用而造成资源闲置浪费进一步推高成本的可能,哪哪儿都是钱。
一个可供侧面印证的事实是,创立于1993年的NVIDIA,其真正的拳头产品其实是1999年上市至今依然畅销的GeForce系列独立游戏显卡,但因为赶上时代脚步,促成了GPU的通用化,凭借Quadro、Tesla等昂贵的针对AI领域的产品线优势,该公司成为2016年标普500第一明星股,全年超逾220%的涨幅令许多人惊呼“第二个苹果”即将诞生,说到底,其优异的市场表现和AI创业者们持续高昂的成本投入,其实存在着某些方面的因果关系。
AI创业者,如何破解“贵”之魔咒?
“贵”,是AI企业和创业者不得不面临的魔咒,诸多迹象表明,对于从事AI业务的公司来说,研发人员可能手握很好的AI算法模型和解决方案,却往往因为投入成本、运维成本等导致业务开展受阻、企业发展速度受限。
那么,如何打破这个魔咒?有没有更好的选择?在笔者看来,答案是有的。
首先,在核心硬件的使用上当然要力争上马优秀产品,但在整体解决方案的选择方面,其实不必过分迷信“巨头”、更不必崇拜“价格高的就是好的”;其次,如果没有特别专业的运维人员和充足的运维经验,与其自行采购自行管理,不如将它交给更专业的第三方和托管机构。
当前,包括BAT在内,国内众多企业都在进行AI布局,做得好的品牌也有不少,比如UCloud、青云等等,都在各自细分领域做出了亮眼的业绩,积累了良好的口碑。
阿里云的PI平台,构建了自己的生态体系,整个平台对于自己的深度学习框架支持和优化做得非常好,但对于开源框架却只支持tensorflow,而刚刚获得9.6亿融资的UCloud在今年也推出了深度学习的训练平台,整体是以为各家AI企业提供算力为目的打造,此外还支持用户自定义的深度学习框架。
以UCloud AI Train平台为例,它可帮助客户解决AI模型训练过程面临的四个关键问题:该平台基于性能强大的GPU云主机集群构建,计算能力足够;同时提供一站式训练任务托管服务,包括自动实现计算节点调度、训练环境准备、数据上传下载以及任务容灾等功能,能够帮助用户从繁杂的GPU资源采购、管理、运维工作中解放出来;另外,UAI-Train平台按照实际计算消耗付费,计费精确到分钟,极大地降低AI的成本投入,还可以避免闲置资源的浪费。总而言之,在快速AI转型、降低AI成本、简化AI运维、共享GPU资源等应用场景上,UAI-Train平台都能够提供更好的一体化解决方案。
在9月份,由创新工场、搜狗与今日头条联合发起的“AI Challenger全球AI挑战赛”中,UCloud 便作为唯一的AI GPU合作方,为大赛独家提供了AI模型训练服务;与此同时,因为更加优化的软硬件解决方案和能够大幅度降低成本的原因,业内知名企业格灵深瞳也与UCloud达成合作,由UCloud为其提供GPU在线服务的计算支持。
据了解,中国正成为全球AI版图最有潜力的组成部分,AI也已经成为中国一场新的“全民运动”,计算力强、数据量大、国家政策支持、产业形势向好等系列优势为AI产业的发展奠定了坚实的基础,据国务院《新一代人工智能发展规划》,到2030年,我国AI理论、技术与应用将总体达到世界领先水平,AI核心产业规模将超过1万亿并带动相关产业规模超过10万亿。
和手机产业一样,当前国内AI正在迎头赶上,以UCloud为代表的企业正在打造下一代AI as a Service平台,这,或许会是AI黄金时代的序章,也是AI创业者们不再为成本高、投入大而头疼的前奏!