近日,“释放 AI 潜力——2017 英特尔人工智能大会”在北京召开。在这场集结英特尔公司全球副总裁兼中国区总裁杨旭、英特尔中国研究院院长宋继强等英特尔内部,以及百度、科大讯飞、京东等外部人工智能专家的大会上,除了探讨火热的人工智能概念背后,技术演进、产业发展、生态建设等多个层次问题之外,英特尔也通过多个技术大咖演讲,以及多场发布,让其横跨硬件、软件和框架的 AI 全栈技术能力更加具象化,也让我们逐渐触碰到英特尔 AI 的真正内核。
时隔一年 英特尔 AI 放出哪些大招?
据杨旭介绍,从去年的英特尔人工智能大会到本届大会,时隔一年,英特尔在自己最核心的计算能力上取得了很大突破。2016 年英特尔收购 Nervana Systems,Nervana 拥有为深度学习而全面优化的硬件和软件堆栈;同年,英特尔收购视觉处理芯片厂商 Movidius,这次收购让英特尔获得了高表现力、低耗能的 Soc 平台。
图注:英特尔公司全球副总裁兼中国区总裁杨旭
同时英特尔又基于 Apache Spark 分布式深度学习框架 BigDL 进行深度学习;另外还推出全线至强可扩展处理器,这个处理器从计算到网络技术、存储技术都可以非常灵活的按照人工智能的应用复杂度来搭配。
图注:英特尔人工智能全栈解决方案
杨旭还介绍,今年 10 月份英特尔 CEO 科再奇先生在美国宣布英特尔推出系列人工智能神经网络处理器产品,这一系列产品推出的背后,都是基于英特尔在人工智能技术上的发展和演进。
技术背后 且看应用场景有哪些?
对于比较受关注的 Movidius,英特尔公司高级首席工程师兼大数据技术全球首席技术官戴金权举了一个例子:“英特尔在今年 7 月份发布的 Movidius 神经元计算棒,这是一个非常小的 USB 样子的人工智能设备,是业界首款基于 USB 的超低功耗的嵌入式神经网络开发工具,它可以工作在标准 USB 接口上。它内制了 Myriad2 的 VPU,可以把预训练好的 Caffe 或者 TensorFlow 的模型直接嵌入到神经网络,直接通过所谓的 U 盘对神经网络推理进行加速,从而将人工智能应用部署在嵌入式以及边缘环境上。”
当然这样的实例还有很多,戴金权介绍了另外一个例子:“比如在 FPGA 方面,今年 8 月微软工程师分享了 Project Brainwave,这个深度学习平台运行在微软的超大规模基础设施架构上,在这个超大数据中心里面,基于 CPU 的服务器构成了一个 CPU 计算层,在这个服务器的计算层之上我们又加入了基于超大规模 FPGA 组成的 FPGA 计算层,CPU 的计算层和 FPGA 的计算层都同时接入了数据中心的融合网络,这样运行在本地的 CPU 或者 FPGA 的应用可以直接调用远端的 FPGA 池。Project Brainwave 里面都能够将已经训练好的各种各样的复杂的神经网络,不管是卷积神经网络 CNN 还是循环神经网络,都能够把它编译成可以在 FPGA 上执行并加速的代码,而且这个代码通过分布式的方式部署到英特尔的运算池上。”
除了 Movidius、FPGA,今年英特尔也发布了至强可扩展平台,英特尔在至强平台上做了大量的软件和硬件工作,包括优化、开发等等,使人工智能计算能在至强平台上有好的效果。
其实讲了这么多英特尔在人工智能方面的技术累积和横跨软硬件和算法框架的产品实力,这些黑科技都需要通过合作伙伴来打磨成为优秀的产品和行业解决方案呈现在大家面前,这也是这场活动邀请众多合作伙伴的原因所在。
在会上,众多合作伙伴详解了他们与英特尔 AI 的渊源。百度与英特尔在人工智能研究和开发上深度合作,致力于为客户提供最好的深度学习与人工智能体验。科大讯飞不仅在做人工智能,更在布局人工智能 2.0,在这其中需要更强大的能够支撑讯飞包括法院、医疗、城市客服各方面的应用的计算平台,通过与英特尔的合作,能够将人工智能更好的进行落地;美团云和英特尔不管是在技术层面还是产品层面都有很多交流,一起打造中国最开放的人工智能平台;海康 2013 年后开始布局深度学习,推出基于深度学习技术的后端产品,包括基于英特尔 Movidius 平台的摄像机;中国电信在深度学习算法上,在优化之前大概时长是 2400,优化之后提升 18 倍,得益于英特尔至强融核处理器提供的端到端的高性能支持。
AI 前瞻:看英特尔的技术储备
对于大家比较关注的英特尔在人工智能方面的前瞻性研究,宋继强作为英特尔中国研究院院长,进行了介绍。英特尔中国研究院过去几年研究了一整套人脸分析技术的算法框架,包括从二维的人脸图像中提取出特征点,特征点进一步分析识别出人的属性、身份和面部表情。以李宇春与英特尔联合打造的全球第一支有三维人脸特效的音乐视频为例,怎么样从二维人脸中提取特征映射到三维人脸参数空间把它变成你想要的脸?这个就离不开英特尔最新研发的深度学习算法,用几十万张图片训练出来。
另外宋继强介绍:“大家可能听说过 ImageNet 比赛,它是用很大的、上千万级别的图像去训练出深度神经网络。现在领先的视觉公司都说千层以上,而且很宽,那意味着这样的网络模型训练出来以后计算的复杂度、空间复杂度都很大,没有办法放在前端设备上用。而英特尔研究院的方案是采取了低精度深度压缩三部曲,获得百倍压缩比,性能接近无损。”Movidius 芯片和 FPGA 都属于功耗和计算上很优秀的前端部署硬件,在这些芯片中就会使用英特尔的低精度压缩模型做优化。
技术论坛:详解英特尔 AI“黑科技”
大会上午 Keynote 让英特尔 AI”黑科技““露峥嵘”之外,大会下午的“人工智能硬件创新”、“简化与加速人工智能开发”、“深度学习与机器学习实例分享”三场技术论坛,则就这些”黑科技“进行详细解读。包括英特尔软件事业部(SSG)高级技术咨询师胡英博士、英特尔方案架构师陈江、英特尔解决方案事业部亚太地区人工智能业务拓展经理刘斌、英特尔软件开发工程师赵鹏等多位人工智能领域的技术专家,还就英特尔可扩展系统框架、FPGA、Caffe 训练集群等能力;Pthon, Cafffe, Tensorflow 等数个深度学习框架;MKL 和 MKL-DNN、Movidius VPU、自动驾驶等核心技术及应用,进行了深入解读。点击文末的“阅读原文”,可以收看技术论坛视频回放。