AI大势之下,越来越多的企业积极拥抱AI。然而,现实与憧憬还有很大的距离。众多传统行业要实现AI应用还远没有想象中的那么简单。
从企业中有人开始思考“我们面对的问题能不能用AI来解决”,到真正的实现高效、高质量的大生产,把AI技术的价值带入到企业的生产活动当中,是否存在一条可以参考、可以实践的路径?
百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜在WAVE SUMMIT 2021深度学习开发者峰会上,首次公开分享了飞桨通过与产业伙伴的广泛合作所观察到的实践路径。她指出,企业应用AI会经历三个阶段。
百度集团副总裁、深度学习技术及应用国家工程实验室副主任 吴甜
第一阶段是企业中有少数先行人员尝试引入AI,称之为AI先行者探路阶段;当进行了验证成功落地后,会从个人实践转变成建设团队来学习和应用AI,称之为AI工作坊应用阶段;当企业逐渐进行大量的AI应用,几百、几千人一起工作,多人多任务协同生产,就进入了AI工业大生产阶段,更长期看,还会实现社会化协同生产。
企业在应用AI的这三个阶段会遇到的主要问题是什么?如何有效解决,以实现进阶呢?吴甜用现实事例给出了产业一线的经验分享。
首先,在“AI先行者探路阶段”,先行者们看到业务场景中的问题,考虑引入AI来解决,真实场景问题往往有别于实验室中的。以一个智能质检的案例为例,企业希望用AI替代人工质检,需要高准确率、低漏检率,对算法要求非常高。这个案例需要在大物件上找到非常小的瑕疵和缺陷,是大尺幅里小目标的检测。还需要模型体量小,预测速度快。另外,缺陷类型复杂,虽然产线上可能拿到很多的数据,但是缺陷的数据样本往往很少。面对这个场景问题的时候,首先需要有在这样场景上真正实践过的模型才能够快速的解决问题,还需要有适配这个场景的调优工具。飞桨基于大量产业实践打磨的PP-YOLOv2模型解决了上述问题,对先行者来说就具备了一个条件可以快速的进行模型验证。
但是光有了模型还不够,需要把模型部署到需要的生产环节中,新的问题又随之而来。在产业场景适配的硬件支持上,算力、存储容量、模型支持程度、软硬件结合优化,设备价格等因素让部署变得复杂。为此,飞桨平台提供了多端多平台部署环境支持,并且推出配套的部署工具链,可完美解决部署的一系列复杂问题,帮助企业便捷地走完AI应用的“最后一公里”。
到了第二阶段“AI工作坊应用阶段”,一般来说是规模体量不太大的AI团队以相互独立的方式在进行创新工作。以一家工业制造业企业的AI团队为例。这个团队由12人构成:4名机械化工工程师,7名软件工程师,1名AI专业研发人员。从模型研发的视角看,模型研发的深度有不同层级,最便捷的是无代码开发方式,可以快速上手,门槛非常低。对于可以进行代码开发的工程师,可以使用场景类套件快速复用。若团队研发人员具备AI算法能力,还可以在算法类套件上进行算法模型配置。再进一步,若团队研发人员能够在模型库上进行代码改写,可以得到更符合自己需要的额新模型,如果能使用核心框架进行研发,就可以实现更深度的模型自研工作。可以说,飞桨打造了针对不同类型开发者需要的完备产品结构体系,不仅有可视化界面产品、场景类套件、算法类套件,还有模型库,以及动静统一的核心框架,助力AI应用创新。
最后,“AI工业大生产阶段”,该阶段具有“多人多任务进行协同生产”的典型特征,并面临着四大挑战:第一,需要高效管理大规模异构算力基础设施;第二,支持大并发多类型任务调度;第三,需要支持多人协同,满足不同类型使用者需求;第四,需要高效满足各类场景的定制化建模需求。面对这四个挑战,飞桨平台打造了两类核心功能:面向资源算力层面,飞桨塑造了高效的算力管理与调度平台,对模型和服务进行科学有序的管理,提升整体的研发效率;面向开发人员提供全流程集成开发环境,提升整个AI研发流程的易用性和效率,帮助研发人员站在更高的起点开展工作。放眼更长期,将会形成社会化的协作生产。
飞桨自正式对外开源至今,已完成第一个技术发展与产业创新“双丰收”的五年。截止目前,飞桨平台聚集了320万开发者,服务了12万企业,创建了36万模型,已经覆盖到了工业、能源、金融、医疗、农业、城市管理、交通、信息技术等各种各样的行业和场景,而这组数据还在增长。
人工智能对世界经济、社会进步和人类生活产生的影响愈加深刻,以深度学习为核心的新一代人工智能技术已经具备了非常强的通用性,显现出标准化、自动化和模块化的特征。在此过程中,飞桨作为成熟完备的产业级开源开放平台,更进一步扮演着夯实中国科技发展的创新底座的“基石”角色。与产业共进的同时,“飞桨也将持续面向科学研发提升灵活性,助力前沿探索,希望为产学研一体化贡献力量,希望我们与开发者、与产业界、与科研界、与教育界携手,共同推进人工智能的发展。”吴甜说。