由亚布力中国企业家论坛主办的“2018亚布力青年论坛第四届创新年会”于6月23日在香港举行。本次论坛以“2018金融科技新机遇”为议题,促进发展内地高新技术优势与香港国际金融中心优势的的良好合作,全国政协副主席梁振英、香港贸易发展局主席罗康瑞、港交所主席李小加等两地政商界人士出席并致辞。第四范式创始人兼首席执行官戴文渊先生作为高科技企业家代表,应邀分享第四范式在AI落地方面的经验。戴文渊指出,AI的未来虽然美好,但AI的落地之路却布满荆棘,不能靠炒概念,需要埋下头来,踏踏实实下苦功。第四范式团队在行业内积累了十多年的产业AI落地经验,在算法、数据、认知等多方面花了非常多的心血来降低AI落地的门槛,希望能加速AI改造升级各行各业的进程。
图为第四范式创始人、首席执行官戴文渊演讲
人工智能是被各行各业寄予厚望的未来技术,谈及人们最关心的AI在企业的落地问题,戴文渊指出,目前公众关注得最多的AI集中在感知层,例如人脸识别、语音识别、无人车等。但是,走在AI前端、享受着AI红利的企业,如BAT,没有哪家是靠人脸识别在经营的。戴文渊指出,企业真正需要的AI应该是决策层的AI,。
戴文渊把企业内部的角色分成三种,高层做的是战略制定,中层的工作是策略制定,基层是策略执行。互联网和移动互联网改变的是基层的工作,也就是策略执行,越来越多交给机器去做了。今天,人工智能在企业内部改变的是,策略制定正在交给机器来做。决策AI化才能实实在在提升企业经营效率,无论是百度的凤巢系统,今日头条的推荐系统,支持其享受AI红利的技术不是人脸识别、语音识别和无人车,而是决策的智能化。
人工智能技术已经实实在在地为头部企业创造了巨大的价值,但我们在将这项技术推广到更多领域的经营生产层面,也需要面对各种困难和挑战。戴文渊表示,企业AI落地要直面认知、数据、算法三道门槛:
构建机器学习圈,破解AI落地的认知门槛
首先,AI落地的第一道门槛是认知门槛。谈到AI,我们首先要正视一个问题:深度学习不是普通人能理解的交互方式,业务人员所关心的业务也不是科学家擅长的。怎样将业务人员关注的风险管控业务和科技人员关注的深度神经网络技术结合到一起呢,戴文渊认为,需要把公众可认知的交互方式和科技结合起来,形成一个门槛比较低的人工智能构建过程,使算法与业务进行对接。
第四范式把这样的AI构建的过程标准化了,借鉴教育学的“库伯学习圈理论”,总结成为四步标准动作,分别是“行动”、“反馈”、“反思”、“理论”。通过构建起闭环,形成机器学习的学习圈。AI应用应该像学习圈一样,将业务闭环与AI产生的过程融合到一起。以电子银行转账反欺诈为例,第四范式结合银行、支付行业反欺诈场景,从反欺诈专家几十条规则,通过机器学习提升到了八千万条,准确率提升2.5倍以上。随着自学习系统持续优化模型效果,这个数字还将不断提高。
构建面向AI的大数据系统,破解AI落地的数据门槛
其次,在阐述认知门槛时提到机器的反思、总结,这其实就是深度学习的过程,但如果缺乏有效数据,效果就会受影响,这就涉及到第二个门槛——数据门槛。
AI是基于大数据的,但很多企业有数据却不能产生AI,这是因为有大数据不等于就有AI。大数据分为两种,BI的大数据和AI的大数据,过去的大数据多数是为BI设计的,BI大数据主要是帮助人去总结一些经验,例如数据库,强调查询和统计。AI大数据是给机器看的数据,主要不是考虑查询和统计,需要的是完整和实效性高。因此两个大数据系统的设计理念天然会不同。我们经常会看到企业由于过去建设了面向BI的大数据系统,又将AI建设在这个大数据系统之上,非但没有帮到AI的落地,反倒成为AI落地的障碍。面向AI的大数据系统,要能存取PB级甚至更大量的日志,一定要支持实时存储,可以不需要实时查询和统计,但又需要极其高效的批量存取能力。正是因为传统的BI大数据系统限制了AI的发展,第四范式自主研发一套面向AI的大数据系统。其次,基于面向AI的大数据系统,我们需要建立起学习圈中的行为数据和反馈数据的收集体系:收集行为数据,收集反馈数据,让机器自学习。
自主研发世界领先的AutoML技术,破解AI落地的算法门槛
最后,关于算法的门槛,戴文渊表示,未来的AI,不应该依赖科学家来调参,而是让算法做到不需要科学家,让机器去学习。这也是破解AI落地算法门槛的关键。
让机器自动建模、自动调参,这在机器学习领域称为AutoML。要做到这一点,就要把机器学习或深度学习过程中高度专业化的参数设计环节自动化,而这过去往往都是顶级数据科学家的看家本领。我们AI这个领域,过去过多强调了科学家的调参能力,不利于AI的普及。第四范式从3年前开始发展不需要调参的AutoML,目的就是真正让企业也掌握自有AI能力。为此,“第四范式先知”平台将AutoML技术封装,能够让用户在没有机器学习研究背景的情况下开发机器学习模型、或是缩短数据科学家用来创建模型的时间和精力投入。
AutoML是AI赋能的重要方式之一,第四范式作为世界上最早开始研究AutoML的团队,也是世界领先的团队,过去的三年取得了多个阶段性突破。在医疗领域,第四范式和瑞金医院联合发布了糖尿病前期诊断的模型,运用AutoML技术,结合医院的数据总结出了50万条诊断规则,比医生普遍诊断水平提升200-300%。第四范式某一客户,利用AutoML算法,在去年的一个世界反欺诈比赛中,战胜了诸多专业反欺诈公司,获得了亚军。今年,第四范式也在与诸多国际巨头的竞争中,取得了国际最具影响力的神经网络会议NIPS中的AutoML大赛的承办权,成为国际AutoML的领导者。
一个好的AI算法可能需要耗费工程师们1年的时间,而解决AI落地的问题可能需要花费一个团队10年时间——第四范式就是这样一个团队。秉持“AIForEveryone”的企业愿景,第四范式一直致力于降低AI应用门槛,希望AI能普惠大众、赋能百业。在长期人工智能落地和企业服务实践过程中,第四范式不断在解决着阻挡企业AI落地的各种障碍。2015年,第四范式推出“先知“1.0,开始迈向技术赋能企业AI落地之路。三年多的时间,“第四范式先知”积累了大量人工智能落地和企业服务的实践经验和方法,包括数以千计的团队掉进的陷进。从帮助企业从低门槛构建模型开始,到如今发展到为企业提供端到端AI覆盖能力和量产属性的AI核心系统,“第四范式先知”不仅解决了企业AI落地从0到1的各种问题,还赋予企业从1到N的强大能力。第四范式一直坚持探索AI落地解决之道,已经为银行、保险、证券、医疗、政务等多个领域上千余家企业提供人工智能产品、服务和解决方案,特别在金融领域,第四范式服务的客户总资产已经占到中国金融总资产的半数以上。“AIforEveryone”要求第四范式走的不是一条颠覆式创新的路,而是要帮助各行各业的合作伙伴、成为各自领域最好的AI公司,与大家共建AI时代。