7月31日,第四期百度大脑开放日在北京中关村创业大街百度大脑创新体验中心举行,迎来首次NLP专场。本期活动一如既往介绍了百度大脑近期最新开放和升级的能力,还重点解读了百度大脑在自然语言处理方向的最新技术突破与开放布局,同时邀请央视网、国美管家、纵横文学的技术负责人分享了基于百度自然语言处理技术的应用创新与已落地的场景案例,切实展现了百度大脑AI产业化加速落地的成果。
AI大生产平台 将“软硬一体”同步升级进行到底
2019年百度AI开发者大会上,百度大脑5.0全面跨越升级为软硬一体的AI大生产平台,在算法突破、计算架构升级的基础上,实现AI算法、计算架构与应用场景融合创新,并实现AI技术的标准化、自动化、模块化。目前,百度大脑已是服务规模最大的AI开放平台,有超过130万开发者使用,开放了超过210项核心技术能力,并面向广泛的企业和开发者,不断降低着AI应用落地的门槛。
在第四期开放日上,百度AI技术生态部高级产品经理娄双双详细介绍了百度大脑在6-7月新开放与升级的产品能力共22项,包含新能力开放、开发平台的全新升级、以及新硬件的发布等,还与现场的合作伙伴、开发者们互动,分享了这些技术赋能行业的实际案例。
在视觉方向,人体分析与车辆识别方向有3项新能力开放包括:手部关键点识别、危险行为识别、车辆分割;3款产品能力升级包括:人体关键点识别、人流量统计、驾驶行为分析。更精细的关键点定位,将助力人机交互、互动娱乐等场景应用,而更丰富、精准的行为分析与识别能力,也将有效助力公共和交通安全。OCR方向,车牌、表格文字、通用文字(高精度/高精度含位置版)以及行驶证5款产品识别召回率均有不同程度的提升。同时人脸离线识别SDK升级至3.0版本,活体检测与通行全流程耗时低于300ms;人脸识别私有化部署包适配了最新的RTX系列2080显卡,并进一步提升模型性能。
EasyDL定制化模型训练与服务平台在数据标注、模型、服务部署三方面再度更新。在AI模型开发过程中,数据标注往往占据了一半以上的时间和金钱成本,而此次全新推出的智能标注,可节约70%的数据标注成本。例如在开发一个物体检测模型时,以5000张图片样本为例,在启动智能标注后,人工标注约30%的图片,剩余70%的图片机器自动完成标注,也就是说人工仅需标注1500张图片,相当于单模型可节约3000~40000元标注的成本。同时,EasyDL物体检测模型也迎来了进一步的升级,云服务时延和端SDK精度均有大幅提升。
AI模型在端上的落地应用往往伴随着复杂的硬件选型、软硬件适配,耗时耗力。为此,百度大脑本次推出了三款全新的硬件方案:EdgeBoard边缘AI计算盒、EasyDL开发套件(十目)、EdgeBoard全目标抓拍机,为终端应用场景提供最佳实践。EdgeBoard边缘AI计算盒,适用于多路视频、多模型、实时性要求高的本地计算场景,可灵活加载开发者自定义的模型,并联合EasyDL推出了软硬一体方案——EasyDL边缘AI计算盒(EdgeBoard),预置EasyDL专用SDK。EasyDL开发套件(十目)适用于小型终端设备、单模型实时处理场景;EdgeBoard多目标抓拍机实测可达55FPS,可灵活搭载视觉模型应用于安防监控、工业质检、气象监控等场景。目前,三款产品方案均已在百度AI市场上线。同时,EdgeBoard高性能计算卡本次活动上也面向开发者推出了直减1000元的活动,在边缘高性能计算场景为开发者提供更优惠的价格探索应用。
语音自训练平台在原有搜索模型、输入法模型的基础上,本次进一步支持了呼叫中心语音识别模型的自训练,支持智能客服场景实时语音识别和音频文件转写场景应用。智能创作平台也迎来了2.0版本的全新升级。
在深度学习平台方面,源于产业实践的开源深度学习平台飞桨(PaddlePaddle)此次主要升级的内容包括:核心框架Paddle Fluid v1.5版本发布,PaddleNLP,PaddleCV,发布动态图,训练性能优化;工具组件PaddleHub新增29个预训练模型、发布图学习框架PGL Preview版。其中,PaddleNLP作为百度大脑工业级NLP开源工具与预训练模型集,具备了中文词法分析、文本情感分类等10项NLP应用任务,并且网络可灵活调整,场景也可高效迁移,具备业内领先的语义表示模型,可实现工业级的灵活应用,它也是当前业内最大的工业训练集。
AI Studio是基于飞桨(PaddlePaddle)的深度学习在线实训与教育平台,面向个人开发者提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型,同时提供比赛环境, 供各路选手脱颖而出。AI Studio全新功能升级包括:上线图形化编程,可用图形拖拽方式构建模型训练过程,并生成可执行代码方便学习和调整;NoteBook在运行监控等方面也进行了体验升级;在算力方面,GPU下配套环境的CPU升至8核, 内存升至32GB。
为了帮助开发者更好地上手和应用深度学习技术, 百度大脑AI Studio亿元算力支持计划也在进一步扩容, 增加更多的计算资源。不论是一人一卡模式,还是远程集群模式,都将为开发者们提供大量的免费算力资源,普惠开发者, 以促进行业更好发展。同时,每年举办10余场赛事的百度AI Studio人工智能竞赛也在火热招募中,总奖金超百万元。
NLP技术领先 智能创作让内容创作者更轻松
百度大脑开放日第四期首次迎来NLP专场,百度自然语言处理部副总监忻舟为参会的开发者们详解了有关百度大脑NLP技术以及应用实践。央视网、国美零售、纵横文学的相关技术负责人也分别通过实际案例,与大家分享了企业如何通过百度大脑NLP能力的赋能,实现自身业务的智能化演进。
据忻舟在会上介绍,作为百度大脑开放AI能力的重要组成部分,百度大脑语言与知识技术拥有最大的多元语义知识图谱以及最好的中文语义表示模型,目前可提供30+项技术工具,囊括了文本审核、机器翻译、语言生成等多项能力,服务方式多样、灵活、可定制,含有多套场景技术方案。
现场还介绍了可持续学习语义理解框架ERNIE 2.0和基于此框架的ERNIE 2.0预训练模型。ERNIE2.0可通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识,目前累计学习超过10亿条知识,已在百度众多产品应用中显现效果。根据测试对比,ERNIE2.0在16个中英文任务上表现优于BERT和XLNet。
而此次重点介绍的智能创作平台2.0,正是集合了百度领先的自然语言处理、知识图谱以及大数据技术,可实现自动创作、辅助创作等功能。具体而言,智能创作平台2.0在创作前,能够提供实时领域热点、地域热点信息,同时对TOP热点事件提供Topic实时热度分析;创作中,能够预置素材数据,提供多模素材推荐,同时进行实时智能纠错;创作后,能够自动审校、自动标签分类,生成自动摘要,提供用词润色建议及多模发布功能。整个创作过程可节约大概80%的时间。
央视网技术事业群副总经理朱立松在现场分享时表示:“当前传统视频生产运营面临着智能化生产、信息风险管控、内容创新等挑战,中央电视总台就人工智能赋能新媒体做出了大量的探索与尝试,而NLP技术是自动文摘、文本挖掘(文本分类)、信息检索等AI应用的基础。” 朱立松还透露,央视网已经与百度合作,共建人工智能媒体研发中心,联合打造媒体产业人工智能产品,包括智能创作、智能分析、智能审核、智能搜索、智能推荐等。
国美零售控股国美管家技术总监高旭介绍,借助百度大脑NLP的情感倾向分析功能与评论观点抽取功能,国美上线了“服务评分智能化解决方案”,可自动分析用户评论并自动处理:“百度大脑在这套智能评分平台的效果准确率很高,现在国美客服运营人力需求从一天5人降低到3人,负面问题处理率从60%飙升至100%,售后师傅的差评率也整体降低了7%。”
纵横文学产品总监张皓也肯定了百度大脑NLP对内容产业的价值。在接入了文本审核能力之后,机器初审替代人工评级,审核速度由每人每天60万字提升到600万字,并且对于风险内容和问题章节能够及时处理,只要两人就能完成。“百度大脑NLP文本审核的优点在于,词库、审核力度、监控维度都可以自定义,对内容平台管理而言相当灵活。”张皓说。
(从左至右:央视网技术事业群副总经理朱立松、国美管家技术总监高旭、纵横文学产品总监张皓)
近年来,AI已经被广泛应用到各个领域,而NLP技术的发展让机器更懂人的语言和知识,不断的场景落地应用,也在进一步推动人机交互走向一个新的时代。在产业智能化的大时代背景下AI技术必须与千行万业、多种产业实体相结合,像润滑剂一样融入行业的生产核心领域,从而起到激发生产效率,为行业提质增效的目标。未来,百度大脑也将聚焦更多行业领域,通过AI技术在产业中的落地,推导出AI对社会经济的促进作用,最大化发挥AI技术价值与AI企业能动性。