作为人工智能理解信息的核心手段,近年来自然语言处理技术(NLP)突破频频,并开始往更多垂直场景落地应用。7月31日,百度大脑开放日NLP专场于中关村创业大街的百度大脑创新体验中心举行。开放日期间,百度自然语言处理部副总监忻舟分享了NLP领域的开放全景,并重点介绍了智能创作平台2.0的新特性、PaddleNLP(NLP开源工具与预训练模型集)、ERINE(知识增强的语义理解框架)等最新技术。活动现场,央视网、国美零售、纵横文学的相关技术负责人也登台演讲,阐述企业如何借力百度大脑开放的NLP技术能力,实现自身业务的智能化演变。
开发者NLP需求与日俱增 百度大脑致力降低技术门槛
据介绍,百度大脑经过多年深耕,形成了完整的语言与知识技术布局,以知识图谱为基础,实现语言理解与语言生成能力,并进一步形成深度问答、对话系统、智能创作、机器翻译等功能。
活动当天忻舟重点介绍了可持续学习语义理解框架ERNIE 2.0和基于此框架的ERNIE 2.0预训练模型。ERNIE2.0可通过建模海量数据中的词、实体及实体关系,学习真实世界的语义知识,目前累计学习超过10亿条知识,已在百度众多产品应用中显现效果。根据测试对比,ERNIE2.0在16个中英文任务上表现优于BERT和XLNet。
百度大脑工业级NLP开源工具与预训练模型集PaddleNLP,具备中文词法分析、文本情感分类等10项NLP应用任务,并且网络可灵活调整,场景也可高效迁移,具备业内领先的语义表示模型,可实现工业级的灵活应用,它也是当前业内最大的工业训练集。忻舟以“文本情感分析”为例,现场实操百度大脑NLP工具集,为开发者展示了直观易用的步骤。
百度大脑一直致力于将行业领先的NLP技术对开发者和产业开放,不断降低AI应用门槛。目前,百度大脑语言与知识技术拥有最大的多元语义知识图谱以及最好的中文语义表示模型,可提供30+项技术工具,囊括了文本审核、机器翻译、语言生成等多项能力,服务方式多样、灵活、可定制,含有多套场景技术方案。
智能创作平台2.0推出 AI赋能内容创作
对内容创作者而言,在信息传播节奏越来越快的当下,内容质量、时效速度、多媒体内容形式等挑战越来越大。对此,智能写作功能开始被关注,本次开放日也重点介绍了百度大脑的智能创作平台2.0。
据了解,百度大脑智能创作平台于2018年百度世界大会发布,并于今年4月完成能力全面开放的智能创作平台1.0。在7月初的2019百度AI开发者大会上,智能创作平台正式升级为2.0版本。对内容创作者而言,智能创作平台不仅可以化繁为简,节约时间,更可以通过各种智能服务,提升内容产出的质量与形式。
基于百度领先的自然语言处理、知识图谱以及大数据技术,智能创作平台2.0具备热点发现、热词分析、用词润色、标题生成、多模态创作、文本审核、文章分类、文章标签等8大领先技术能力,更有丰富的数据素材支持。
在创作前,智能创作平台会根据热点发现与热词分析来辅助作者选题,以激发灵感;在创作过程中,标题自动生成、事件脉络等功能会为作者推荐适合的创作素材;在创作完成后,文本纠错、词语润色、文本审核等功能可为作者进一步提升内容质量,并自动提炼文本的类型与摘要,使内容分发更加精准。
深入融合各行各业 百度大脑NLP成智能化“东风”
作为百度大脑开放AI能力的重要组成部分,百度大脑语言与知识技术已经形成了基础技术、应用技术、训练平台、开源算法在内的完整开放全景图。热门应用的技术包括评论观点抽取、情感倾向分析、文本审核、对话情绪识别等等。同时,在技术与效果领先行业的基础上,百度大脑也在不断降低技术门槛让更多开发者与企业都能用得起来NLP技术,实现自身业务的智能化。
(左起:央视网技术事业群副总经理朱立松、国美零售控股国美管家技术总监高旭、纵横文学产品总监张皓)
央视网技术事业群副总经理朱立松表示:“当前传统视频生产运营面临着智能化生产 、信息风险管控、内容创新等挑战,中央电视总台就人工智能赋能新媒体做出了大量的探索与尝试,在智能创作、智能分析、智能审核、智能搜索、智能推荐等方面已有成效,其中NLP技术是自动文摘、文本挖掘(文本分类)、信息检索等功能的基础。”朱立松还透露,央视网已经与百度合作,共建人工智能媒体研发中心,联合打造媒体产业人工智能产品。
国美零售控股国美管家技术总监高旭介绍,借助百度大脑NLP的情感倾向分析功能与评论观点抽取功能,国美上线了“服务评分智能化解决方案”,可自动分析用户评论并自动处理:“百度大脑在这套智能评分平台的效果准确率很高,现在国美客服运营人力需求从一天5人降低到3人,负面问题处理率从60%飙升至100%,售后师傅的差评率也整体降低了7%。”
纵横文学产品总监张皓也肯定了百度大脑NLP对内容产业的价值。在接入了文本审核能力之后,机器初审替代人工评级,审核速度由每人每天60万字提升到600万字,并且对于风险内容和问题章节能够及时处理,只要两人就能完成。“百度大脑NLP文本审核的优点在于,词库、审核力度、监控维度都可以自定义,对内容平台管理而言相当灵活。”张皓说。
当前,NLP技术作为人工智能重点发展的领域之一,已经在新闻传媒、电子商务、文化娱乐、金融、法律等行业场景深度落地,而国内人工智能“头雁”百度正在其中发挥着至关重要的作用。可以想见在百度大脑的赋能推动下,将会有更多的企业与开发者应用NLP技术能力,使自身的产品与服务与人工智能深度融合,为中国的整体产业智能化提供加速度。