近日,阿里达摩院语言技术实验室取得一系列突破,斩获自然语言处理(NLP)领域6大权威技术榜单冠军。其中,在 MS MARCO 自然语言生成NLG公开评测上取得了排行榜第一的生成式语言模型PALM,不久将在斑马智行系统大规模商用。
自Google提出模仿人类注意力机制的BERT模型以来,预训练语言模型已成为NLP领域的热点研究方向。达摩院早在2018年就开始布局通用的预训练语言模型,其自研通用语言模型StructBERT、多语言模型VECO、多模态语言模型StructVBERT、生成式语言模型PALM等6大自研模型分别刷新了世界纪录。
【达摩院自研生成式预训练模型PALM在MS MARCO NLG榜单中位居第一(仅次于人类水平)】
据了解,这些技术已应用于阅读理解、机器翻译、人机交互等场景。PALM在 MS MARCO 自然语言生成NLG公开评测上取得了排行榜第一,同时在摘要生成标准数据集CNN/DailyMail和Gigaword上超过现有的各个预训练生成语言模型。未来,PALM将被深度应用在斑马智行系统上,成为车载场景下该技术的首次大规模商业应用。
斑马网络高级算法专家张涛指出“自然连续对话是一个系统的工程,涉及到从车机端的声学前端处理、语音唤醒、语音识别、语义理解、对话管理、自然语言生成、语音合成等多个核心交互技术。其中,NLP(自然语言处理)是非常重要的环节,只有先识别处理才能有后面的生成和交互,生成式语言模型PALM的应用,让斑马智行系统和用户交互更流畅,更智能。”
当前,在达摩院技术加持下斑马智行AI语音已实现仅需一次唤醒,就可准确识别,实现自然连续对话,并且指令可以随时打断,内容随心切换,整个对话体验自然流畅,给用户带来情景化、有温度的用车体验。
(斑马智行VENUS系统语音交互界面)
基于阿里自研的AliOS,斑马网络面向全行业提供智能汽车操作系统整体解决方案,斑马智行系统已经运行在100多万台智能网联汽车上。斑马在出行领域的持续探索,为阿里达摩院AI技术在车载环境下创造了最佳的商业应用场景,也将为用户带来更加智能的产品体验。