智能车机、智能客服、智能家居、智能助手、智能政务……赋予产品智能对话能力是提升产品智能化体验、高效服务的重要手段,已经开始被越来越多的企业和开发者关注并布局。然而,智能对话系统搭建涉及NLP、知识图谱、语音等一系列技术以及业务知识数据,具有较高的门槛。
5月15日,"与未来对话——百度大脑智能对话引擎及产品发布会"正式举行,全新发布UNIT3.0,与全新升级的语音技术平台一同构建起强劲的智能对话引擎,为开发者带来了智能对话开发的称手神兵。
百度与IDC联合调研报告显示,“企业知识库累积不够”“项目投入成本过高”等有关成本与效率的疑问,位列企业在推进对话系统中的首要障碍。
而此次发布的全新智能对话系统定制平台UNIT3.0,正是从搭建技能、构建知识、整合技能与知识三方面着眼,全新发布多个核心特性,大幅降低了对话系统的定制成本。
在搭建技能方面,UNIT3.0全新发布了包括智能问答、设备控制、影音休闲、生活服务等多个方面高达58个预置技能。这些技能均来自真实业务积累,其背后沉淀着百度深厚积累的全面、优质的知识资源,并支持二次定制。上海慧逊科技AI产品总监刘海感慨,“UNIT强大的预置词库与技能,可以节约企业至少1年的数据准备成本。”目前,UNIT已深入应用于其酒店管家产品TicHotel中,产品广受住客好评。
除预置技能外,针对业务场景打造更适用的自定义技能,无疑是智能语音落地到各细分场景的重中之重。针对处理常见业务问题咨询的问答技能,UNIT3.0全新发布了文档问答能力,开发者只需一键导入业务文档,无需整理FAQ即可直接生成问答技能。在现场演示中,仅用时1分钟,输入机场手册即可在UNIT上获得流程的规则问答。
而对于精确理解对话任务的对话技能搭建,UNIT3.0同样通过强大的技术与工具升级给出了漂亮的答卷。对话技能的效果提升其实是训练标注、模型学习的闭环,二者不断循环往复提升模型能力最终达到上线标准。因此,更高效的数据标注和更强大的对话理解技术必不可少。
此次UNIT3.0全新发布了训练数据生产与标注辅助工具DataKit,可自动收集、筛选、预处理样本,大幅提升样本生产和标注效率。此外,对话理解技术“深度训练”模型也全新升级。融入了百度最新发布的语义表示预训练模型ERNIE后,在达到同等的准确率的情况下,可以节省超过37%的标注数据,反之,给模型提供同样量级的标注数据,可以得到更好的理解效果。据介绍,全新的DataKit和升级的对话理解技术可使对话技能综合研发成本节省60%。
UNIT提供的对话与问答技能的强劲实力可从经典的对话场景——客服场景中一窥究竟。“目前,联通与百度共建的智慧客服已上线试点运行,10010的15秒服务水平提升至88.7%,而客服人员外包成本下降10%。” 中国联通新客服项目技术总监刘金财表示。
如果说,对话理解技术好比知道用户问什么,那么知识构建就是明白该如何回答。“我们了解到,70%的企业在智能对话系统的构建过程中,最困难的环节是梳理和准备企业知识。” 百度自然语言处理部主任架构师、UNIT技术负责人孙珂博士表示。
针对构建知识这一痛点,UNIT3.0全新发布了问答知识库和图谱知识库两大构建工具。问答知识库构建工具可帮助抽取文档中的问答对,助力低成本构建精确、可控的常见问答知识库。而针对复杂知识,图谱知识库构建工具则可以辅助企业梳理和推理复杂知识体系,实现可视化数据生产与抽取工具。同时,生成的图谱知识也可以导入UNIT问答技能词槽词典,进一步帮助对话理解效果的优化。
构建对话系统,势必需要整合多样的技能与知识。UNIT3.0也从技能管理、对话管理、知识接入三个纬度进一步升级了技能与知识管理能力,帮助开发者整合对话、问答技能,接入知识,通过单一接口一站式满足复杂的对话系统研发。
技能管理实现多技能顺序可调,并共享全局记忆;对话管理方面具有在线与离线可编程对话管理框架,可适应多样化的业务场景;知识接入方面具备图谱知识库、关系数据库,基于HTTP服务知识信息的全面支持接入。
听懂语音、理解对话、快速反馈,构建一个完备的智能对话引擎,除了负责理解、掌握知识的对话引擎外,负责前期语音识别、后期语音合成的强大语音引擎同样重要。此次百度语音技术平台全新升级,推出呼叫中心语音解决方案及语音自训练平台。
在呼叫中心场景中,提供全新的端到端的语音技术解决方案,包括呼叫中心场景专属的语音识别模型、呼叫中心场景专属的语音合成音库,满足适配主流厂家MRCP对接,与对话理解深入配合,灵活支持打断等需求,同时采用高可用流式传输语音识别与语音合成协议,实现全双工流式交互,提供低延迟、高并发的企业级语音服务。
除了端到端的呼叫中心语音技术方案,全新发布的语音自训练平台通过使用业务场景文本语料,自助训练个性化的语言模型,可广泛应用于各场景,达到特定业务场景下业务用语的准确识别,有效提升业务领域语音交互体验。
UNIT3.0、语音技术平台等强劲的产品平台,自然语言处理、知识图谱、语音等全面的AI技术……百度大脑智能对话引擎在智能对话领域无疑已经走在前头,能力最全、规模最大,且已对外大量开放落地,与用户的累计交互次数超过460亿次。未来,百度也将持续发力智能对话,拥抱开放,让开发者平等、便捷地获取更低成本、更好效果的智能对话技术。