随着科学技术的发展,自动化技术将机械控制进化为信号控制,帮助工业生产和日常生活更加便利高效。
同时人工智能开始替代人类的双手进行部分工作,比如AI语音助手接收声音信号通过数据分析和识别,响应人类指令完成指定操作。
AI技术的每一次革新,都会对社会生活进行一次深度改变。从智能音箱走进千家万户,到智能车联陪伴日常行程,在数字化升级、消费转型的风口面前,我们可以期待怎样的AI技术打开未来的智能生活?
在刚刚结束的腾讯技术开放日·腾讯云小微AI语音专场,来自腾讯智能平台产品部AI语音专家带来关于语音识别、自然语言理解、智能对话机器人等行业应用探索等领域的精彩分享,从腾讯云小微AI语音助手的角度,揭开AI语音助手在技术和应用领域的探索和最新成果。
云+端协调、软硬件一体,打造鲁棒的车载语音识别系统
在直播中提到,就构建鲁棒的车载语音识别系统而言,人工智能首先要解决的难题就是数据分析与识别,只有将各个行业的宝贵经验搜集并形成数据库,再通过电脑自动识别知识并进行分析,才能从亿万条数据中剥丝抽茧,找到匹配用户使用场景的正确反馈。
但是在实际应用环境如汽车使用过程中,车载语音识别面临着重重挑战。在语音识别将人类的声音信号转化为文字或者指令的过程中,用户口音、环境噪声、海量POI以及场景化语音均构成影响识别系统决策的变量,尤其考验语音识别系统的基础稳定性。
为此腾讯云小微AI语音助手在接收信号后,通过声学前端处理,对丰富的声音信息进行甄别,分流至本地语音识别、云语音识别以及云+端协调机制进行精准识别,提供更为精准的技术解决方案。
以常见的环境噪声处理为例,当用户声音信号发出,在路噪、风噪、空调、音响等不同噪声类型的干扰下,很容易让车载语音识别发生理解偏差。腾讯云小微AI语音助手从车内语音交互场景出发,通过腾讯自有技术和硬件设备完成回声消除、噪声抑制以及定位和拾音,确保得到干净的语音信号,同时在声学模型层面从训练数据、特征提取、网络结构等方面进行针对性优化以提升识别系统对噪声的鲁棒性。
在基础能力方面,因为有腾讯云加持,再根据自主研发的全栈AI技术,整合前端降噪、语音识别、语义理解、人声合成、图像识别能力,能够提供云到端的完整的AI解决方案。
在直播中,我们还看到了腾讯云小微AI语音助手在不同用户口音输入语音情况下如何做出精准反馈。腾讯云小微AI语音助手的鲁棒性源自容错性极小的两套处理方案,一是基于迁移学习的分地域模型方案,二是引入地域向量的单模型方案。在这样的智能车载语音识别系统下,腾讯云小微AI语音助手联合腾讯车联TAI已合作多家国内头部车企和热销车型,通过腾讯云小微车载语音识别系统的助力,无惧用户口音,精准识别语音指令,满足车内交互场景的语音需求。
实现深度学习的自然语义理解,打造基于理解的人机交互
自然语义理解是人机自然对话的核心技术基础。如何让语音助手实现家庭、汽车和办公室的无缝连接,甚至可以预测并解决用户的需求,只有懂“深度学习”并可以进行“理解”的语音技术才能胜任这样的要求。
在技术开放日上,深入探讨了这项AI技术如何实现深度学习。人工智能技术基于数据的逻辑分析,在一定程度上的确可以实现自我学习,但是相较于人类的情感需求、精神状态,再智能的AI语音助手也难以读懂主人的“心”,因此具备理解能力的人机交互成为技术攻关的重点所在。
根据腾讯技术开放日·腾讯云小微专场直播所演示,腾讯云小微AI语音助手以高质量低延时语音合成、智能语音交互系统,进化成为真正以用户需求为导向的个性化服务。
物联网时代,语义理解成为语音交互的核心所在。通过声学前端处理,降低干扰信号、抑制回声,提升语音识别效果、语音唤醒效果,随即将文字转换为命令字,通过语料模型匹配,做领域分发。在这个过程中腾讯云小微AI语音助手支持自然语音识别,语义理解、语音指令随意说,系统均可很好的理解并执行,同时将文本转化为语言流,在终端设备上进行语音播报。
仅以智能语音交互系统为例,腾讯云小微AI语音助手向我们展示了在智能车联模式中,人车之间愉悦的交互体验。高效自然的语音输入方式,输入速度远高于手动输入;安全行车释放双手,切换导航、调换歌曲不分散注意力;更重要的是腾讯云小微AI语音助手能够读懂车主语音中所包含的语气、情绪等丰富信息,以做出正确的判断,让行车过程省心省力。
高质量低延时语音合成则为我们展示了智能语音系统的深度学习能力。基于“互联网+”自然语言理解发展成自然的人-机器交互方式是指基于自然语言理解技术重塑人与机器之间的交互方式,使自然语言成为人-机器之间进行交互的自然接口。通过腾讯云小微AI语音助手的语音合成能力,支持纯中文、纯英文以及中英混搭的合成场景,提供50+种不同男女声音色,个性化音色定制能力,王者荣耀妲己、李白定制语音包;采用业内领先的算法,优化不同场景中的语音音色,让AI语音助手发声更为自然。
这是因为腾讯云小微AI语音助手采用专门为机器设计的语言编写程序来“告知”机器,当用户发出某项声音指令时,机器通过深度学习掌握指令的真实意图并执行,达成机器说脱口秀的效果。怎么让机器的音质高保真、韵律更加自然连贯?腾讯云小微AI语音助手给出的答案是神经网络语音合成系统,整体架构上使用序列建模的声学模型与神经网络声码器。通过GAN优化Parallel WaveNet、WaveRNN、FeatherWave等技术升级,达到高质量、高稳定性的自然人声。
客服机器人的功能设计与实现,开放能力降低企业智能化成本
如何通过AI语音助手帮助企业级用户进行商业变现?以客服机器人的接入与实现角度,指出能力获取的方式之一正是在技能开放平台通过标准协议、账号打通、商业转化、推荐运营全面由开发者定制方案,构建由开发者到用户的语音服务路径,让开发者以成本最小化接入客服机器人,实现个性化和精准服务效果最大化,在服务咨询阶段引入客服机器人功能,对节约前端客服人力,提升服务运营效率。
在腾讯云小微AI语音专场我们了解到,腾讯云小微技能开放平台是唯一支持小程序接入的AI行业解决方案,目前已经开放与京东和大众点评的合作,用户语音指令即可操作在京东和大众点评的购物和服务,帮助小程序实现更智能化的用户体验。
腾讯云小微AI语音助手以自身技术为突破点,在客服机器人的实现与接入上,构建起完整的工程闭环。面对未知状态(动态)、非结构化环境下客服机器人的环境感知、环境交互、环境功能等三个方面的需求,在功能设计与实现层,按智能环境系统设计提供客服配置、客服使用、发现问题、解决问题的手段完成任务需求。
在客服配置上,腾讯云小微AI语音助手将文本模式分类拆分为知识库检索、服务售前、服务售后等模式,检索为功能性检索,售前、售后可根据问题回答策略转向人工模式。其中分层模块的搭建上注重知识库的基础搭建,模块分工明确,流程简单。
在客服使用中,采用多线程方式、人机协同,区别普通的聊天机器人,依靠系统功能事件&指令的智能交互,形成更为精准、人性化的索引推荐。
当然,客服机器人还需要加强训练,挖掘算法、索引堆砌并不能解决问题,更多需要明确的系统规则和流程。想要发现问题、解决问题,重要的是实现人工、机器人的交互,在线客服、模型算法、统计监控、配置平台,缺一不可。例如从人工服务界面引用客服机器人的索引,进而给出服务明确的答案。只有快速迭代优化的深度学习,才能适应数字化时代的商业发展需求。
在客服机器人的接入上,应用入口有电商平台网站、WAP平台、微信小程序入口、内部客服助手、语音交互方式等,实现形式基本都是在线模式,webchat方式通过IM、微信小程序、APP入口等实现。
在自然语言处理技术方面,我们主要分享了腾讯云小微的两项前沿技术,1)在2019法研杯阅读理解赛道中获得冠军采用的方案;2)一篇关于信息抽取的发表在人工智能国际会议IJCAI-2020上的最新论文。通过直播,我们看到了腾讯云小微在知识抽取与问答领域的技术积累,并以丰富的案例形象生动的展示了相关技术在实际应用中的作用。
不仅如此,我们还能从腾讯云小微AI语音助手强大的开放能力中发现更多领域的应用探索,比如为企业定制品牌IP形象。这在以往不敢想象,在5G、直播风口,虚拟人以安全、可控、高效成为众多企业热衷的对象,而通过腾讯云小微语音助手提供智能语音交互,根据不同硬件终端和应用场景,可以触发丰富的表情动作,快速换形象。因为腾讯云小微AI语音助手的全双工交互功能,高度智能化免唤醒、主动引导对话,再加上腾讯系正版IP授权服务,AI语音助手的商业变现价值拥有广阔的市场机会。