科技范儿十足的百度AI开发者大会,连喝茶都不走寻常路……
“茶博士,给我来杯茶。”
“客官,喝茶前先为您展示一段长嘴壶茶艺表演怎么样?”
“好啊,你都会什么茶艺?”
“我会的可多了,您要看哪一个:凤舞九天、春风拂面……鱼跃龙门”
“就这个吧”
“好嘞,您瞧好了 ”
……
“茶博士”移动到茶桌附近,以一招精湛的“鱼跃龙门”,将长嘴茶壶挥舞在空中旋转。一气呵成,完成长嘴茶壶倒茶的系列动作。
7月3日,百度CTO王海峰博士在“Baidu Create 2019”百度AI开发者大会主论坛上,与“茶博士”的逗趣互动十分抢戏,这个获得满堂喝彩的“茶博士”其实是一个机械臂。
这个茶艺机械臂,背后是机器人视觉、语音、自然语言处理等多个领域的人工智能技术的赋能。通过综合运用这些AI技术,百度打造了一个可以语音交互,又拥有高超茶艺水平的茶艺机器人。
茶艺机器人的伶俐言辞要归功于百度的语音能力,以及智能对话系统训练和服务平台UNIT。在语音方面,基于百度大脑流式多级截断注意力模型(SMLTA)使茶艺机器人的语音识别速度和准确度大幅提升,而茶艺机器人能够流利的回答,是借助百度大脑风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音,不仅保留语音中的音色、风格、情感等要素,使用时还可任意组合、灵活控制。而UNIT平台则为茶艺机器人提供业界领先的对话理解和对话管理技术,比如准确理解用户指令的强大的泛化理解能力,根据TTS播报的打断位置,判断用户指代的列表项,做出精确反应等,UNIT平台与语音的融合,可以让人与茶艺机器人进行智能对话互动。
茶艺机器人想要动作潇洒、挥洒自如,则要借助3D视觉跟踪技术。这一技术可实时检测茶杯三维位置信息,即使顾客任意放置水杯,它也能精准获取杯子位置。此外,根据长嘴壶的特殊形状及其特定的水流出水方式,茶艺机器人能自动生成合理的茶壶运动轨迹,出色完成无水溅出的倒茶效果。
短短2分钟的表演,背后是百度大脑AI技术的雄厚积累。从产业的角度看,想要实现类似的效果,需要技术储备的宽度和技术打磨的深度。今年的百度AI开发者大会上,作为百度AI多年技术积累和业务实践的集大成,百度大脑正式升级为5.0,成为软硬一体的AI大生产平台,为产业开发者带来更多可能,让他们能借助AI技术实现产业的智能化升级,打造新业态。
未来的AI,充满想象!今天的机器人擅长茶艺表演,明天的机器人或许会做大碗宽面,后天……小二,来一碗大碗茶配大碗宽面!