科学家正在让机器人变得无所不知,无所不能。深蓝计算机下棋战胜人类,工厂生产线上马机器人,军事战争中机器人的应用增加…这些似乎与人们的生活并无多大关系,基于软件和互联网的虚拟机器人则已经开始实实在在影响我们的生活。
Siri掀起以语音交互为核心的语音助手,用户可以通过它告诉手机do something。但如果要问知识类问题,它就没辙了。在“无所不知”上,百度小度机器人近日取得重大突破。
9月20日上午,小度机器人亮相全国科普日展览活动,得到了前来参观的中共中央政治局常委、中央书记处书记刘云山等领导的肯定,并在现场吸引了大量学生群体围观。而不久前在江苏卫视知识问答闯关节目《芝麻开门》中,小度机器人成为首个非人类挑战者,全部正确地回答了主持人提出的40个问题。连“请问小度,外国戏剧,作者萧伯纳,薇薇怀疑母亲的职业”这样的复杂问题也能精确回答。这似乎说明了,在信息高度发达的今天,知识已经不再是个人的核心竞争力,而是能力、思维和资源。
小度机器人亮相江苏卫视《芝麻开门》
信息经过时间的沉淀成为知识,知识再提炼则是智慧。一个残酷的现实摆在你面前:机器人比你懂得更多,而背后的核心技术就是深度问答。
业界对深度问答的定义为:基于对用户自然语言的理解,通过对海量数据的深度分析,给出问题的精准答案,它包含了一系列如知识图谱建设、语义表示和计算、语义匹配等复杂技术的聚合。深度学习是更基础底层的应用,是深度问答技术的支持。可以看到难点主要有两点:正确理解用户复杂和多变的需求;掌握海量结构化的知识库数据。这正是百度所长。
小度机器人背后的深度问答技术,是基于百度在自然语言处理、语音技术方面的积累上研发而成的。前者显而易见,深度问答依赖的自然语言处理技术——包括语言的理解、计算和生成,知识的挖掘和整合等等——帮助小度不但能听懂人类的语言,用人的思维识别背后的含义,还具有丰富的“学识”,可以回答人类提出的各种知识类问题。而后者,则是语音识别、语音合成、音频检索等语音技术让小度更具互动性。
当然,知识问答技术的应用场景自然不会只是答题闯关。这项技术已在百度不少产品中广泛应用,其未来还有更多应用场景。
在百度上搜索“濒临灭绝的动物”则会直接出现大熊猫等动物的图片结果集;搜索“羽绒服能用洗衣机洗吗”、”花生发芽能吃吗“等问题时,搜索引擎能直接给出丰富、准确的观点聚合搜索结果而非单条链接。在移动场景下,搜索“孕妇不能吃哪些东西”,结果将是现代医疗提供的孕妇禁忌食物信息的聚合;而更复杂的信息提取和聚合,比如搜索“小孩打嗝怎么办”,搜索引擎也可以经过深度问答技术从海量的网页数据中精准提取出问题的答案,让人一目了然。这些均是深度问答技术的应用。
除了让搜索更好用之外,基于深度问答技术开发的学习助手可以让学生学习更有趣,它们可以被加载到手机、电视、教室或者玩具;医疗助手则可以帮助人们了解自己的健康问题;如果在博物馆或者科技馆放置问答机器人则可以改变讲解和科普方式。
可以说,深度问答技术将改变人们获取知识的方式。不再只是被动式的教育或者通过书本和媒体。全新的知识获取能力让人类获取知识更加容易,知识的存储,死记硬背这样的方式正在落伍,人类有更多时间去创新、思考和创造。未来的搜索引擎一定是无所不知无所不能的,它能听会说,会思考,懂用户。与后端的服务结合,与物理机器人深度结合之后,便可以在回答用户问题的同时帮助用户做事。也就是说,深度问答技术将让搜索引擎更加接近人类的智能伴侣。