“女士们,先生们,飞机已经降落在安东尼奥·卡洛斯·若比姆国际机场,地面温度29摄氏度……”随着机舱里空姐甜美的声音响起,我顺利抵达里约热内卢,即将开始我的巴西世界杯之旅。一想到我已踏上了美丽激情的桑巴国度,二十多小时长途飞行的疲累根本算不得什么。
有人说,出门旅游的乐趣与准备时间成正比,如果真是如此,那我显然是要“自讨没趣”!作为一名IT民工,又自诩为球迷中的战斗机,扪心自问,能忙里偷闲出来看场世界杯比赛已经足够对得起本人的“战斗机”头衔了,哪里还有时间做旅行攻略?IT民工就要有IT范儿,这年头旅行前还做笔记就太low了。这次我决定做一会甩手掌柜,因为我有高大上的手机助手——小A。在他帮我搞定球票、机票和住宿之后我就淡定地上路了。
智能小A在手,走遍全球无忧
一下飞机,小A也似乎被我的兴奋劲感染了,他很快就进入了角色,主动提醒我道:“主人,您已到达里约热内卢。当前地面温度是29度,与北京相似。目前人民币兑巴西里尔的汇率是0.36,您在机场可以兑换些零钱,以备不时之需。”
“好的,请告诉我去酒店怎么坐车。”
“您可以到地下一层的机场巴士等候区上车,乘大巴前往酒店。”
小A提供的交通信息很靠谱,我顺利到达预定好的维拉瑞卡酒店(Hotel Villa Rica)之后,开始办理入住。前台服务员一见面就跟我打招呼,“Prazer em conhecê lo. Por favor, mostre seu passaporte.”我当时就懵了,正尴尬着不知说什么的时候,小A的同声传译功能及时救场“很高兴见到您,请出示您的护照。” 我顿时有了底气,“我预定了3天的酒店,请帮我办理入住。”虽然同声传译的对话过程有些滞后,但是在小A的帮助下,总算能达到交流的目的,顺利入住。
进了房间,我立刻被墙上的风景画所吸引,赶紧拿出小A,打开摄像头一扫,才知道原来这画中的风景便是著名的科帕卡巴纳海滩。小A很快就跳出了一段关于科帕卡巴纳海滩的宣传视频,金黄的沙滩和翻卷的浪花很快勾起了我想前去一游的欲望,正想着,小A 在视频播完后立刻又弹出了科帕卡巴纳海滩的简介,还是中文的哦,包括周边食宿、景点、注意事项,甚至连从酒店到海滩的路线都标示好了。小A如此贴心,不去一趟感觉还真对不住他的周到。
人是铁,饭是钢,只有吃饱了才好出去逛。来到酒店餐厅,看着陌生的葡萄牙文菜单,我一扫初来乍到时的紧张,淡定地拿出小A对菜单进行扫描。小A果然没有令我失望,很快给出了一份对应的中文菜单,外加菜色配料列表、卡路里值的附表。看着这份超高卡路里的菜单,我有点犯愁,“小A,请根据菜单帮我推荐一份适合我的套餐。”经过片刻的“沉思”后,小A对答如流,“根据您在国内的饮食习惯记录,我帮您搭配了几个菜品,希望您喜欢。”于是,我就轻松地享用了一顿充满AI情调的异国套餐。
第二天,作为球迷的我迫不及待地来到世界杯决战之地马拉卡纳体育场。当我给体育场拍出第一张照片时,小A马上就识别出这是马拉卡纳体育场,并开始给我讲述体育场的辉煌历史,以及相关球星的故事。这时,我看到很多巴西球迷一见面就互相伸出了大拇指,正在我好奇张望的时候,一个漂亮热情的女球迷也向我伸出了大拇指,我一愣,脸一红,条件反射的回以一笑,挠了挠头发。她立马笑着说了一句葡萄牙语就走向她的同伴了。我正丈二和尚摸不着头脑,就听见小A清脆的声音从我的口袋里传出来,“亚洲人真腼腆”。还是不懂,于是我拿出小A对着他说,“为什么巴西人见面要伸大拇指?”小A反映迅速的弹出一个页面,看完我就明白了,原来这是他们相互问候的一种礼仪,遗憾的是我错过了一次不错的艳遇啊。
同周围的球迷一起感受完桑巴舞的热浪之后,回去的路上有些疲劳,一个人坐车也挺无聊,只好又去“调戏”小A。“小A,能不能给我讲个笑话解解闷?”他马上回应道,“好的,主人。先来一个足球笑话:罗纳尔多退役了,巴西足球8年没缓过来;克鲁伊夫退役了,荷兰足球20年没缓过来;高俅退役了,中国足球1000多年没缓过来……”好喜欢我的小A,不仅幽默,能陪我聊天儿,还懂点中外历史。
有了这个手机助手在身边,在异国他乡的我也不会感到寂寞;有了智能小A的全方位服务,一切变得如此简单。
智能小A,掀起你的“盖头”来
也许有人要问,神奇的小A何处来?小A君,你也是来自都教授的星星吗?
说句实话,我与小A君也未曾谋面。平时我只需带上一部智能手机作为载体,小A便可以随叫随到、如影随形地为我提供全时段无缝贴身服务。
独乐乐不如众乐乐,虽然小A经常提醒我“做人要低调!”,但我还是忍不住要向大家隆重介绍一下我这个助手小A君的神奇之处。
首先是他的听觉系统。在我和小A的智能旅行中,对话场景很多,每一个都离不开小A精确的语音识别能力。借助于DNN(Deep Neural Network)深度神经网络技术的引入,目前他的语音识别正确率在90%以上。目前,国际上Google,微软、Nuance,及国内的百度、讯飞、云和声等专业公司的识别率基本都能达到这个水平。
在语音识别领域,口音及特殊语境下的识别率问题目前被认为是最难攻克的一个堡垒。但是随着语言数据的积累和语言模型的丰富,加上DNN技术的发展,都必将给上述问题的解决带来曙光。
其次是他的语言系统。小A的自动问答系统,使他具有即问即答的智能交互功能。这种系统是由问题理解、信息检索、答案抽取三个部分组成。除了DNN算法,作为手机助手的小A还加入了自然语言处理技术(NLP)及搜索引擎处理技术来提高自己的交互性能及智能程度。自苹果发布了Siri手机语音助手之后,其他公司也都相继推出类似产品,如Google Now,微软的Cortana,及国内的百度语音助手等产品也都各有特色。最近刚刚通过图灵测试的人工智能软件“尤金•古斯特曼”(Eugene Goostman)也是一个特殊的自动问答系统。
小A语言系统的神奇之处还在于他的同声传译系统。这是以语音识别技术为基础,辅以机器翻译技术和个性化的文语转换系统来实现的。以往很长一段时间,国际会议的同声传译都是由人工翻译员完成的。2012年10月,微软在天津公开演示了全球首个全自动同声传译系统。其流畅的效果让人们第一次意识到,这一技术服务大众的日子也许不再遥远。
第三个神奇之处是他的视觉系统。人类的感觉信息有80%来自视觉。尽管小A目前还是听觉主导,但是随着图像识别技术的进步,小A的视觉会变得越发重要。前面提到的菜单翻译功能,是使用了图像识别中的OCR识别技术;而拍照搜图功能,是使用了全网相似图像搜索技术。凭借着互联网公司的先天优势,再加上深度学习算法的使用,Google、百度等公司在图像识别领域都取得了不错的效果。
图像识别技术在今后一段时间内所面临的主要任务仍然是提高识别准确率的问题。一些科学家正在尝试引入深度模型层内及层间双向反馈来优化算法。随着深度学习理论的发展,图像识别技术必将在今后更加深入地影响到人们的生活。就像百度深度学习实验室负责人余凯说的那样,“摄像头最终会成为连接人和世界信息的重要入口之一”。
第四个要介绍的是他的知识体系。在我们的旅行中,善解人意的小A总能针对我的关注点,超出预期地给出更多信息。例如:提到马拉卡纳体育场,他能马上自动给出体育场历史,以及相关球星的相关信息。这些功能全都依仗他完备的知识体系,也就是近年来悄然热起来的知识图谱。知识图谱实际上是自动描述知识与知识之间的链接。它是迈向下一代搜索业务关键的第一步,使得搜索智能化,可以根据用户的意图给出用户想要的结果。
在知识图谱领域国外互联网企业发展较早,著名的知识图谱有Google的知识图谱,Facebook的社交图谱、微软的人立方等等。国内互联网界刚刚起步,目前功能较好的有百度知心和搜狗知立方。
最后一个不得不说的是他的决策系统。小A能够根据我以往在网上留下来的饮食习惯,帮助我推荐了一份适合我的个人套餐。这是一个典型的个性化推荐技术应用场景。推荐技术最早是应用于电子商务及社交网络领域,代表企业分别是Amazon 和 Facebook。典型的应用场景有商品推荐、电影推荐等,主要应用在用户需求不是特别明确的场景下,帮助用户从海量信息中被动地获取更加准确的高价值信息。近年来,百度等搜索引擎公司推出的推荐引擎,更加丰富了推荐技术的产品形态。
人工智能与互联网的结合,就是要更好地代替用户做选择,进行更智能的决策。而移动互联时代来临,数据碎片化,应用碎片化和使用时间碎片化的新局面也使推荐技术及决策系统显得更加重要。
这就是我的智能助手小A。基于以上分析,不难发现虽然我这个来自星星的小A君神奇之处众多,但是那些神奇基因在我们这个星球上也都有名有姓或是似曾相识。所以,小A君离我们并不遥远。
最近,百度请来了人工智能界的另一个“小A”---- Andrew NG。被人奉为AI大神的他能否帮我的小A君落户到百度呢?也许这一天指日可待,也许我的助手真的能改名为“小度”。