据国外媒体报道,在萨提亚·纳德拉(Satya Nadella)的内心里,他一直计划在人工智能领域超越谷歌。
在位于华盛顿州雷德蒙德的微软总部,微软首席执行官萨提亚·纳德拉(Satya Nadella)迫不及待地向来访的客人们介绍公司的智能技术,特别是微软在更多智能应用程序和服务开发方面所取得的进展。纳德拉告诉大家,每天早上,他都会带上一副HoloLens全息眼镜,让自己看到投影房间墙壁上的虚拟交互日历。纳德拉表示这种感觉有点让他眩晕。HoloLens全息眼镜是一个智能的、有创意的、而且面向未来的系统,也是微软在纳德拉领导下应该具备的一切。
纳德拉表示,未来无论人们在何处工作,微软都会在那里占有一席之地。微软将会为大家提供一个“交流对话平台”。作为一项对未来的赌注,该平台刚刚在3月份被推出。微软计划通过基于聊天模式的交互接口,将超越应用作为人们未来使用互联网的主要方式,比如信息查询、网上购物以及获得访问多种服务的许可,这些应用软件将会变得更加智能化。感谢微软为人们提供了“认知应用程序”,这种应用软件可以理解人们不同的面部表情、个人情感、以及包含在图片和视频中的其他信息。
借助其20多年来在机器学习和自然语言处理研究领域所取得的进步,微软认为自己已经拥有了最强“大脑”,并能够创造一个由人工智能主宰的未来世界。受早期在中国开展的bots技术研究的帮助,微软在机器与人类情感共鸣方面已经处于领先地位。在全球高科技企业巨头中,微软是第一个发布真实的、以文本为基础的交互聊天平台的公司——这也是智能手机蓬勃发展过程中值得微软骄傲的一点,尽管自己在智能手机领域一直处于靠边站的位置。
今年1月份,美国科技网站The Verge撰文描述了对高科技产业杀手级技术bot的搜寻情况。在随后的几个月中,大大小小的高科技公司都加快了对这一技术的研发速度。社交网站Facebook对外开放了自己的一个Bot研发平台,并开始在自己非常流行的应用程序Messenger上运行。谷歌则宣布在自己一款即将发布的聊天应用软件Allo内部,运行新开发的智能助理。此外,Allo内部还会增加来自竞争对手亚马逊的智能应用程序Home。同时,基于语音输入技术的应用程序Echo也吸引着很多开发者,据报道,这款应用软件已经在300多万个家庭中得到应用,并通过自身API接口增加了近1200项新“技能”。
微软对自己在人工智能领域所取得的成就引以为傲,并且渴望向业界传递这次一定要赢得胜利的愿望。今年6月,微软邀请外界访问公司园区,并让纳德拉的几位得力助手接受采访。这几位助手正在把人工智能技术植入微软公司的每一个角落。在随后的两天时间里,微软向来访者们展示了其多个不同的应用软件,这些应用软件都是该公司在自然语言处理和机器学习领域取得的进步与成果。
这家公司一如既往地谈论自己一个大型的赌局——对未来技术发展走向的预判,这一直是微软公司的历史本能。但是这家公司凭借本能却在上一次赌局中惨遭出局。例如,它先于其他同行认识到了智能手机和平板电脑的未来前景,但是却被竞争对手苹果和谷歌打败了。围绕人工智能技术,微软所做的努力很简单:
为什么这次一定要与众不同呢?
在bots技术领域的构建上,微软所取得的成功远超过其他美国公司。但是有一点外界可能没有意识到,那就是这项技术的成功开始于中国。
2016年1月,在微软众多的人工智能产品中,一款叫做小冰(SHAO-ICE)的智能软件出现在中国东方卫视的早间新闻中。这是一款取代天气播报主持人的智能软件。“小冰”与微软早期推出的搜索引擎“必应”发音相近(Bing的发音),但是后者比前者更加健谈。
如果你想知道微软如此看好bots的原因,小冰就是一个最佳答案。微软搜索引擎必应的技术主管德里克·康奈尔(Derrick Connell)表示:“我还不能说目前我们已经找到杀手级的bot——但是我们已经找到一个bot,它能够以一种全新的方式工作,并能够满足用户对各种交流对话的期望”。
2014年,微软在中国国内聊天软件微信中开通了小冰的账号,小冰可以回答简单问题,功能与微软虚拟助手小娜(Cortana)相似,但小冰更擅长对话。这项bot技术对情绪非常敏感,能够记住人们之前与它聊天的内容。如果你正处于失恋状态,小冰就会察觉出来,而且还会问及你的感受。
当然,在中国取得的成功可能无法转化成在美国的成功。(微软第一款关于英语语言学习的bot实验软件,就是一个巨大的失败)。在小冰成功亮相后的2年时间里,还没有一款能够使用英语对话交流的英文版小冰出现,而且也没有人将其看作是一个紧迫的任务。但是,微软的一些高管们表示,小冰背后的基础架构对公司而言是一个重大的机遇。
“我们希望它成为一个生态系统”。
康奈尔表示:“这是一个新时代——你不必成为语言和语音方面的专家,只要能使用我们的工具就行。借助我们的工具去构建你自己的bot品牌,并让它运行在任何平台上——可以是Slack,也可以是Facebook的Messenger。我们希望它像Skype或Windows 那样,但是最终的选择权在用户手里。”
通过今年6月份举行的Botness大会,微软希望自己置身于bot技术转变的中心位置。如果微软在bot技术领域取得成功,它将会开启一个全新的移动时代。在该公司技术成果的支持下,bot可能会植入全球最流行的各种通讯应用程序中,也会让微软在一个新世界里独占鳌头。
战略
当然,对于下一代计算技术平台定义方面的尝试,微软并不是唯一一家——如果对话交流能够成为这个未来的平台。几乎所有的主要高科技公司和初创公司都在创建人工智能部门,而且常常会推出令人耳目一新的研究成果。但是最值得关注的是,跨越各家公司对人工智能技术进行比较,是非常困难或几乎无法做到的。现在像谷歌、Facebook和亚马逊这样的很多公司,在人工智能领域的技术都尚未公开。当被问及公司人工智能技术有什么明显不同时,这些公司高管都会顾左右而言它。例如,谷歌公司首席执行官桑达尔·皮查伊(Sundar Pichai)就曾轻描淡写地说,公司在人工智能技术领域的工作已经开展了“很长一段时间。”
路奇(音)是一位计算机科学博士,其名下拥有20项专利。他是纳德拉高级领导团队的十几位成员之一,也是微软公司应用程序和服务团队的负责人。他对自己所从事的工作成为公司竞争优势感到欣慰。
面对移动互联网第一波浪潮的低迷,路奇开始投身于人工智能领域。他认为移动设备的网站流量从来没有超过台式电脑,这反映出用户在移动设备方面的互联网体验出现挫折。他认为:“互联网没有在手机上真正得到应用” 。除了个别几个大类的应用外,用户一般抵制下载应用软件。比如来自西雅图的用户被要求下载一个应用软件来确认自己乘坐渡轮的票价——肯定还有比这更好的模式。路奇认为:“整个行业还没有找到一个优秀的体验平台,用于释放整个移动领域和云服务的价值。基本上可以说,应用软件还不是一种正确的模式。”
把所有的一切放在一起,你就会发现为什么微软公司会有如此乐观的感觉。
路奇认为,一个公司要在未来的领域里获胜,就必须要具备五项“关键资产”。第一个是“对话画布(conversation canvas) ”——一个能够允许人们大量对话和收发短信的地方,比如微软的Office 软件、Outlook、Skype 和小娜等。第二个是人工智能“大脑”——一个针对世界的复杂思维模型。微软认为自己在人工智能领域的工作可以追溯到20年前。第三个是对社交网络(social graph)的访问权限——人们在互联网上的活动往往涉及自己的朋友和同事。并非巧合的是,路奇表达以上观点的几天后,微软公司宣布以262亿美元的价格收购全球最大的社交网站LinkedIn ,并获得了该网站近4.33亿名注册用户。
第四部分是用于运行人工智能技术的平台。微软拥有操作系统Windows和一个家族式的众多设备。特别值得注意的是Xbox软件。最后一部分是开发者渴望在别人平台上建立一个网络,并为此向平台付费。而引发外界对以上问题的兴趣,一直是微软3月份召开开发者大会的首要目标。
从个别层面来分析,微软每一项资产都有很强大的竞争对手。例如,Facebook家族式的信息应用软件程序就是一个更加强大的对话交流平台。而且Facebook显然拥有最大的社交网络。谷歌的人工智能“大脑”也许更聪明,因为广义上它连接着数百万个安卓设备。但是如果从以上五个部分的整体来看,也就不难明白微软为什么会如此自信了。路奇说:“如果把这五个资产放在一起,我相信我们可以引领未来。”
大脑
从两年前的Code大会开始,微软已经全面拥抱人工智能技术。而在此前三个月刚刚履新微软首席执行官的纳德拉当时就出现在大会讲台上,与外界讨论微软公司的未来。讲话结束后,纳德拉向外界展示了Skype软件内嵌的一个新特征:两名微软员工上台演讲,一位使用英语,一位使用德语。Skype同传翻译了两位员工的演讲内容,让他们实现了无障碍的语言交流。这是一个令人印象深刻的路演——纳德拉随后就宣布,这项技术在年底会成为产品并进入市场。
这种感觉一点也不夸张,微软现在可以在8种不同语言之间进行翻译对话和交流——总共有56种不同的组合。而且其拥有的底层技术已经超越了翻译领域。你想听到一个令人难以置信的、甚至有魔法的bot技术吗?微软正在测试一款记录商业会议并进行实时转录软件的Beta 版本。就是这款软件,还能够将两个人的访谈内容记录下来,并能够清晰地区分两个谈话者不同的声音——这可能是所有在这个世界上曾经存在过的记者们,最渴望得到一项技术成果。
与此同时,微软公司正在把人工智能资源投入到自己最大的几项特许经营产品中:Windows 和 Office。人工智能未来的希望之一就是它可以预测人们的需求——现在这是谷歌公司最基本的理念。借助人工智能技术,可以将交通、天气和体育赛事等内容传送给你,就算你的手机处于锁机状态也无所谓。
微软正在致力于将这种人工智能技术嵌入桌面应用。马库斯·艾施(Marcus Ash) ,微软小娜研发技术的负责人向外界展示了一个原型版的Windows系统,它使用了大量以云服务为基础的推测,可以推测人们想知道但未说出来的内容。当艾施进入开始菜单时,小娜出现一系列建议内容:一些有意义的名字,最近打开过的文档,常见法语单词的翻译解释(这位用户即将去法国旅行)。得到用户许可后,小娜会将用户联系方式、网页搜寻历史和应用软件使用情况放入自己的推荐内容中去。
微软Office全球市场副总裁科克·科尼斯鲍尔(Kirk Koenigsbauer)向来访的客人展示了很多人工智能在Office软件中得到应用的例子。2014年9月,微软推出一款叫做Delve的应用软件,其包含了Office 365的一种效率跟踪应用功能。这种跟踪功能可以分析用户花在邮件处理和会议上的时间。并在用户日历中突出显示,为完成更多复杂重要的工作所需要的延长时间。Delve可以告知有多少人看了你发的邮件,以及阅读该邮件的时间。它会提醒你联系那些还么有收到邮件的同事,甚至可以显示所有往来邮件的回复时间。
对微软的参观访问使外界更想知道,自己是否以一种错误的方式在思考人工智能的问题。以聊天为基础的交互接口通常都显得单调乏味,但是机器学习技术却让它们再次焕发生机,并且已经应用于人们常用的工具中。如果微软可以把跟Delve一样的智能应用嵌入其他服务中,那么可以理性地说,这家公司可以向世界提供最强大的效率套装软件。就算大部分聊天机器人平台不能实现,但其中也蕴藏着巨大的价值。在bots技术的早期阶段,由于会话平台不能说话而令人深感沮丧。但是当这些平台在后台运行工作时,它们就会给人们带来一种魔幻般的感觉。