ITBear旗下自媒体矩阵:

Siri的幕后团队正开发新AI语音助手:Viv

   时间:2016-02-15 08:57:51 来源:互联网编辑:星辉 发表评论无障碍通道
Siri的幕后团队正开发新AI语音助手:Viv

Viv是一家来自加州圣何塞的人工智能公司。在拜访该公司办公室的当天,我不幸迟到。我错过了从旧金山开出的火车,而手机上的打车应用刚巧也无法使用。不过,我要去见的人达格·吉特罗斯(Dag Kittlaus)则看到了积极的一面。

“你在来访途中的遭遇完美地证明Viv将如何带来帮助。”他表示,“一种更好的办法是,你可以说:‘我要前往圣何塞,给我提供一些选择’,随后Viv将可以知道,你距离火车站有多远,下一趟火车何时到站,最近的出租车在哪,以及前往圣何塞的车费是多少。”

吉特罗斯是Viv联合创始人及CEO。这家人工智能创业公司已有3年历史,获得了Iconiq Capital等投资机构的3000万美元投资。Iconiq Capital协助马克·扎克伯格(Mark Zuckerberg)和其他科技行业富豪管理财产。在圣何塞市中心的办公室里,Viv正在开发吉特罗斯所说的“全球大脑”:一种全新的语音控制虚拟个人助手。这一语音助手有着独特的个性,能完成数千种任务,同时不局限于手机,可以集成至包括冰箱和汽车在内的各种设备。吉特罗斯表示:“告诉Viv你想要做什么,它就能调动庞大的服务网络,处理你的需求。”

这一项目的目标远大,而吉特罗斯也并非此道新手。他参与创立的上一家公司发明了Siri,而Siri目前已成为苹果产品中标准的虚拟助手服务。2010年,苹果以2亿美元的价格收购了Siri,并于2011年将这一技术集成至iPhone,向全球用户提供了一种与移动设备互动的新方式。谷歌(微博)和微软随后也推出了各自的虚拟助手。近期,亚马逊和Facebook也在发力这一领域,分别推出了智能音箱Echo和试验性服务M。

不过吉特罗斯表示,所有这些虚拟助手的能力都存在局限,而Viv应运而生。“如果你有一款强大1万倍的系统,那么会发生什么?”他表示,“这将改变互联网经济。”

CB Insights分析师马修·王(Matthew Wong)跟踪科技行业的非公开投资。他表示,大型科技公司正围绕虚拟助手展开竞争。这些科技巨头渴望获得新技术,让产品更精巧,并试图通过日常工作的自动化发掘商机。如果它们成功做到这一点,那么用户将会在手机上花更多时间,这意味着更多广告收入和硬件销售。对创业公司而言,这也是一个极具吸引力的市场。马修·王表示:“在Facebook和谷歌公布正在从事的工作时,其他企业也会密切关注。”Wit.ai的技术将语音和文本转换为可操作数据。该公司仅成立一年多时间,就于2015年1月被Facebook收购,并协助Facebook开发了M。

西雅图艾伦人工智能研究所负责人奥林·艾奇奥尼(Oren Etzioni)表示:“我们将会与自己的计算机对话。但事实情况是,当前所有设备都缺乏我们所需的足够计算能力。”他所说的计算机也包括手机。他认为,如果希望在未来取得成功,那么企业应当推出堪比酒店礼宾员的虚拟个人助手:用户可以与它展开复杂的对话,通过它获得高质量建议,它甚至能为你安排妥当今晚的全部活动。

2008年,Siri Inc从硅谷非营利研究实验室SRI International完成了分拆,随后推出了Siri。吉特罗斯很早就投身至移动互联网。2007年,他受雇于SRI International,成为入驻创业者,并与软件工程师亚当·切耶尔(Adam Cheyer)建立了密切联系。切耶尔是Calo(学习及组织认知助理)项目的负责人。这一来自五角大楼的人工智能项目耗资2亿美元,持续5年时间,目的是给士兵提供帮助。吉特罗斯说服切耶尔,Siri是手机的完美搭配。他们随后将这一概念变为了原型产品,并找到了第三名联合创始人汤姆·格拉伯(Tom Gruber)。作为iPhone应用的Siri于2010年初发布。

指着Siri Inc曾经的办公室大楼,吉特罗斯回忆起了差点错过乔布斯电话的那天。吉特罗斯表示:“乔布斯说,‘我喜欢你们的工作。你们能否明天来我家,一起谈谈这件事?”第二天,他们与乔布斯谈了3个多小时。“我们将公司出售给苹果,因为乔布斯坐下来和我们说:‘让我们改变世界共同运转的方式’。这令人难以拒绝。”

在随后一年半里,吉特罗斯带领苹果的一支团队筹备iPhone版Siri的开发,而切耶尔和格拉伯是工程负责人。在这款产品发布的次日,也是乔布斯去世的当天,吉特罗斯宣布因家庭原因离职。切耶尔在苹果继续工作了9个月时间,随后追随吉特罗斯离去。(格拉伯目前仍留在苹果。)

在拉丁文中,Viv是“生命”一词的词根。这款产品诞生于2012年年中。当时,吉特罗斯、切耶尔和另一名前Siri软件工程师克里斯·布里汉姆(Chris Brigham)在一次头脑风暴中设想了接下来将要从事的工作。他们认为,市面上现有的语音助手存在技术和商业上的限制,并据此提出了Viv最初的目标。吉特罗斯表示:“我们一致认为,在一个伟大而漫长的故事中,Siri只是第一章节。”

吉特罗斯拿出自己的手机,演示了Viv的原型产品(他拒绝透露Viv的具体发布时间,但暗示2016年将会是重要一年)。他对手机说:“我需要去找圣何塞距离最近的儿科医生。”Viv随后按照距离远近给出了当地儿科医生列表,并附带了在线预约就诊服务ZocDoc上的评价信息。吉特罗斯点击其中的一条信息,而手机随后告诉我们,Uber车辆可以在多久之后前来。“如果我点击,那么就会有一辆车过来。”他表示,“看看这些服务可以如何配合工作。”

他随后又演示了另一项操作。他对手机说:“给我母亲买12只黄色玫瑰。”Viv能获取手机通讯录的信息,并将这些信息导入至可实现全国配送的在线花店。吉特罗斯表示,Viv能完成的其他工作包括,“在前往亲戚家路上,我需要买高品质红酒以及千层面”,以及“帮我在加勒比海找个地方,让我在3月最后一周带孩子去度假”。随后,我也测试了Siri和谷歌语音助手在执行这些命令时的结果,而Viv明显更强大。

吉特罗斯指出,Viv的不同之处是这款产品的设计完全开放。任何公司或个人需要的各种服务、产品和信息都可以被集成至这一网络,并与已有信息整合。(原型产品中已经提供了Uber和Florist等公司的服务)。其他虚拟助手则是封闭的。例如对于Siri,只有苹果可以决定向其中整合哪些功能。

Viv的最大秘诀在于动态整合多种服务,以响应用户各类请求的技术。吉特罗斯表示:“这一程序能自行编程,而这也是将互不相关的数千种服务整合在一起的唯一方式。”其他个人助手根据预定义程序来响应用户请求,而没有自主选择的能力。因此,这些服务不可能考虑用户问题中的各方面因素并做出针对性回答。Viv还加入了学习元素:这一个人助手能根据用户偏好自行调整。

吉特罗斯表示,Viv的最初定位是一款手机应用,但该公司更远大的目标是将Viv整合至各种设备,包括汽车。在他看来,Vivo的标志未来将无所不在。“只要你看到这一标志,那么就意味着你可以与这台设备对话。”当然,这需要一定时间:一方面,企业需要贡献出自己的服务,而另一方面,Viv也需要获得用户的接受。不过吉特罗斯表示,全球最大的一些消费电子公司正有意加入。

吉特罗斯认为,Viv有可能变革互联网经济。目前,许多公司投入了大笔费用在谷歌搜索引擎中做广告,而流量主要来自互联网用户的关键词搜索。然而,如果搜索请求直接输入至Viv,那么中间环节将可以不复存在。Viv团队仍在探索多种不同商业模式,其中一种是针对每笔交易收取一定的处理费用。

艾伦研究所的艾奇奥尼惊叹于Viv的初步演示,并欢迎该公司对当前虚拟助手功能的模式转型。他表示:“他们正在追逐一场盛大的游戏。如果让我下注某一支队伍,那么就是Viv。”不过他也承认,目前还无法判断,Viv能否实现该公司宣称的目标。“这是一家高风险公司。”

艾奇奥尼指出,突破简单陈述,参与更复杂的双向对话对Viv来说很重要,而这也是人工智能发展中的一大难题。例如,Viv或许可以根据评价网站上的信息向用户推荐顺路商店中有什么样的高品质红酒,但用户的问题可能更复杂:这款红酒的价格是否在考虑范围内?他表示:“变化因素很多,你希望有技术能处理这一切。”

Viv也面临着激烈竞争。互联网巨头正在升级当前的语音助手,而另一些创业公司也专注于这一市场。那么,Viv是否会像Siri一样,在未来某天卖给某家科技巨头?吉特罗斯并不排除这样的可能性。“我们的目标是无所不在。我们不会认为,实现这一目标只有一条路可走。”

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version