在科技及互联网领域,苹果和 Google 是两家绝对绕不开的话题公司。我曾经不止一次说过,中国科技(自)媒体常年不断地唱衰苹果、意淫 Google( Google 回归中国)。 前者长期以来由神一般的乔布斯掌舵,用一次次的「 One more thing」让整个世界不断尖叫;而后者,则在本世纪的前 15 年里,不仅改写了互联网和移动互联网的发展轨迹,也正在为不远的将来描绘了一幅「美丽新世界」的愿景。
如今,两家公司正迈入一个新战场:人工智能。本文将从两家公司现有的商业模式和产品线的角度出发,探讨现阶段以及未来可预见的时间内,苹果与 Google 在人工智能——这个热门词汇背后的理念、布局以及预期。
智能手机时代:苹果与 Google 的路线之争
如果没有 2007 年 1月份乔布斯拿出 iPhone 时的惊艳亮相,由智能手机引领的移动互联网又会是个什么模样呢?答案或许有很多,但有一个主角或许不会缺席,这就是 Google。
当乔布斯站在 Mac World 大会上展示这个重新定义了手机、音乐播放器与互联网设备的时候,时任 Google Android 部门负责人的安迪鲁宾正在前往拉斯维加斯的路上。在他看完乔布斯的发布会后,他甚至对车里的一个同事说:「 我们可以不必发布自己的手机了。」
苹果用天才般的设计和强大的制造能力让第一台 iPhone 更像是一个工艺品,而不是一台像他们早期宣扬的「跨时代的计算设备」。第一代iPhone 不支持 3G 网络,没有多任务运行机制,甚至无法复制粘贴文字。对很多人来说,这仅仅是台炫酷的设备,绝不是一台好用的设备。
在 Android 之父鲁宾看来,iPhone 还不够酷,他的梦想是让全球各国不同运营商、不同品牌的手机上运行自己的系统。基于这个理念,Google 在 2007年 建立「Android手机联盟」,将多个运营商和手机厂商拉拢在一起,他们分工很明确,Google 负责操作系统,手机商制造手机,运营商负责销售。
过去的七八年时间里,苹果与Google 走上了两条不同的发展路径,一个以一部部 iPhone 征服了世界,另一个则通过Android 系统、Google Mobile Service 和日益壮大的手机厂商不断抢占智能手机的份额。下面是截止到 2016 年 5、6月的统计数据,Gartner 的数据显示 Android 和 iOS 瓜分了当下的移动互联网操作系统市场份额,两家的比例大概是 7:3:
另一份来自调研公司 Kantar Worldpanel ComTech 的数据,在截至今年4月底的前3个月,Android在欧洲五个最大市场(英国、德国、法国、意大利和西班牙)的智能手机销量市场份额为76%,与去年同期的70.2%相比增长5.8个百分点。
操作系统市场份额当然无法完全说明问题。苹果借助 iPhone 的销量,成为世界上最赚钱的公司之一,有媒体曾将苹果比喻成「数字时代的石油公司」,其市值曾一度接近一万亿美元。
在最新一季苹果 13 年来最差的财报里,来自 iPhone的收入支撑了本财季苹果总收入的半壁江山(季度总收入为 424 亿美元,iPhone 收入超过 210 亿美元)。苹果的官方数字还显示,自 2007 年到现在的 9 年时间,苹果已经累计卖出了 10 亿台 iPhone 手机。 Google 从未透露过在Android 上赚取了多少钱,不过根据甲骨文律师在 Java 侵权诉讼中的估计,Android 已经为Google 带来 310亿 美元的收入,利润则高达 220亿美元。
无论是技术还是产业趋势来看,智能手机都是「计算」的进化,从人人一台 PC 演进到人人一部手机甚至多部手机,硅谷风险投资 a16z 合伙人Benedict Evans 曾用 76 张 PPT 展示智能手机对于世界的颠覆,下面两幅图展示了智能手机在整个智能设备领域的巨大影响:
人工智能是新一代的人机交互
细心去看,科技的发展史也是人机交互的历史,而人工智能发展的路径同样隶属在人机交互的发展历程里。6 月初,「互联网女皇」 Mary Meeker 的互联网趋势报告中有一副图展示了人机交互的历史:
人工智能的进化是机器越来越聪明的的过程,所谓的「聪明」,体现在人机交互过程中,计算机越来越少地问你问题,比如,现在的计算设备,比如手机已经不会再问:
你想把文件存到哪里?
你想整理硬盘吗?
你想退出应用吗?
为了节省空间你想删哪些照片?
但也有一些新的问题出现:
你想看哪一位朋友的状态更新?
要不要看看你在旅行时拍的照片?
你想吃什么口味的冰淇淋?
上述问题的变化更像是从简单的「yes/no」的二元回答转向更多元的回答,这背后就是计算的改进。从这个角度出发去观察苹果与 Google 在人工智能领域的历史、现状与未来,有助于从根本上建构对于苹果、Google 以及人工智能现状的新理解。
苹果的「设备智能」
2016 年的苹果开发者大会( WWDC )有诸多值得回味的点,从中可以一窥苹果在人工智能方面的思考。长期以来,苹果对于人工智能的定位都是「设备智能」——这是一种将人工智能技术纳入到硬件的处理方式,从最早的 Siri 到现在的 iOS 10 里的图片自动识别和分类机制,事实上,苹果的识别和分类技术并不差,2015 年 9 月,苹果收购人工智能初创公司 Perceptio,该公司可以在无需外部数据库的情况下,基于设备(手机、平板)来进行图像分类。
新 iOS 10 的照片应用可以自动识别人脸、物体,并能够相册里的人物自动分类,新加入的「回忆」,则可以通过对照片的位置信息、人脸照片信息、场景信息等聚集在一起,还支持插入音乐。与此同时,开发者还在 iOS 10 测试版中发现了关于人脸识别功能的其他信息,比如大量关于人脸表情的代码,包括微笑、惊恐、惊喜、哭泣、沉思等等,这意味着 iOS 10 未来很可能支持识别照片里人物的表情信息。
苹果将上述功能加入到一台运行 iOS 10 的iPhone 中实属不易,要知道类似的功能在 Google 与微软那里,都是通过云端数据处理后的返回结果。苹果之所以采用这种方法既有历史原因,也有诸多现实考量。历史上看,乔布斯时代的苹果对人机交互有着异常的坚持,比如 iOS 曾经异常的简洁性——这也意味着毫无选择性的交互方式。乔布斯也曾表示,如果他来做一款 DVD,那么唯一的按钮就是「烧录」,其他都可以舍弃。正是这样对于简洁性的追求,使得苹果的产品线长期以来在功能上的变化都极其克制。
乔帮主已仙逝多年,iOS 自 iOS 7 开始在交互上开始复杂,但将人工智能纳入到苹果产品的过程依然十分缓慢,摆在苹果面前的现实问题有两个,其一,苹果的云服务不如 Google 和微软,至今苹果 iCloud 的服务还有一部分跑在亚马逊 AWS 上,这也使得苹果无法像Google 微软那样通过云端强大的处理性能来处理照片分类、语音识别等。
其二,苹果长期以来的价值观就是对用户隐私的保护。以虚拟助理来说,Siri 早在 2011 年就已经发布,但比起 Google Now、微软的 Cortana 来说,Siri 真的很不智能,原因就在于Siri对于用户数据的收集非常少,而另外两家公司的产品则有点「贪得无厌」,尤其是Google,默认的用户协议里,Google 可以收集用户几乎所有的为其所用。
尤其是在 2015 年 Google 发布颇具里程碑意义的 Google Photo 之后,苹果 CEO 库克在接受媒体采访时公开表示:
在硅谷,许多知名的成功公司利用用户个人信息建构自己的商业模式。它们收集了关于你的一切信息,并试图利用这些信息来赚钱。我们认为这是错误的行为,而苹果也不希望成为这样的公司。
但另一个现实则是,时下流行的深度学习,迫切需要海量数据的「喂养」,同样在今年 WWDC 大会上,苹果要重新定义「大数据」,正式启动苹果的「Differential Privacy」,这个概念由微软的C. Dwork 提出,其基本含义就是基于统计学原理,在一个群体层面收集数据,而非像FB、Google 那样收集个体的数据。由于苹果的 iMessage、 FaceTime 早已部署了端到端的加密技术,因此能够让用户数据以加密的方式上传到苹果的服务器,然后苹果在对于这些群体层的数据进行分析和优化,从而改善用户的体验。
「Differential Privacy」将在今年秋天的苹果各个设备新系统中采用,具体会给 iOS 、macOS、watchOS 带来哪些真正意义的改观还无从知晓,但在另一个重要领域——语音领域,苹果则把一副好牌打成了烂牌。
Siri 与人才之痛
作为乔布斯生前收购的最后一家公司,Siri 肩负着乔布斯对于未来交互模式的远见思考。正如 Meeker 在人机交互历史回顾中展示的那样,几百万年前,人类从声音的交互开始,而文字的发明,则让交互从声音转入文本阶段,于是出现了各种与文本打交道的交互工具。即便如此,人类交流中的 90% 依然还是通过声音来完成,这种更自然也更原始的交互模式在过去半个世纪里并未得到突破性的进展。
自动语音识别(Automatic Speech Recognition ,简称ASR)是一种机器可识别人类说话单词的能力。很长一段时间里,ASR 在准确度上都无法与人类识别相媲美,而在 2010 年,ASR 在识别准确度上迎来一个拐点。
从上图的变化可以看出,2010—2015的五年时间,ASR 准确度得到大幅提升,这种变化超过了过去 30 年到 40 年的变化。事实上,我们现在已经接近一个时刻:机器对于语音的识别能力即将超过人类。
乔布斯看到了基于声音的交互才是人类天性的体现,而技术进步则帮助人类重新回到了最原始的声音交互时代。Siri 在这种情况下成为苹果布局声音交互的重要产品,当时,乔布斯曾被问到收购 Siri 是否想与Google 竞争搜索业务,乔布斯给出的答案很明确:Siri 不是搜索产品,他们要做人工智能。
只可惜,乔布斯并未看到搭载 Siri 的第一部 iPhone—— iPhone 4S 的发布仪式。彼时, Siri 给世界带来的惊喜随着一次次的恶作剧般的调侃趋于平淡,人们突然发现,Siri 几乎没有任何用处。她(他/它)常常答非所问,又经常无故跳出(不小心长按 home 健)…..另一方面,自乔布斯逝世后,原来的Siri 团队核心成员几乎都离开了苹果,包括 Siri 早期开发者的 Dag Kittlaus 和Adam Cheyer 等人又创立了一家 Viv 的公司,其产品可以理解为新一代的 Siri。
如乔布斯当年所言,语音交互正在成为人工智能最有可能爆发的领域。看看市面上的科技公司们,亚马逊、微软以及 Google 、Facebook,无一不在这个领域发力。苹果也推出了应对之策。
2015 年 10 月开始收购了英国语音技术初创企业VocalIQ,这家公司一直以可实现机器自我学习著称;其次,苹果在今年开发者大会上进一步开放 Siri ,开发者可以在 iOS 应用里直接调用 Siri 的借口来实现语音识别、搜索的功能,考虑到 Siri 和搜索已经成为 iOS 10 无处不在的功能模块,未来不排除越来越多开发者在应用里加入 Siri ;第三,全平台的 Siri 或许才有价值,下一代 macOS 即将配置 Siri ,未来的 Apple Car 的交互设计中,Siri 将担当核心角色。
然而不管是不断优化的设备智能和对 Siri 的强化训练,苹果在人工智能人才、论文方面也面临诸多挑战。有媒体盘点过 2015 年苹果的挖人名单:
2015年年初,前苏黎世联邦理工学院自动系统实验室副主管Paul Furgale加入苹果;
7月,前意大利经典汽车厂商菲亚特克莱斯勒集团质检总监Doug Betts加入苹果。
8月,大众前工程师 Megan McClain、特拉斯前工程经理Hal Ockerse、前高级工程师Jamie Carlson加入苹果。
9月,芯片制造商Nvidia公司人工智能专家、深度学习软件主管Jonathan Cohen 加入苹果;
10月,电动摩托厂商Mission Motors申请破产,旗下一部分优秀工程师投奔到了苹果旗下;
上述几位除了Jonathan Cohen 之外都与秘密研发的 Apple Car 有关。2015年9月,苹果罕见发布招聘广告,大规模招募人工智能和机器学习方面的人才。路透社去年援引艾伦人工智能研究所 CEO、华盛顿大学教授 Oren Etzioni 的话表示,在招募机器学习人才方面苹果的起步较慢,不过苹果正试图追赶竞争对手。
更重要的一点还在于,由于坚定的用户隐私保护措施,机器学习创业公司 Dato 联合创始人 Joseph Gonzalez 评价道:「苹果希望其手机能在不了解外部世界的情况下快速响应用户需求,以此方式实现人工智能,很难实现。」
与此同时,Google 从一开始就定位于信息的收集、整合,其基于信息的智能已爆发出不小的影响力。
Google 的人工智能:让流动的信息产生智能
早在 2001 年,拉里佩奇对于 Google 的定位就是人工智能。这个理念源于拉里·佩奇的恩师威诺格拉德,上世纪 70 年代,威诺格拉德曾作为MIT人工智能实验室的一员,一门心思要制造与人类思维匹配的智能。然而威诺格拉德看到所谓人工智能在各个领域的溃败,同时又受到加州大学伯克利分校教授塞尔斯「中文房间」理念的启发,最终退出这个领域。
1998 年,威诺格拉德和他的学生拉里·佩奇、谢尔盖·布林及其导师拉杰夫·莫特瓦尼联合发布了一篇学术论文《你能用自己口袋里的论文做什么?(What Can You Do with a Web in Your Pocket?)》,该论文提出了谷歌搜索的产品原型。同年,佩奇和布林从斯坦福大学毕业,创立谷歌,通过改善人类信息组织和发现的方式,创造一种可以为人类服务的智能方式。
该论文的概念也体现在 Google 的 Slogon 里:「整合全球信息并为其使用」。因此 Google 对于信息背后的智能方式有着天然的热爱,硅谷资深记者 Steven Levy 在六年前探访Google 总部后这样写道:
Google 搜索的最大创新是引入新算法 Page Rank。而网络搜索是一个多方过程。
首先,谷歌机器人获取每个可访问网站的内容。这些数据将被分解成一个索引(通过文字进行组织,就像书本的目录),这样就可以根据内容找到任何页面。每当用户键入一个查询,谷歌就会在索引中搜寻相关页面,然后返回一个包含多达数百万页面的列表。最复杂的是对列表进行排序,也就是决定哪些页面应该出现在最上面。
此时,上下文便有了用武之地。所有搜索引擎都会引入上下文,但没有一个像谷歌那样引入得那样多、应用那样自如。PageRank本身也是一个信号,同时也是页面的一个属性(指其相对于其他网页的重要性),该属性可以帮助确定其与查询内容的相关性,其中的一些信号在现在看来是显而易见的。
2012年,Google 提出了知识图谱,所谓知识图谱,简而言之就是一种深度挖掘搜索词潜在的知识关系,来呈现更结构化的搜索结果。比如当你搜索硅谷,你所看到的不仅仅是关于硅谷的网页信息,还提供结构化及详细的关于主题的信息,下图的右侧就是 Google 的知识图谱:
将杂乱无章的网页到结构化的实体知识,搜索引擎可以通过知识图谱给用户提供更具条理的信息,甚至顺着知识图谱可以探索更深入、广泛和完整的知识体系,让用户发现他们意想不到的知识。Google 高级副总裁艾米特·辛格博士一语道破知识图谱的重要意义所在:「构成这个世界的是实体,而非字符串(things, not strings)」。
根据 Google 官方的说法,知识图谱的信息来自许多来源,包括CIA的世界概况,Freebase 和维基百科,通过知识图谱,Google 在践行「整合知识并使其可用」方面迈出了坚实的一步。
2011 年开始,Google 引入深度学习框架。深度学习并非什么新技术。上世纪60年代发明后,先后在 80 年代和 90 年代初期流行过一整,但随后就逐渐消沉。但在 Google 看来,深度学习需要的海量数据恰好也是 Google 最擅长的领域,与此同时,对于计算能力的高要求也是 Google 自身技术架构足以应对的。
深度学习最开始由吴恩达推动的Google大脑计划,Google 技术大拿 Jeff Dean 也参与其中。当时想通过使用神经网络来提升技术水准,但并没有把研究做成像大学象牙塔那种,而是结合 Android、Gmail、图片去改进产品解决真正问题。
2012 年 6 月,《纽约时报》率先报道了 Google 大脑项目,吸引了公众的广泛关注。公众第一次了解到,利用16,000个CPU Core的并行计算平台去训练含有10亿个节点的深度神经网络(DNN,Deep Neural Networks),使其能够自我训练,能够实现对2万个不同物体的1,400万张图片进行辨识。
到了 2012 年年底,在业界关注的图片分类的竞赛 ImageNet 中,Google 一支采用深度学习的精英团队完败给 Geoff Hinton 手下的博士生团队。这也促使 Google 重新开始认识深度学习带来的巨大价值,一年后,Google 高价收购了 Geoff Hinton 的团队,并全面开始在产品里部署基于深度学习的相关技术。
从早期基于 page Rank 的搜索技术到引入知识图谱以及全面整合深度学习,Google 一遍遍地将互联网上的原始信息、基于 Android 系统收集到信息、利用Google 服务( 搜索、Gmail、Youtube)搜集的信息清洗、过滤、重组,寄希望于从这些「0和1」的组合里找到智能的存在方式。
2014 年 10月,Google 推出 Gmail 的「进化版」—— Inbox,这是一个基于对邮件自动扫描后的重新展示,自 Inbox 的帮助下,用户收件箱里的邮件可以自动被归类到「旅行」(如机票邮件)、「财务」(如信用卡账单)、新闻资讯(如各种网站的订阅) 。2015 年的 Google I/O 大会发布的 Google Photo 令人震惊。Google 开辟了对于照片处理的新方式,基于深度学习的算法,Google Photo 可以自动识别、分类,并支持自然语言搜索。
Google :把鸡蛋放在多个篮筐
直到 2015 年夏天 Google 宣布重组,或许很多人还没有意识到这家公司的业务有多繁杂,在新的 Alphabet 架构下,新 Google 聚焦在在线业务和 Android 产品线以及云服务。尤其是在 Google 商业模式即将转型的大背景下,人工智能或许将出现在更多的 Google 产品里。
长期以来,Google 的盈利渠道都是广告。在今年 4 月财报电话会议上,Google CEO 桑达尔·皮查伊公开表示:Google 将加快云计算业务发展,并计划在 2020 年使云计算业务超过广告业务。就在皮查伊上述表态的前后,Google 云计算服务签下了Netflix、Spotify 这样代表未来的企业级大客户;并挖来曾一手打造 VMware 的 Diane Greene 来统领云计算团队。
2016 年 7 月的腾讯「云+未来」大会上,马化腾这样定义未来:「未来互联网行业就是利用人工智能在云端处理大数据。」这实际上也是Google 在做的事情。皮查伊的这一幅手牌就是 Google 构建的云计算生态。今年的Google Next 云计算大会上,Google发布了面向开发者的新机器学习平台,并开放语音识别API等等,如果再加上去年推出的 TensorFlow 平台,Google希望通过将这些人工智能的服务模块化、开放化,让云计算的PaaS 层、IaaS 层的服务都具备人工智能属性,从而能够快速完成数据处理。
DeepMind 则是 Google 的另一个秘密武器。日前,Google 宣布在数据中心的节能方案中采用 DeepMind 的算法,效果显著。根据官方的数据显示,这项技术帮助该公司将电力使用效率(PUE)提升了15%,与使用效率提升同时带来的则是耗电量的下降,如果能将数据中心的耗电量降低10%,便有可能在几年时间内为 Google 节约数亿美元电费。而进一步来看,倘若 Google 能在数据中心节能方面不断优化,其云计算的价格极有可能继续下降,在云计算服务目前还处在价格敏感阶段的时候,Google 的想象力还很大。
总结
上世纪 60 年代,包括约翰·麦肯锡、马文·明斯基在内的人工智能先驱们坚信,只需十年时间就足以制造一种可以匹及人类智能的智能。后来的故事大家或许都知道了,半个多世纪的时间,人工智能在寒冬与初春的交替中缓慢前行。现在,在算法逐步成熟、数据量增加以及计算能力突飞猛进的帮助下,我们或将有幸见证一次最接近人类智能的智能。
与过往不同,这一次的智能诞生在每个人的手里紧紧握着的智能手机。本文并没有去对比其他互联网巨头,包括微软、亚马逊、Facebook 以及中国 BAT 的布局和思路,但无一例外,你能感受的这些智能都或多或少地在你的指尖呈现。
从计算普及到交互进化,苹果和 Google 在两条不同的道路上快速前进,相比来说,包括微软、亚马逊、Facebook 在内的人工智能计划都与 Google 类似,而坚守「隐私价值观」与「设备智能」 的苹果,似乎并没有同盟者……虽说殊途同归,但观察以及见证他们的行进故事,也颇具意义。