ITBear旗下自媒体矩阵:

搜狗CTO杨洪涛:该以什么样的姿势参与人工智能

   时间:2016-06-30 10:03:17 来源:搜狐科技编辑:星辉 发表评论无障碍通道

6月28日,2016网易未来科技峰会在北京国贸大酒店举行,搜狗CTO杨洪涛进行了主题演讲——《人工智能里的产品观》。杨洪涛认为:“人工智能本身并不创造价值,使用AI技术的好产品才创造价值。以场景思考产品,回归用户欲望,通过技术手段解决才有可能产生出好产品。”

“计算力+数据+服务”是三大核心要素

杨洪涛讲道,机器学习与深度学习在应用角度的两大要素如今已经较为成熟。一方面是计算力,伴随着CPU、GPU,以及各种分布式计算和专用计算平台的发展,这在一定程度上保障了计算力的提升;另一方面,移动互联网的发展带来了大量的数据,而对于互联网产品提供商来说,其接触到的数以亿计的用户,以及用户生产的庞大数据更是助力人工智能的丰厚资源。

然而当谈到产品化,要让“计算力+数据”的闭环做得更好,“服务”就成了一个不可忽视,且至关重要的元素。杨洪涛表示:“正是在服务的使用之中,用户才产生了数据,而数据又在消耗着计算力,对计算力的发展提出更高要求,从而为用户带来更好地体验。用户体验的提升则逆向推动用户使用服务,从而产生更多的数据。因此,计算力+数据+服务是一个产品迭代的完整循环。”

他还提到,现在许多公司把目光局限于技术这一单一领域,他们将自身定位为“一家人工智能公司”或“一家机器人公司”,却忽视了对于如何参与这一行业的深入思考。对于技术本身的关注不可或缺,却不是唯一。

好产品要能生产数据来完成自我进化

除了关注AI技术,更重要的是关注用户场景。只有在用户场景背景下,深度思考用户需求的产品,才能通过“计算力+数据+服务”的闭环,促使用户使用,生产更多数据,从而推动技术产品进步——谷歌的Google Now以及苹果Siri的升级与演进都是如此。

杨洪涛以搜狗输入法在语音识别方面的探索经验为例。众多周知,输入法只有文本输入一种方式是远远不够的,语音输入成为搜狗输入法发展历程上亟待解决的一大问题,而在2012年的时候,搜狗还没有这项技术。那么搜狗是怎样解决这一问题的?先是调用Google国外的中文语音识别接口,为产品提供语音转写功能,随后又在用户使用过程中不断积攒数据,并随着语料规模的不断扩充,逐步降低语音识别的错误率,从2012年40%的错误率到如今的4%,其中产品发展至关重要的一点就在于是否能产生迭代数据的循环。

基于这一案例,杨洪涛总结:“人工智能本身并不创造价值,使用AI技术的好产品才创造价值。MIT人工智能实验室前主管、计算机科学家Patrick Winston说过,人工智能就像葡萄干面包里的葡萄干。其实想要吃饱主要还是靠面包,技术并不等于产品,同时还要去思考产品对用户的服务是什么。”

那么什么样的产品才叫做好产品呢?杨洪涛给出了好产品的三大评判标准:叫好、卖座、赚钱。叫好的产品能获取媒体、投资人的关注,从而得到更多产品开发资源;卖座的产品能获取用户,展开未来的发展想象力;赚钱的产品则能直接为企业发展赢得利润。

对用户欲望的思考要先于技术手段

有了对于好产品的判断标准之后又该如何做出一个好产品?杨洪涛指出,需要回到对用户场景的思考,即需要去考虑是在什么时间什么地点,用户产生了什么欲望?在用户欲望产生之后,才是该以怎样的技术手段来满足用户的欲望。欲望是排在手段之前的,如果颠倒顺序,先看自己手里有什么技术就会犯错误。

他再次以搜狗输入法做语音识别功能为例,解释了该服务背后用户真正的欲望是解放双手。目前,搜狗语音识别的准确率已达到97%,在行业内位列前茅,每日的语音调用次数也达到了1.2亿次。但是即便语音识别的准确率达到了97%左右也仍旧会产生错误,这时用户要进行修改就还需要用手,而这对双手的解放就是不够彻底的。搜狗输入法近期做的新功能“语音修改”,让用户用自然语言的形式进行文字纠错,就是出于这一对使用场景的思考。

这一场景的数据还可以延伸到更多服务:比如当用户开车时,是不方便输入文字的。而通过语音的方式可以让用户在地图产品中用语音进行修改,比如说出“是欢度佳节的佳”就可以把导航目标从“世纪嘉园”修正成“世纪佳园”。

这一功能是符合前面提到的数据生成和解决用户欲望的观点的。“要修改错误,首先需要知道用户的错误发生在什么地方,其次要了解用户是怎样认知和描述这一错误的。这两类数据对输入法和语音识别未来的改进都有相当的促进作用。”杨洪涛总结道。

AI服务的本质是“自然交互”和“知识索引”

对此杨洪涛以开车用户的需求为例进行了详细的解释。传统意义上,导航仅仅解决了“如何从a地前往b地”的问题,而当回归对于用户欲望的思考时就会发现在使用导航时,用户并不只是为了前往B地,其真正的意图在于“去B地做什么”。比如一个人要去机场,这个人是要去哪个航站楼?到底是去出发层还是到达层?航班的情况如何?什么时间到最合适?这些问题都是用户潜在需要考虑的。因此需要对导航背后意图数据做足够的分析,把首都机场分为T1、T2、T3航站楼,导入所有的航班信息,当用户给出航班号便可以得知航班的情况,对应出发和到达,并给出出发时间建议,把这些和语义技术结合在一起做出更好的服务。

他指出AI服务的本质包含两方面,第一是自然交互的技术,包括图像及语音,第二是知识的索引。他坦言,搜狗目前也在这两方面做出了巨大的努力:一方面在自然交互上,搜狗通过用户产生的大量数据不断完善语音识别、语义理解技术;另一方面,搜狗搜索也在做大量的知识索引,包括与微信、知乎的内容引入,明医搜索以及微软必应的合作等。今年4月,搜狗还向清华大学捐赠1.8亿人民币,成立了天工智能计算研究院,相关研究成果也将应用于搜狗下一代产品中。

在他看来,搜索引擎公司是人工智能基因最足的模式,天生就是大数据产品,容易获得用户交互的行为,所以数据本身对于推动整个人工智能研究会有巨大的帮助。只有把人工智能技术与领域的知识结合得足够好,才能够真正的在场景下解决好用户的需求欲望。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version