ITBear旗下自媒体矩阵:

微软小娜被误读了,它不是什么“语音助手”

   时间:2014-08-02 09:22:47 来源:IT之家编辑:星辉 发表评论无障碍通道

最近微软再次成为了媒体的焦点,笔者不是指其受到工商总局反垄断调查这件事,而是指最近他们发布了全球首款个人智能助理Cortana(中文名“小娜”),并正式进入中国市场的消息。笔者在浏览媒体对于这个产品的报道时发现,小娜的意义和真正的价值,再次被这些媒体忽略和误读了。

因为笔者发现,这些媒体在描述小娜时,常常称其为“微软语音助手”,并且与苹果的语音助手Siri联系起来进行对比,称“功能类似”。可以想见的是,这些消息传播给国内的消费者的话,会对消费者造成多大的误导。这些媒体的记者们,估计是没有听懂微软所说的意思。

其实微软已经介绍得很清楚了,这些在一些报道里也有体现,但是与上面这些信息混杂在一起,难免会出差错。微软说的是,小娜是一款个人智能助理,请注意,是智能助理,不是语音助手,它“能够了解用户的喜好和习惯”,“帮助用户进行日程安排、问题回答等”。大家可能都知道前一阵子风靡微博的“小冰”,小娜与它是“姐妹”关系,二者虽然定位不太一样,可是都基于同样的必应搜索、大数据和深度神经网络等技术,以后这对“姐妹”,估计也会有功能上结合的机会。

笔者说这些的意思是,小娜并不是这些媒体所指的什么“语音助手”,它是比这个更高级的,基于机器学习的人工智能产品,这是个远比研发语音助手软件门槛和难度更高的领域。在对一款支持语音指令的软件发出“命令”后,通过语言的输入和语义识别,你的手机就可以实现拨打电话、阅读短信、调整闹钟、搜索信息、语音问答等功能,这个是苹果Siri、谷歌的Google Now,以及国内的百度、科大讯飞已经实现了的事情。

可是微软正在做的事情就没这么简单,小娜可以说是微软在机器学习和人工智能领域方面的尝试,微软想实现的事情是,手机用户与小娜的智能交互,不是简单地基于存储式的问答,而是对话。它会记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和“学习”包括手机中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。套用一下微软以色列研发中心负责人Yoram Yaakobi在Think Next 2014大会的话,“用户界面的发展从命令符到图形界面,再到触摸和手势,从现在开始,向看不见的用户界面前进。不需要进行什么操作,身边的技术就能够理解你将要做什么”。一个很简单的例子就是,假如手机中记录的日程显示将要参加会议,那么不需任何操作,小娜到时就会自动将手机调至会议状态。这也是微软的研究,从个人计算机(personal computer)走向个人计算(personal computing)的开始。笔者还觉得,在这样一个对技术和资金要求均相当高的领域,在国内,现阶段恐怕只有百度可以参与进来。

与可穿戴设备和虚拟现实技术一样,人工智能也一门早已有之的技术。上世纪20年代就已出现了它的身影,像1997年IBM开发的超级电脑“深蓝”与国际象棋冠军卡斯帕罗夫的对弈并获胜的例子至今让人印象深刻,在如今的移动互联网横行天下的时代,人工智能将作为支撑商业应用的核心技术,为移动终端带来前所未有的改变。智能助手只是它的雏形,慢慢地,深度学习和人工智能技术将会像电容触摸屏替代物理按键一样,让虚拟键盘和菜单功能成为历史,手机将真正意义上变得智能起来。然而,在商业前景十分乐观时,全球范围内,会不会形成新的“技术和商业寡头”,各种隐私、人与机器的伦理问题,会不会随之而来,这虽然是后话,但也不容回避。当然了,微软现在要做的,还是及时调整策略,纠正媒体传播的上面提到的这些错误信息,让消费者对此有一个清晰的认识,先把WP手机的销量提上去再说。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version
关闭
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群