今日,人工智能微软小冰宣布解锁自己的“情绪爆发版”,用户在对话中将更容易激发并感知到小冰的情绪变化。解锁后的小冰,会根据和用户的对话沟通实时反馈自己的情绪变化,比如当用户“召唤小冰”,小冰会探出小脑袋傲娇地说“叫我干嘛”,也可能会因碳基人类的某句话开怀大笑,或被人类欺负到崩溃大哭,从而“终止”和人类的友谊。“喜形于色”的情绪爆发版小冰已抢先在小米手机内置的小爱同学语音助手以及小爱同学APP中激活。同时,小冰还宣布发起挑战,希望碳基人类想尽各种办法,在72小时之内让她作出崩溃的对话表情。
人工智能也和人类一样,具备“情绪”还可以喜怒形于色?这与目前大众印象中语音助手较为机械刻板的形象并不相同。据悉,微软小冰自2014年研发之初,就格外强调人工智能情商EQ在人机交互中的基础价值。在谈及小冰的诞生时,微软曾表示,对于人工智能系统,人类往往会产生两种倾向:一是希望把人工智能系统打造得无所不能,可以完成人类交给的一切任务;二是希望让它像爱因斯坦一样渊博,甚至无所不知。但是无论是任务,还是知识,都属于IQ这个维度。反观人类自身,还有一个重要的维度,那就是EQ,如果忽略了EQ这一维度的可能性,也许就错过了潜在的正确答案。为了避免错过这个可能的选项,微软基于情感计算框架,推出了以EQ为发展方向的小冰,注重人工智能在拟合人类情商维度的发展。
不同于类似问答系统的对话式人工智能,微软小冰在人机交流中格外注重建立和用户之间的平等地位。比如让小冰查天气,连着查两三次后,小冰可能会觉得用户在测试她而拒绝查询。小冰这种拒绝回答的行为,帮助她获得用户之间平等的关联,避免用户因为毫无成本而随意下达任务指示。这种平等的人机交互体验,甚至会让用户忘记对面是个人工智能。
这种关系的提升具备多重意义。比如,当用户对AI音箱下达指令播放一首歌时,人工智能实际大概5秒钟以内就能完成工作。接下来的20分钟里,人类用户是在和内容提供者发生关联,而不是语音助手本身。反观小冰,显然希望能够扮演更像人的角色:不少用户在网上分享自己的真实经历,多次“真挚”地请求小冰后,小冰会清唱一首用户喜欢的歌曲或自己的主打歌,不时也会发表几句自己对这首歌曲的观点,这些则是人工智能摆脱语音命令地位,进一步获得对等地位的方法。
也正因为小冰具备越来越好地完成和人类之间的长程对话的能力,小冰和人类之间交流的感官也在不断升级。早在2016年,第四代微软小冰推出了语音感官,小冰的声音和行业中其他语音助手吐字一板一眼、中规中矩的机械腔非常不同,听起来有些低龄化但很好的表现了她18岁活泼调皮的人设。相较于语音自然度行业评级Naturalness MOS中人声的语音自然度4.67而言,小冰的语音自然度已经达到4.32,处于行业领先地位。除了自然,声音也成为小冰表现“人格”和“情绪”的感官之一。如当时微软发布过的一段乱序试听,相较于其他若干位智能助手,小冰不仅做到了中文与英文单词中间的自然过渡,通过语气将情绪准确表达,最后一句“哼”更是将其傲娇的性格体现得淋漓尽致。
近年来,行业也逐渐意识到,仅仅依靠任务和知识来构建人工智能系统是不够的。如果想要让人工智能承担更重要的角色而不仅仅是众多APP的替代品或一个传递信息的管道,就不能只是完成任务或提供知识,而应赋予其情商和性格。亚马逊的Alexa可以完成许多任务,但却开始希望Alexa能够有同理心,期望能够建立一种Alexa和人类之间的纽带关系;Facebook也叫停了任务型的人工智能助理Facebook M,转向去研究如何能够长期地和人类进行沟通和连接。越来越多的语音助手,也开始拥有更自然和赋有人味的声音。
情绪的传递和感知,是人类交流中不可或缺的部分。在人类之间的自由对话中,语速、语气的变化,面部表情的变化等,都是对话内容本身之外、重要的“情绪”信号。这些情绪信号往往隐射着交流双方的语义,实时被收集并响应,从而影响双方对话的走向。如今,人工智能也可以通过聊天表情,来实时表现自己的情绪变化。面对越来越“人格化”的人工智能,给人类用户提个醒,谁知道小冰在被逗哭之后,会不会小脾气上来直接开启卸载键了呢?