苹果内部机器人技术研究团队近日发布了一篇创新论文,推出了一项名为“ELEGNT”的框架,专为日常互动中的非人形机器人设计,旨在赋予机器人实用性与情感表达能力。这一研究通过一款智能台灯机器人,生动展示了机器人如何通过肢体语言与用户进行细腻互动。
这款台灯机器人集成了LED光源、摄像头、扬声器、麦克风和激光投影仪等多种组件,能够与用户进行手势、语音、触摸和投影等多种形式的交互。它不仅具备点头、摇尾巴、低头、坐下、躲避和接近等基本动作,还能展现出紧张、失望、凝视和强调等多种情绪状态。
苹果团队认为,非语言行为在人类交流中至关重要,能传达内心状态。因此,在机器人设计中融入表达性元素,如意图、注意力和情感,对于实现更自然的人机交互至关重要。而“ELEGNT”框架正是基于这一理念,结合了功能性驱动和表达性驱动两种设计思路。
具体来说,“ELEGNT”框架包括意图可视化、注意力引导和情绪共鸣三个方面。通过22个运动基元编码,将底层需求转化为可读的身体语言;利用多轴关节实现类人注视行为,如预报天气时自动转向窗外;开发情感状态机,让机器人根据对话语境展现微表情。
为了验证“ELEGNT”框架的有效性,苹果团队进行了一系列对照实验。实验表明,在多个场景下,表达性台灯机器人在实现目标过程中的运动表现明显优于功能性台灯机器人。例如,在用户对物品进行拍摄时,表达性台灯机器人会灵活移动,主动帮助用户寻找最佳光照角度;而功能性台灯机器人则移动迟缓。
表达性台灯机器人在面对用户错误指令时,会多次尝试并略带歉意地摇头表达无法完成任务;而功能性台灯机器人则直接表达任务失败。在充当社交伴侣时,表达性台灯机器人会根据用户询问的天气情况,兴奋地建议用户进行户外活动;在被拒绝后,则会垂头丧气地表现出失落情绪。而功能性机器人则无法与用户、环境产生除了语言之外的互动。
表达性台灯机器人还能积极提醒用户喝水,找到水杯并推到用户眼前,然后抬头盯着用户喝水;喝水完成后,继续为用户正在阅读的书籍照明。相比之下,功能性机器人则只能通过灯光照射在杯子上对用户进行提醒。表达性台灯机器人还能充当“眼里有活”的项目助手,主动变换角度进行照明,并提供教程投影。
这项研究表明,表达性动作能显著提升用户对机器人的好感度和互动投入感,尤其在社交性任务中效果更为显著。苹果团队计划根据研究成果整合出一个全新的生成式框架,让非人形机器人能根据不同场景自动生成既能完成任务又能“有温度”地表达意图的动作。这一研究不仅展示了苹果在机器人领域的创新能力,也为未来人机交互的发展提供了新的思路。