在人工智能通用智能(AGI)时代的大潮中,字节跳动凭借其强大的大模型基座,重新涉足硬件领域,这一举动引发了业界的广泛关注。其中,字节于2024年10月推出的豆包AI耳机Ola Friend,尤为引人注目。
Ola Friend定价1199元,以其独特的语音交互功能,无需打开手机即可与豆包进行对话,无论是信息查询、旅游出行建议,还是口语练习和情感交流,都能提供即时的反馈,宛如一位赛博世界的挚友。然而,尽管初上市时引发了热议,四个月后,其在京东和淘宝平台上的销量分别为1万+和6000+,这一成绩与Airpods等主流耳机的季度销量相比,仍有不小的差距。
与备受瞩目的AI眼镜相比,AI耳机显得更为小众,甚至未能成为各大电商平台上的独立品类。声智科技产品副总裁黄赟贺在直播中解释了AI耳机与传统耳机的区别,指出AI耳机在智能化、功能丰富性方面有着显著提升,是图形界面交互向语音交互升级的重要形态。
Ola Friend在功能上更倾向于生活助理的角色,但在IKKO联合创始人Echo Chan看来,真正的AI硬件应具备独立的载体和算力,能脱离手机APP独立运行。他认为,Ola Friend本质上仍需依赖手机APP完成所有功能,因此并不完全符合AI耳机的定义。Echo Chan表示,尽管他对AI耳机作为生活助理的实用性持保留态度,但他仍肯定了字节推出AI耳机的价值,认为这扩大了公众对AI耳机的认知,且价格定位在千元以上,已经产生了品牌溢价。
IKKO作为独立智能体的拥护者,其产品配备了智能屏和自有操作系统,能够实现会议录音、转写等AI辅助功能。Echo Chan透露,IKKO在2024年的出货量达到了约6000万营业额,主要销往美国和欧洲,目前月复合增长率超过30%。然而,库存不足是他们当前面临的最大挑战。
字节在发布Ola Friend时,曾尝试与多家耳机公司洽谈合作,但条件是只接入豆包一家语言大模型。不少潜在合作对象因认为豆包大模型与ChatGPT相比仍有差距,且不愿深度绑定豆包大模型,因此拒绝了合作。然而,Oladance创始人李浩乾的思路却与字节不谋而合。他认为耳机是可穿戴设备的重要入口,特别是在通勤场景中。在字节收购Oladance后,Oladance迅速转型为AI耳机,成为了人机语音交互的新入口。
关于字节能否做好一款AI耳机,业界存在不同看法。本质上,这涉及到AI硬件中AI能力与硬件能力哪个更重要的问题。许多AI耳机领域的玩家表示,他们并不将自己视为单纯的耳机公司,而是在开发AI硬件的过程中选择了耳机这一形态。
时空壶的创始人田力对此有着深刻的见解。他创办时空壶的初衷,是用AI技术解决普通人的需求链接问题。时空壶的W系列翻译耳机,虽然保留了TWS耳机的形态,但却舍弃了听音乐功能,专注于跨语言沟通。他认为,AI技术与现实需求之间仍存在距离,而时空壶正是要填补这一空白。
另一AI耳机品牌WISHEE也表达了类似的观点。他们推出的AiEar产品,拥有独立的OS系统、智能屏幕和esim卡功能,更像是一个独立的AI智能体而非传统TWS耳机。WISHEE的市场负责人表示,AiEar正面向国内市场推广,并计划出海。
科大讯飞旗下的未来智能,则是少有承认自己在做AI耳机的公司。他们推出的讯飞AI会议耳机,在续航、声学设计等方面都进行了大量研发升级。未来智能CPO柳达表示,他们在组建团队时曾低估了硬件的重要性,后来及时调整策略,提高了硬件人员的占比。
回到豆包AI耳机本身,字节虽然拥有强大的AI基础设施,但与某一模型深度绑定也意味着需要经历漫长的磨合期和迭代期。与此同时,大厂做AI硬件也存在决策慢、流程长的问题。业内人士预计,25年下半年才会有大厂正式入局AI硬件领域。
尽管如此,以字节为首的互联网大厂在做AI硬件方面仍具备人才与资金优势。真格基金投资经理李钰看好互联网大厂的软件产品经理创业做AI硬件,认为如果再找到懂供应链和硬件生产的专家组建团队,将是一个有潜力的投资标的。
在AI硬件产品形态方面,目前市面上的产品大致可以分为两大类:一类是在传统智能硬件基础上增加生成式AI功能;另一类是AI重塑产品形态,创造新的用户需求和应用场景。AI耳机则介于这两类之间,既基于TWS耳机的成熟形态,又增加了AI语音交互功能。
然而,关于AI耳机是否容易被用户接受,业界也存在不同看法。RWKV联合创始人罗璇认为,与手指操作相比,纯语音交互更加困难、耗能且可能泄漏隐私。他更看好AI眼镜结合手指+语音的交互模式。
尽管AI眼镜被视为AI耳机的终极形态,但从AI耳机到AI眼镜还有很长的路要走。随着AGI时代的深入发展,AI硬件大战才刚刚开始,未来充满无限可能。