声网AI x IoT新方案，能否重塑智能硬件语音交互体验？

时间：2024-10-13 03:22:46 来源：ITBEAR作者：顾雨柔编辑：瑞雪 发表评论无障碍通道

【ITBEAR】在GenAI技术的推动下，各行各业正经历着深刻的变革，智能硬件行业也不例外。一方面，AIGC与机器人的融合促进了具身智能产业的迅猛发展，科幻电影中的清扫机器人“瓦力”和医疗机器人“大白”正逐步成为现实。另一方面，智能手表、智能眼镜、智能耳机等穿戴式智能硬件与多模态大模型的结合成为了新的发展趋势。

回顾2017年，天猫精灵、小爱同学、小度等语音助手驱动的智能设备被视为第一批AI硬件革命。尽管这些设备经过多年的市场培育已逐渐融入我们的生活，成为许多家庭的语音助手，但其AI智能化水平仍相对初级。然而，随着GenAI的兴起，更智能化的多模态大模型为智能硬件注入了新的活力，带来了全新的人机交互体验，也催生了智能硬件行业的新一轮变革。

在智能硬件与多模态大模型的结合下，穿戴式设备的交互体验正迎来重大变革。据声网的市场调研显示，多模态大模型在智能硬件场景的应用主要集中在智能眼镜、智能手表、智能耳机等穿戴式设备上，同时在智能门铃、智能陪伴玩具等IoT场景也有所应用。不同场景下的用户需求与场景特点存在一定差异，例如智能手表，尤其是儿童智能手表，是多模态大模型最早落地的IoT硬件场景之一。360儿童手表、小天才等品牌已率先集成此技术，流畅的AI互动问答不仅填补了儿童的空闲时间，还通过智能化的回答为儿童带来知识科普的价值，辅助教育学习。

图：「Ray-Ban meta」智能眼镜

智能眼镜则更加注重通过AI提升语音交互能力。以meta联合雷朋推出的「Ray-Ban meta」智能眼镜为代表，这款产品通过加入摄像头、AI等功能，使用户可以通过语音交互让眼镜帮助安排工作与日程，或者实现百科问答、学习辅助、英文翻译、语音导航、超拟人情感陪伴及音乐娱乐等多种功能。在AI与RTC技术的加持下，智能眼镜还支持第一视角音视频回传，包括音视频通话、视频录制、直播等，同时还支持实时翻译、同声传译等场景，搭配手势识别，实现跨语言环境的语义理解。

智能耳机与大模型的结合则主要集中在实时翻译、情感交流、录音转写等核心功能。在实时翻译方面，智能耳机主要应用在1对1翻译场景，支持双方对话过程随时发言，无需等待翻译完成或对方发言结束，非常适合双人会议、差旅、教学、社交等高频深度对话场景。三星Galaxy Buds系列无线耳机、时空壶W4 Pro等产品就是其中的代表。同时，借助RTC技术，智能耳机还能实现多人同频道、AI降噪等功能。

在情感交流方面，Ola Friend智能耳机是一个热门产品，它可以实现英语陪练、旅行导游、情感交流等功能。对于开发者而言，声网提供了快速、易用、完整的解决方案，并采用了灵活可扩展的AIAgent架构，具备工作流编排能力。开发者与企业可以自主选择LLM等组件，根据特定需求定制和扩展AI驱动的实时互动体验。

在GenAI的趋势下，IoT行业还涌现了智能陪伴机器人、智能儿童毛绒玩具、智能戒指等一系列智能硬件场景，为用户带来不同硬件终端下的AI语音交互体验。

作为全球实时互动云行业的开创者，声网一直在探索GenAI与RTE结合带来的体验提升和场景创新。此前，声网发布了实时多模态对话式AI解决方案，并在此基础上针对IoT行业的特殊性，探索出了AI x IoT智能硬件解决方案。该方案能够在低功耗、低算力芯片上快速实现大模型的接入，具备低延时实时互动、低成本灵活适配的特性，通过丰富的功能在智能硬件场景中构建真实、自然的AI语音交互体验。

图：声网AI x IoT智能硬件解决方案架构图

英特尔正式发布了酷睿Ultra 200S系列处理器家族新品，其中英特尔酷睿Ultra9-285K、英特尔酷睿Ultra7-265K、英特尔酷睿Ultra5-245K、英特尔酷睿Ultra5-245KF四大新款…

【太平洋科技快讯】10月12日，荣耀官方发布了GTPro平板电脑的预热海报，公布了该设备的更多配置详情，据悉，这款设备将于10月16日正式发布。荣耀平板GT Pro配备了一块12.3英寸的OLED电竞屏，…

图片中，小米集团副总裁、中国区总裁王晓雁手持一款神秘机型。该机采用家族式镜头Deco设计，竖置闪光灯在镜头外右上方，手机顶部似乎并无额外开孔。参考小米新机发布节奏，该机大概率就是小米15或者小米15 Pro…

10月9日和10月10日，市场研究机构Canalys和IDC分别发布了2024年第三季度全球PC市场的数据，均显示苹果电脑的出货量出现了大幅下滑。据Canalys公布的数据，2023年，苹果电脑在中国市场的…

飞傲FA19标配耳机线为八股共224芯单晶纯银线，与FH9、FX15的配线相同，纯银线具有更好的电导率，高频信号传导速度更快，所以纯银线主要在高频和低频上有较大的提升，高频听感细腻，解析好，提升空气感，低频…

罗技全球办公品类负责人Art O’Gnimh分享道,“POP Icon Keys就在这样的目标下诞生,它不仅为用户提供优越的打字体验和智能快捷键,匠心独运的产品设计还让这款产品能够成为点缀办公空间的潮流桌搭。…

据了解，Buchanan通过在笔记本电脑的DRAM数据总线上焊接一根约10厘米长的天线，使电脑对电磁干扰变得异常敏感。他通过点击附近的压电打火机来诱导位翻转，并编写了一个漏洞利用程序，将这些位翻转转换成一个s…

今日（10月12日），恐怖游戏《无人》在Steam上架，支持简体中文，并预计于2024年第四季度发售。有兴趣的玩家可前往商店页面了解更多详情。玩家扮演的角色来到一条空无一人的街道，这里似曾相识却弥漫着不安。…

近日，全球领先的IT市场研究和咨询公司IDC发布《2024年上半年中国云终端市场跟踪报告》，在公有云部署浪潮趋势下，中兴通讯凭借与运营商的紧密合作登顶云终端市场冠军，在云终端总体市场出货量、VDI解决方案云…

这也是我们选择三款，双系统+超薄平嵌冰箱进行横评的原因，看看它们能否切实解决用户食材串味、占用空间、保鲜度不够的使用痛点。从三台冰箱的保鲜能力来说，15小时后的失水率都不高，明显可以满足日常生活的所需，但…

2024-10-12 15:36:59 作者：姚立伟据外媒报道，近日，厂商Akasa推出了一款名为AK-ENU4M2-01的主动散热USB440Gbps移动硬盘盒。该硬盘盒长宽高分别为103.75×5…

1 性能卓越：突破轻薄本性能界限对于传统轻薄商务本，最难突破的便是性能，联想YOGA Air 15 AuraAI元启版采用英特尔酷睿Ultra 7 258V处理器，单核峰值性能提升18%，在打开应用、浏览…

优派推出了一款型号为“VX2771-4K-HDU”的27英寸显示器，这款显示器的主要特点是支持4K 60Hz + 96W PD USB-C。总结起来，“VX2771-4K-HDU”是一款非常优秀的显示器产…

2024-10-12 16:38:05 作者：姚立伟 OPPO A3i手机今日正式上架京东平台并开启预售，预计将于10月15日19:00发布。据博主透露，OPPO A3i可能是海外A60 5G的套娃产品。…

2024-10-12 16:55:54 作者：姚立伟 OPPO A3i 手机现已在京东平台开启预约，预计将于10月15日19:00正式发布。根据商品页面的介绍，该机提供星辰紫和静夜黑两种颜色，并具备超硬核抗…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.