云知声的多模态场景突围：软硬结合，端云互动

时间：2019-01-28 11:40:42 来源：北国网编辑：星辉 发表评论无障碍通道

半年前，云知声发布了首款面向物联网的 AI 芯片雨燕(Swift);半年后，云知声宣布了多模态 AI 芯片战略，曝光了正在研发的三款 AI 芯片：第二代物联网语音 AI 芯片雨燕 Lite、面向智慧城市的支持图像与语音计算的多模态 AI 芯片海豚(Dolphin)，以及面向智慧出行的车规级多模态 AI 芯片雪豹(Leopard)。

从 2015 年芯片项目确立并搭建团队「正规军」，2017 年「造芯」项目进入攻坚阶段，再到 2018 年 1 月做出第一个 MPW(多项目晶圆)，2018 年 5 月份做了发布首款芯片，6 月份启动量产，9 月份发布了基于雨燕的开源方案，云知声的脚步没有停歇。紧跟着，芯片设计团队从语音技术转战至图像 IP 设计。

在经历了 2018 年的商业化洗礼后，国内人工智能企业愈发重视技术和产品方案的完整性和普适性。当人工智能在应用场景的加速落地，AI 芯片的价值毋庸赘言，而「多模态」一词开始被越来越多地提及。

商业变现更进一竿

随着技术迭代和场景需求叠加，AI 芯片的边界发生着微妙变化。2015 年云知声决心做硬件时，专门为此在深圳设立分公司。一套完整的芯片开发过程相对漫长，期间不可避免地会涉及算法迭代，对芯片的研制速率造成影响。雨燕从设计到研发，直至最终量产，时间周期为 3 年。要保证 2015 年立项的芯片，仍适用于时下主流的算法，云知声联合创始人李霄寒并不否认这项任务的艰巨性。凭经验对算法预判之外，团队还要拿出勇气和魄力唯此一搏。

作为云知声的芯片品牌，「雨燕」是 UniOne 芯片矩阵中的初代产品，它围绕智能家居和智能音箱等场景，集成 IoT 人机交互的各项技术，云知声发布这款芯片时称赞「雨燕」是以 1/10 的价格挑战 50 倍的性能。

「第一代 AI 芯片雨燕的架构非常典型。云知声做了两件事情：一是专门设计的具备自主知识产权的高性能 DSP，做音频数据处理，二是做面向音频的人工智能数据/神经处理器。当把这个人工处理器集成进去以后效果是显而易见的，相对于通用方案提升了 50 倍。在硬件设备方面，因为这个芯片是高度集成的，所以外围的线路使得很大的成本降低三分之一」，他说。

黄伟表示，云知声在芯片上下足了功夫，为 B 端客户提供了一套完整的解决方案。其不仅利用人工智能引擎对「雨燕」进行调优，还专门为硬件产品设计 app。客户即买即用，无需再找其他供应商，这是云知声今后芯片提供销售服务模式。

去年 9 月，云知声推出了基于「雨燕」的解决方案，并进行开源，正式推出正对智能家居和智能音箱场景下的解决方案。截至目前，基于「雨燕」的全栈解决方案已导入的各类方案商及合作伙伴已超过 10 家，包括美的、奥克斯、海信、京东、360、中国平安、硬蛋科技等，相关产品有望在今年第一季度上市。

「在 2015 年的这个时间点，我们真心没有想过 2018 年我们会推出自研芯片，不光做出来而且还卖出去了。」黄伟透露，云知声 2018 全年数亿元的营收较上年 3 倍的增长，几乎全部仰仗于芯片的功劳和正确的商业化路径，预计在 2019 年营收再翻 2-3 倍。而看似几个亿的营业额背后，实则撬动了几十亿甚至上百个亿的产值。

另一场革命

在 2012 年公司成立之后，同年 9 月云知声就推出了语音识别功能，专门面向端云互动。经过 6 年多发展，云知声已经拥有成面向物联网单日用量达到 5 亿次的云平台，并为平台开发了 ADPC 模式，它是云知声 AI 深度处理的核心。

2014 年初，团队把语音识别技术分别切入到「AI 生活」和「AI 服务」两个场景中。很快，算法平台化的雏形初现，创始团队很快意识到，光有能力是不够的。「算力和算法的融合，同理于技术与场景结合」，于是云知声便有了「云端芯一体化」的产品技术架构。

当云、端、芯被认作物联网产品端的三要素，云知声立即展开对 IDM 产品的开发，并于在 2015 正式量产，出货量呈规模性增长。

与此同时，2015 年，云知声遭遇来自业务端的「战术端的挑战」，主要有两方面：

第一是来自数据处理的挑战。在跟用户打交道的过程中，注定有大量新数据的导入，语音、头像、手势等数据需要处理，深度互联对算力的要求更高。追求高效就要采用基于深度神经网络的算法，这意味着云知声需要在终端提供更加充分的算力。

另外一个约束来自成本。为解决算力问题，云知声不得不采用更好的算法，导致了成本大幅提升，这对于硬件来说十分敏感。成本之外，更强的算力还意味着更多的功耗。非插电产品的「续航焦虑」指望电池性能得到提升显然不现实。

那么主要矛盾如何化解?云知声认为，基于深度学习的新硬件，即「边缘侧的人工智能芯片」势在必行，这场「自我革命」是 2015 年芯片项目的整体思路。

眼下，只强调算法优势的 AI 企业，很难再满足 B 端客户的场景需求，致使企业的市场竞争力和话语权逐步衰减。尽管云知声创始人兼 CEO 黄伟接受采访时没有明确表态「不做芯片就会被淘汰」，但必须承认，软硬结合才是 AI 企业未来立足之根本。

在产品落地的过程中，算法和芯片二者不可或缺。「如果市面上有适用的芯片还好，如果没有我们就要造」，黄伟指出，「造芯」是云知声的自我选择。这不是它擅长的事，但云知声还是做出来了。去年 5 月 16 日，云知声把第一代 AI 芯片雨燕(Swift)摆在众人面前。黄伟放言，即便是现在，「雨燕」的各项指标仍保持业内领先。

多模态的进击

新年伊始，云知声正在开发的 3 款芯片，会在年内投产上市。一款是面向语音场景的第二代 AI 芯片雨燕(Swift)-Lite，其主要特点是更加轻薄;另一款是面向智慧城市场景的多模态 AI 芯片海豚(Dolphin)，这款芯片是云知声在 2019 年非常大的投入，继承云知声的 DeepNet2.0，它不仅仅支持雨燕的功能，还支持摄像头、ISP、OD 和人脸识别;第三款是云知声与亿咖通科技合作推行的车载多模态 AI 芯片雪豹(Leopard)，它更加着重本地算力，提供本地语音搜索，无网络的状况下也可通过语音导航选址，并具备一定的图像处理能力。

作为一家靠语音技术做强的公司，云知声看到多模态场景的大势所趋。2018 年，云知声进入图像领域，并投入了不少资源。李霄寒解释，云知声已经完全具备硬件平台能力和分布式机器学习能力，以及数据高速处理和迭代能力。做这些事情不是兴趣始然，而是为了满足物联网场景下，芯片设计的需要。

当前，云知声图像识别的准确率高达 99.8%。除人脸识别外，云知声还有物体识别、表情分析、颜值分析、标签化能力，这背后得益于 DeepNet2.0 的算力加持。

DeepNet 是云知声开发的深度神经网络处理器，DeepNet 1.0 面向语音技术，DeepNet 2.0 面向多模态，后者既支持图像处理，同时支持语音处理。目前云知声 DeepNet2.0 已在 FPGA 上得到验证，其算力将在 AI 芯片海豚 Leopard 上得以体现。

较 1.0 版本相比，DeepNet 2.0 首先是兼容性更好，可支持 LSTM、CNN、RNN、TDN 等网络;其次是支持可重构计算，DeepNet2.0 计算单元可以拼接应对计算模式，模式切换也可以快速组合，用单条指令来计算公式;第三是支持 Winograd，芯片做乘法的耗时远远高于加法，基于这一点，Winograd 把乘法耗时降低为原来的 1/2，进一步提升效率。

此外，李霄寒介绍了 AI 芯片在算法应用方面取得的新进展——「超听限同向降噪技术」。所谓「超听限」顾名思义，就是让机器识别到人类听觉范围以外的声音，而「同相降噪」可满足在嘈杂的远场环境下，保证芯片灵敏精准地捕捉到人声。

云知声现阶段的目标明确，就是在物联网技术面前，选择某个重点场景切入，将算力和应用服务更好地结合。而李霄寒笃信，物联网时代的重要命题，是将「能力下沉到设备端」。

展望未来的物联网 AI 芯片的发展路径，云知声团队一致认为，连接方式、安全性、PPA(Power，Performance，Area)是核心。但 AI 物联网芯片仅仅考虑这三要素还不够，场景化、多模态、端云互动这三大方面将深刻地影响 AI 芯片的设计、定位、成本、功耗和芯片需求。

12月16日，讯飞AI录音笔旗舰新品S8离线版重磅上市。该款产品为完全隔绝外界网络转文字AI录音设备，其所有功能均在本地实现，为对安全性有严格要求的用户群提供了新工具。数据泄露事件频发，信息保护需求凸显数字世界以网络连接为基础，以数据流动释放价值。在数字化浪潮

核心亮点：解锁电竞未来： ROG将于CES 2025 ROG新品发布会推出多项创新技术，彰显电竞实力超强产品阵容：探索为顶级性能释放和极致使用体验而打造的全新ROG新品笔记本终极性能：全新ROG枪神系列、ROG魔霸系列、ROG幻Air系列及幻X笔记本登场，为极致性能、便携性及潮流设

近日，以“科技赋能家电产业转型升级”为主题的2024中国家电科技年会在湖北武汉召开，海信空调受邀参加“家电噪声技术专题研讨会”，并作主题汇报。同时，“第三届全国轻工适老创新产品及智能健康解决方案大赛”结果隆重揭晓，海信空调以柔风、送风、智能等显著优势一举

时至十二月，又是一年终末。伴随着12.12的来临，厂商们纷纷开启了新一轮的促销优惠。作为年末备受期待的好物节，声势浩大的促销无疑是大家挑选心仪好物的好机会。如果你想在近期为自己选购一款智能手表来激励运动监测健康，不妨尝试一下最新的三星Galaxy Watch7和三星Ga

2024年进入尾声，国补政策即将在12月31日结束，还尚未使用笔记本国补资格的消费者朋友们不妨关注高颜值游戏本华硕天选5Pro锐龙版，其搭载GeForce RTX 4070笔记本电脑GPU，NVIDIA GeForce RTX™ 和 NVIDIA RTX™ GPU 专为 AI 时代打造。RTX GPU 由业界领先的 NVIDIA GPU

《使命召唤：黑色行动6》是由Treyarch和Raven Software联合开发，并由动视发行的第一人称射击游戏，于2024年10月25日正式发布。游戏上线Steam后，获得了广大玩家的好评。动视官方也宣称，《使命召唤：黑色行动6》成为《使命召唤》系列中首发最成功的作。在游戏正式发布

由GSC Game World开发并发行的《潜行者2:切尔诺贝利之心》已在STEAM正式上线,这是一款探索冒险题材的第一人称射击游戏。游戏以2006年第二次核反应堆爆炸事件为背景,玩家将化身为一名“潜行者”,面对一场史诗级的危险战斗。游戏首发即支持NVIDIA DLSS 3技术,搭载耕升 GeF

ROG游戏手机9系列自上市以来，赢得了不少信仰玩家的喜爱与支持，其凭借着出色的性能释放、独一档的185Hz屏幕刷新率，成为了手游爱好者们绝佳的上分利器。全新的矩阵式液冷散热架构9.0此次更是获得了酷冷风扇X Pro、ROG冰川液冷壳等全新配件的加持，使ROG 9系列获得了更

自12月2日掠夺者电竞大赛2025中国区挑战赛招募贴发布以来，受到了来自全国范围内游戏玩家及无畏契约战队的广泛关注，在不到一周的时间内，百余支战队积极报名。本届掠夺者电竞大赛不仅秉持公平公正的赛事精神，更是在战队筛选中推出了平等化社交媒体化的全新规则，在#宏

近日,2024年得力数码打印新品推介会在湖南长沙隆重举行。新品推介会以“善印起航,智绘新篇”为主题,得力集团副总裁张磊、设备事业部行业部总监薛峰、数码打印产品部总监丁启等众多公司领导共同出席活动,与专业渠道客户、行业渠道客户、B2B平台总部负责人等近百位经销商

在2024年12月6日至7日于北京举行的 “2024 T-EDGE全球创新大会”上，众多科技界精英齐聚一堂。大会期间，备受瞩目的「2024 EDGE AWARDS 全球创新评选」揭晓了年度各大奖项，其中，北京智爱未来科技有限公司旗下的AISON爱畅新一代便携式智能K歌音箱凭借“搭载了优质的扬

随着双12脚步的日益临近，2024年最后一场盛大的的购物狂欢节即将拉开帷幕。在这个专属于消费者的节日里，各大手机厂商也为消费者带来了诸多福利政策，给想要手机换新的朋友带来更多选择。作为潮流科技单品的代表，三星Galaxy Z Flip6集时尚设计、实用外屏、出众影像和尖

近年来，随着科技的迅猛发展和人们生活方式的变化，可穿戴设备的市场呈现出蓬勃发展的趋势。近日，国货品牌西普尼重磅发布首款搭载华为智能机芯的珠宝级智能女表，打破传统智能腕表的设计边界，为年末智能穿戴设备市场带来一场视觉与科技的双重盛宴。在外观设计上，它采

作为全球范围内显示技术的一个极其重要的分支，量子点这项在2023年获得诺贝尔奖的尖端技术，近年来引起了越来越多包括TCL、三星、索尼等在内的电视龙头企业关注，其中作为全球量子点显示技术先行者的TCL，近期在该领域再次取得了新突破，推出了量子点Pro 2025技术，并且

冷冬渐至，北风低吟，随着寒潮席卷国内多地，冬季也正式拉开序幕。骤然变冷的天气不仅容易诱发感冒等季节性疾病，同时也打乱了不少朋友们的生活节奏与运动规律。而如果想要在冬季追求健康生活，一款能够监测运动与身体健康情况的三星Galaxy Watch智能手表就成了非常不错

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.