高通Cloud AI 100平台开始出样：75W实现400TOPS算力

时间：2020-09-17 09:26:22 来源：cnBeta.COM编辑：星辉 发表评论无障碍通道

AnandTech 报道称，高通去年宣布的 Cloud AI 100 推理芯片平台，现已投产并向客户出样，预计 2021 上半年可实现商业发货。虽然更偏向于“纸面发布”，且未能披露硬件的更多细节，但借助其在移动 SoC 世界的专业知识，这也是该公司首次涉足数据中心 AI 推理加速器业务、并将之推向企业市场。

随着芯片开始出样，高通 Cloud AI 100 推理芯片终于从实验室走向了现实，并且披露了有关其架构设计、性能功耗目标在内的诸多细节。

据悉，高通为商业化部署提供了三种不同的封装形式，包括成熟的 PCIe 4.0 x8 接口(在 75W TDP 上实现 400 TOPS 算力)、以及 DM.2 和 DM.2e 接口(25W / 15W TDP)。

DM.2 的外形类似于彼此相邻的两个 M.2 连接器，在企业市场上颇受欢迎。DM.2e 则是体型更小，封装功耗也更低。

从架构的角度来看，该设计借鉴了高通在骁龙移动 SoC 上部署的神经处理单元(NPU)的丰富经验，但仍基于一种完全针对企业工作负载而优化的独特架构设计。

与当前的通用计算硬件(CPU / GPU / FPGA)相比，专用型 AI 设计的最大优势，在于能够实现“传统”平台难以企及的更高的性能和能效目标。

性能数据方面，高通拿目前业内常用的解决方案进行了对比，包括英特尔 Goya 和英伟达 T4 推理加速器(基于砍了一刀的 TU104 GPU 芯片)，每瓦每秒的推理能力为 ResNet-50 。

据说 Cloud AI 100 在每瓦性能上较竞品实现了重大飞越，且高通在另一幅图表中展示了一个相对公平的比较。

有趣的说法是，其甚至能够在 75W 的 PCIe 外形尺寸内击败英伟达 Ampere 架构的 250W A100 加速器。且在功耗降低 25% 的情况下，性能还较英特尔 Goya 加速器翻了一番。

这样的性能数据，让许多人觉得难以置信，不过从 Cloud A100 的芯片规格来看，事情其实并不简单。该芯片包含了 16 组 AI 内核，和达成 400 TOPS 的 INT8 推理吞吐量。

辅以 4 路 @ 64-bit 的 LPDDR4X-4200(2100MHz)的内存控制器，每个控制器管着 4 个 16-bit 通道，总系统带宽达 134 GB/s 。

如果你对当前的 AI 加速器设计比较熟悉，就知道它与英伟达 A100 和英特尔 Goya 等推理加速器竞品的带宽有较大差距，因为后者具有高带宽缓存(HBM2)和高达 1-1.6 TB/s 的带宽。

即便如此，高通还是设法为 Cloud AI 100 平台配备了 144MB 的片上 SRAM 高速缓存，以达成尽可能高的存储流量。

高通承认，在工作负载的内存空间占用超过片上 SRAM 的情况下，该架构的性能将有所不同。但对于目标客户来说，这样的平衡设计，仍是有意为之。

后续该公司还展望了更大的内核、以及在多个 Cloud AI 100 加速器之间横向扩展。在被问及如何达成 15W 至 75W 的动态功耗范围时，高通宣称其正在调整频率 / 电压曲线，以及调制 AI 核心的数量。

想象一下，一套完整的 400 TOPS 75W 设计，包含了一个工作频率较高的芯片。而 15W TDP 的版本，可能以较低的频率在运行。与此同时，7nm 的工艺节点，有助于其进一步降低功耗。

精度方面，Cloud AI 100 的架构体系支持 INT8 / INT16 和 FP16 / FP32 精度，能够带来足够的灵活性。高通还提供了一组 SDK，以便为各项行业标准提供交换格式和框架支持。

高通公司目前正在向客户提供 Cloud AI 100 推理加速器的样品，主要部署目标为工业和商业领域中的边缘推理工作负载。

为推动生态系统和为软件开发提供支持，该公司还推出了新的 Cloud Edge AI 100 开发套件，其中包括了一个集成该加速器的小型计算设备、骁龙 865 SoC、以及用于蜂窝连接的 X55 5G 调制解调器。

鞭牛士 10月31日消息，法拉第未来今日宣布，公司已收到之前在2024年9月宣布的3000万美元承诺融资的所募资金净额。据悉，这笔资金来自中东、美国和亚洲投资者处，最终投资金额于本周收到。所募资金净额将支持…

10月31日消息，针对外地机主在北京办宽带多交200元安装费一事，中国联通客服回应称，关于北京宽带问题，联通已在跟进。对此，截至发稿时，北京联通尚无官方回应。（贝壳财经）…

由于延伸自餐饮外卖，因此即时电商也继承了“外卖基因”，本地商店成为供给货物的核心单元，用户在平台上搜索时，商品的提供者一般都是“附近门店”即商家，比如大型商超/夫妻店/连锁门店/前置仓……而给门店提供产品的品…

HUAWEI Sound X4共推出了悦动白和韵律黑两种配色，从外观上看，HUAWEI Sound X4保持了此前圆润的设计，并且支持智慧幻彩灯效，其采用了48颗全色系RGB灯360°环绕，光影能够追随音乐…

在数字经济的驱动下，零工经济正以前所未有的速度崛起，截至2023年底，我国灵活就业人口已达2亿人，这一数字不仅彰显了零工经济的蓬勃生机，也预示着未来就业形态的新趋势。身边云作为中国领先的共享服务平台，致力于为企业用工模式转型提供数字化工具，根据行业性质及

基于对Agentic Al时代来临的笃定，孙涛勇表示微盟将“紧跟AI技术发展，All inAI"，并从”AI+SaaS（助力SaaS商家智慧经营）、AI+营销（AI驱动智慧营销降本增效）、To B（提供个…

IPO前，Tang Li（唐莉）博士直接持有华昊中天约1.03%已发行股本，而BaygenQTInc.、北京北进缘、珠海华欣、珠海华锦、珠海京蓉及珠海华蓉（均由TangLi（唐莉）博士控制）则合计持有华昊中…

截至2024年4月30日，傲基科技持有的现金及现金等价物为9.38亿元。 IPO前，陆海传（直接及透过乐清傲基成长肆号（由陆海传控制的实体））及迮会越分别于公司已发行股本实益拥有19.43%及11.22%，…

活动现场，DeepWay深向营销公司总经理张晓帅在都江堰相关领导、徐上上及李波的见证下，将象征100台DeepWay深向换电重卡的“车钥匙”郑重交付给鑫程辉物流总经理邓锐。四川鑫程辉物流有限公司董事长李波…

对此，京东11.11针对黄金品类升级包括“双十赔付”“假一赔四”“材质保障”“克重无忧”等四大服务保障，通过提供高于行业的服务保障全方位守护消费者权益，并在京东11.11带来了造型可爱寓意好运的狗头金10元/…

事实上,知乎数亿用户群体涵盖各行业领域专业人士,积累了海量专业文献的问答、查询、讨论需求。本次知乎直答专业搜索升级的中文文献数据库,同步集合在“知识会员”中,用户可以通过专业搜索和知识会员两个不同场景和路径,…

同样低价的还有阿迪达斯男子跑步系列DURAMO 10跑步鞋,京东现货到手价199元,对比某平台549元的预售价,超300元的差价快够再买两双鞋了;而耐克NIKE空军1号休闲鞋,京东现货到手价仅需599元,某…

这一举措是微软于 2023 年 11 月推出的“安全未来计划”的一部分，旨在增强其产品的网络安全保护。IT之家从报道中获悉，此项变更将于2024 年 12 月 2 日起影响所有新租户，并于 2025 年 …

10 月 31 日消息，科技媒体 Android Headline 昨日（10 月 30 日）发布博文，展示了 One UI 7系统的诸多新功能 / 新特性，涵盖了新版图标、智能通知管理、作业帮助、家长控制…

同时，在中国三星多产融合模式和可持续发展理念的启发下，杨维娜等创领者不仅利用废弃青柿子打造了现代化柿子漆生产线，还研发出了一系列柿子深加工产品，并致力于柿染文化的传承，从而带动了富平整体文旅产业生态的提升，为…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.