滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

安谋科技“周易”NPU新突破：DeepSeek-R1模型端侧部署，速度飙升至40 tokens/s

时间：2025-02-14 13:05:57 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

安谋科技近日宣布，其新一代“周易”NPU处理器已成功在端侧部署并运行DeepSeek-R1系列模型，不仅性能表现出色，而且成本效益显著。

这款“周易”NPU专为AI大模型设计，架构上进行了深度优化。据悉，其Beta测试版本已在2024年末向部分早期用户开放，预计今年上半年将正式面世。

DeepSeek-R1系列中的1.5B和7B蒸馏版本推出后，“周易”NPU迅速在Emulation平台上完成了部署与优化，并在FPGA平台上成功演示了端到端应用。测试结果显示，在标准测试环境下，“周易”NPU在首字计算阶段的算力利用率超过40%，解码阶段的有效带宽利用率更是高达80%以上。

该NPU的带宽利用率展现出高线性特性，能够灵活适应从16GB/s到256GB/s的系统带宽需求。在7B版本、上下文长度为1024的场景下，“周易”NPU的最高处理速度可达每秒40 tokens，并支持动态长度的模型推理输入。

安谋科技的软件栈对大模型的支持和优化也达到了成熟水平，通过动态推理优化和硬件算力潜力的挖掘，显著提升了推理速度和吞吐量。目前，该软件栈已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多种主流大模型，并提供了与Hugging Face模型库的对接工具链，方便用户直接部署主流模型。

在硬件层面，“周易”NPU采用先进的7nm工艺制造，单Cluster算力最高可达80 TOPS，能够轻松应对超过16K上下文长度的大模型部署需求。同时，其对外带宽提升至256GB/s，有效解决了大模型计算的带宽瓶颈问题。

“周易”NPU还支持FP16数据精度计算，完整支持INT4软硬量化加速，并具备多核算力扩展能力，满足端侧模型的低首字延迟需求。它还拥有强大的多任务并行处理能力，通过细粒度的任务调度和优先级资源分配，实现了多任务灵活切换，确保了传统语音、视觉业务与大模型应用的高效协同。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

微信内测AI搜索，DeepSeek-R1大模型将入驻？

02-15

小米「超级小爱」接入DeepSeek功能短暂亮相后为何悄然下线？

02-15

清华突破！RTX 4090单卡就能运行满血版DeepSeek，AI算力门槛大幅降低

02-15

清华新突破！RTX 4090也能驾驭大模型DeepSeek，算力门槛大幅降低

02-15

好未来学而思发布“随时问”APP，AI教育应用能否持续免费？

在熊泽法看来，目前基于生成式 AI 的教育产品发展才刚刚开始，基于DeepSeek开源这一出发点，价格、模型性能、应用体验等之间的权衡是因为用户的需要，学而思“随时问”应用App希望提供给用户最高最好的产品…

02-15

马斯克喜迎第13子，美作家低调官宣：愿孩子健康成长远离侵扰

02-15

松山湖材料实验室重磅推出：MatChat AI，材料科学智能问答新纪元

02-15

小米澎湃OS超级小爱，终于迎来DeepSeek-R1大模型支持！

02-15

思维链结构引领AI推理新突破，LLM高效训练不再遥不可及

02-15

AI儿科医生“首秀”成功，助力破解儿科医疗资源短缺难题

02-15

马斯克迎来第13个孩子，生母为美作家Ashley St. Clair

02-15

阿里股价飙升背后：AI大模型成新引擎？

这次阿里股价的上涨并非是电商业务导致，而是中国AI大模型推动。一是除了苹果与阿里合作带来的市场刺激，第二则是阿里通义模型自身在国产大模型中的优势。目前，国内大模型C端形成了3+2的格局，另外两个是阿里的通义…

02-15

马斯克974亿美金收购OpenAI遭拒！

02-15

OpenAI拒绝马斯克974亿收购要约：非营利转营利之路引关注

02-15

小米「超级小爱」DeepSeek-R1模型功能悄然下线，用户直呼遗憾！

02-15

点击查看更多 +

全站最新

国乙情人节遇冷，玩家氪金意愿为何下滑？

魔兽情圣马库斯：圣光之路，种族无界，连男性也成信徒？

索尼PSP重生？20年后终获WPA2加密Wi-Fi支持！

KPL春季赛来袭，电竞选手小红书日常分享引热议！

传祺E8 PRO+满爱上市，21项配置升级，限时特惠20.98万引领家用车新风潮

ATN可换电智能电摩登陆中国，电动两轮车充电难题迎来新解法！

热门内容

本栏最新

微信内测AI搜索，DeepSeek-R1大模型将入驻？

小米「超级小爱」接入DeepSeek功能短暂亮相后为何悄然下线？

好未来学而思发布“随时问”APP，AI教育应用能否持续免费？

松山湖材料实验室重磅推出：MatChat AI，材料科学智能问答新纪元

小米澎湃OS超级小爱，终于迎来DeepSeek-R1大模型支持！

思维链结构引领AI推理新突破，LLM高效训练不再遥不可及

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.