滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepGEMM开源，300行代码解锁AI推理新速度！

时间：2025-02-26 11:45:58 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在科技界的万众瞩目下，DeepSeek开源周的精彩继续上演，此次推出的高性能矩阵计算库DeepGEMM，无疑成为了众人瞩目的焦点。这款被誉为“AI数学加速器”的开源工具，旨在为大模型训练和推理提供前所未有的速度提升。

DeepGEMM在Hopper架构的GPU上实现了惊人的FP8精度下1350+ TFLOPS的算力表现。这一数字远超当前市面上的主流显卡，如RTX 4090的400-500 TFLOPS，展现了其卓越的性能优势。FP8精度，即8位浮点数格式，通过牺牲微小的精度换取了3倍以上的速度提升，这一策略在AI场景中尤为适用，因为AI应用通常对误差具有一定的容忍性。

更令人惊叹的是，DeepGEMM的核心逻辑仅用300行代码实现，却通过全流程JIT编译优化，达到了比手工调优算子更高的效能。这一极简代码哲学，不仅摒弃了冗余设计，还专注于底层优化，重新定义了高性能计算的边界。开发者可以轻松地将DeepGEMM集成到现有框架中，无需额外的依赖项。

DeepGEMM还支持双模式，即稠密矩阵布局和混合MoE布局，以适应不同模型的需求。稠密矩阵布局适用于全量数据的统一计算，而混合MoE布局则能够分任务处理，提高了计算的灵活性。

在FP8精度下，DeepGEMM还展现出了“省电模式”的优势。低精度计算大幅降低了显存占用和功耗，使得万亿参数的大模型在24G显存的单卡上也能实现28倍的推理加速。这一特性在KTransformers项目中得到了验证。

DeepGEMM在MoE模型上进行了杀手级优化。通过连续/掩码双布局，解决了专家模型计算中的通信瓶颈，使得万亿参数的MoE推理速度如闪电般迅速。这一优化不仅提升了性能，还进一步降低了计算成本。

DeepGEMM的开源，预示着DeepSeek在算力领域的又一次重大突破。据悉，DeepSeek正在加速推出其R1模型的升级版——DeepSeek R2，预计将在5月发布。这一升级版将借助DeepGEMM的强大算力，进一步提升模型训练和推理的速度。

与此同时，DeepSeek也重新开放了API充值入口。此前，由于资源紧张，该入口一度关闭。目前，deepseek-chat模型的优惠期已经结束，调用价格已调整为每百万输入tokens 2元，每百万输出tokens 8元。这一调整旨在更好地满足用户的需求，同时也为DeepSeek的持续发展提供了资金支持。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

轻帆云ITSM：智能驱动，赋能企业IT服务管理新高度

02-26

中铁物资携手天翼云，DeepSeek智能助手引领建筑行业数智化新飞跃

02-26

众安信科AI引领行业变革，再登金融科技双50榜单，数智化未来可期！

02-26

微盟WIME携手DeepSeek-R1，赋能微信小店营销，智能化升级在路上！

02-26

Anthropic新推混合推理模型Claude3.7，能否超越当前AI竞品？

02-26

Meta豪掷2000亿美金，加速布局AI数据中心，全球科技巨头抢滩AI新赛道

02-26

携程2024年度财报亮眼：营收533亿创新高，净利润大涨70%至171亿

02-26

ST广网等投资新设科技发展合伙企业，含物联网业务

企查查APP显示，近日，数达天下（陕西）科技发展合伙企业（有限合伙）成立，出资额400万元，经营范围包含：工业互联网数据服务；云计算装备技术服务；人工智能基础资源与技术平台；物联网技术研发等。企查查股权穿透显…

02-26

滕州市交发低空产业发展公司注册成立

企查查APP显示，近日，滕州市交发低空产业发展有限公司成立，法定代表人为王开广，注册资本5000万人民币，经营范围含通用航空服务、民用机场运营、飞行训练、人工智能行业应用系统集成服务等。企查查股权穿透显示，该…

02-26

智元机器人发布仿真框架AgiBot Digital World，海量数据集助力具身智能开发

通过高保真地模拟训练场景，全链自动化地生成数据，AgiBot DigitalWorld可以实现一系列的具身仿真服务，比如惟妙惟肖地模拟各种机器人训练场景等。 AgiBot Digital World的三维资…

02-26

谷歌DeepMind推出免费AI编程助手，程序员：效率爆棚！

为了让人人都用得上AI，Google DeepMind宣布在全球范围内面向个人用户推出Gemini CodeAssist的公开预览版，这是其AI编码助手的免费版本，由Gemini 2.0大模型提供支持。Go…

02-26

Meta拟建超大规模AI数据中心，总投资或达2000亿美元

三言科技 2月26日消息，据报道，知情人士透露，Meta正在就为其人工智能项目建立一个新的数据中心园区进行谈判，该园区的规模将远远超出该公司迄今为止的任何项目，将成为同类项目中最大的之一。根据该公司正在讨论的…

02-26

百分点科技与DeepSeek携手，AI驱动数据治理，释放数据价值新高度

02-26

RWKV开发者大会盛况：RWKV-7能否引领AI架构新革命？

02-26

大语言模型破局二进制安全：反混淆技术迎来新变革？

02-26

点击查看更多 +

全站最新

轻帆云ITSM：智能驱动，赋能企业IT服务管理新高度

联想拯救者Pro34显示器来袭：34英寸240Hz OLED曲面屏，首发仅4999元！

Xbox游戏多平台发布：微软如何实现玩家与开发者的双赢？

浪潮KaiwuDB再获物联网产业殊荣，创新产品与标杆案例双丰收！

天津大学新突破：室温制备手性可控石墨烯卷，助力量子计算

AirPods Max固件升级，6F25版本优化音频并修复问题

热门内容

本栏最新

中铁物资携手天翼云，DeepSeek智能助手引领建筑行业数智化新飞跃

众安信科AI引领行业变革，再登金融科技双50榜单，数智化未来可期！

Anthropic新推混合推理模型Claude3.7，能否超越当前AI竞品？

携程2024年度财报亮眼：营收533亿创新高，净利润大涨70%至171亿

ST广网等投资新设科技发展合伙企业，含物联网业务

滕州市交发低空产业发展公司注册成立

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.