滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

字节开源MoE关键优化技术，主流大模型均能接入，训练成本可省40%！

时间：2025-03-10 18:57:52 来源：互联网编辑：汪淼 发表评论无障碍通道

3 月 10日，字节豆包大模型团队官宣开源一项针对 MoE 架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万 GPU 小时训练算力。

MoE 是当前大模型的主流架构，但其在分布式训练中存在大量跨设备通信开销，严重制约了大模型训练效率和成本。以海外主流模型Mixtral-8x7B为例，其训练过程中通信时间占比可高达 40%。针对这一难题，字节在内部研发了COMET计算-通信重叠技术，通过多项创新，大幅压缩了MoE专家通信空转时间。

相较DeepSeek近期开源的DualPipe等MoE优化方案，COMET可以像插件一样直接接入已有的MoE训练框架，支持业界绝大部分主流大模型，无需对训练框架进行侵入式改动。因简洁、通用的设计理念，该工作以5/5/5/4 的高分入选全球机器学习系统顶级会议 MLSys 2025 ，被认为“在大规模生产环境中极具应用潜力”。

具体而言， COMET 从系统层面建立了面向 MoE 的细粒度流水线编程方式，通过引入共享张量依赖解析、自适应负载分配两项关键机制，来解决通信与计算之间的粒度错配问题，并精准平衡通信与计算负载，最终大幅提升MoE流水线整体效率。引入COMET后，单个 MoE 层上可实现 1.96 倍加速、端到端平均 1.71 倍效率提升，且在不同并行策略、输入规模及硬件环境下均表现稳定。

COMET 的设计结构

COMET 与Deepseek 研发的DualPipe方案还可以联合使用。在降低MoE通信开销上，COMET 采用了计算-通信融合算子的优化方式， DualPipe则通过排布算子来掩盖通信，两种方案并不冲突，结合使用或将更大幅度压缩模型训练成本。

目前，COMET支持多种MoE并行模式，部署灵活、方便。同时，COMET核心代码已开源，并向开发者提供了一套友好的 Python API，计划兼容 Triton 等编译生态。

COMET论文链接：https://arxiv.org/pdf/2502.19811

开源地址：https://github.com/bytedance/flux

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

刘强东再当外卖小哥体验生活：仅一人认出，感叹骑手不易

4月21日，刘强东请了京东骑手吃海底捞火锅。期间刘强东称自己下午也去送了几单外卖，上一次亲自送快递已经是10年前了，“每次去送客人都认识我，已经没办法真实体验了。这次只有一个人开门，结果就认出我来了，剩下的都…

04-22

辛巴公司直播夸大宣传被点名，辛有志直播中呼吁包容主播口误

近日，国家市场监督管理总局集中公布了一批直播电商领域违法违规典型案例。其中，广州辛选网络信息科技有限公司主播在直播推广某品牌“酵母调制乳粉（免疫球蛋白型）”、某品牌食品、某品牌“艾草三伏贴”等商品的过程中，…

04-22

刘强东现身海底捞，与京东美团饿了么骑手共聚一堂！

4月21日，刘强东请了京东骑手吃海底捞火锅。期间刘强东称自己下午也去送了几单外卖，上一次亲自送快递已经是10年前了，“每次去送客人都认识我，已经没办法真实体验了。这次只有一个人开门，结果就认出我来了，剩下的都…

04-22

2025年初软件业收入稳步上扬广东领跑全国软件企业数量榜

04-22

白鹿遭恶意P图后，涉事黑粉终道歉！网络暴力何时止？

04-22

团餐企业超6.9万家，供餐新规如何严守食品安全线？

04-22

赏花经济绽放新活力，全国相关企业超千家共绘繁荣画卷

04-22

华瑞指数云SDS2.0：信创场景下的存储新选择，赋能企业数字化转型

04-22

水光针技术革新：高性能电机引领医美注射智能化时代

04-22

中国智造！全球首艘全电驱环保绞吸船“浚澜”号亮相清淤工程

04-22

Intel携手台积电2nm制程，下代PC处理器或将迎来新飞跃

04-22

开启未来新体验巴可亮相北京InfoComm China 2025

4月16日至18日，InfoComm China 2025展会在北京国家会议中心隆重开幕，巴可盛大参展，现场亮点纷呈!沉浸式体验与混合会议两大展区，不仅带来了“沉浸环宇”的震撼视听效果，还首次展示了可立享全家族五大产品阵容，吸引了众多目光。此外，巴可可立享无线会议屏上市会等

04-22

三江网约车加价风波：5司机受罚，行业整治再升级

04-22

Windows屏幕录制文件保存位置，轻松改！三招教你搞定

04-22

宇树科技春晚机器人“假舞”风波：真相究竟如何？

04-22

点击查看更多 +

全站最新

碳纤维“脱险”！欧盟不再将其列为汽车禁用有害材料

vivo X200 Ultra亮相：主打影像旗舰，兼容苹果生态，首款MR头显来袭

DeepMind Genie 2引领机器人训练新篇章，虚拟世界助力AI高效学习

刘强东再当外卖小哥体验生活：仅一人认出，感叹骑手不易

广汽资本联手多家企业成立广祺智行基金，出资高达3.01亿

刘强东现身海底捞，与京东美团饿了么骑手共聚一堂！

热门内容

本栏最新

刘强东再当外卖小哥体验生活：仅一人认出，感叹骑手不易

刘强东现身海底捞，与京东美团饿了么骑手共聚一堂！

白鹿遭恶意P图后，涉事黑粉终道歉！网络暴力何时止？

团餐企业超6.9万家，供餐新规如何严守食品安全线？

赏花经济绽放新活力，全国相关企业超千家共绘繁荣画卷

华瑞指数云SDS2.0：信创场景下的存储新选择，赋能企业数字化转型

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.