字节跳动开源高性能分布式训练框架BytePS:兼容TensorFlow等主流训练框架

时间：2019-06-27 16:38:16 来源：互联网编辑：星辉 发表评论无障碍通道

近日,字节跳动人工智能实验室宣布开源一款高性能分布式深度学习训练框架BytePS,在性能上颠覆了过去几年allreduce流派一直占据上风的局面,超出目前其他所有分布式训练框架一倍以上的性能,且同时能够支持Tensorflow、PyTorch、MXNet等开源库。

BytePS结合了字节跳动人工智能实验室几个月来对分布式训练通信的多个研究与优化成果,包含通信优先级调度、PS的RDMA实现、针对PCIe switch与NUMA的优化,以及BytePS本身构架的创新等。

深度学习的效果取决于模型与数据,目前行业内不断刷新深度学习准确率的最新研究,大多都基于更大的模型以及更大的数据集。然而,大模型与大数据对训练时的计算能力提出了极高要求,单张GPU卡,或者单台服务器上的GPU卡,已经远远不能够满足内部训练任务的需求。因此,分布式训练的效率,即使用多台服务器协同进行训练,现在成为了深度学习系统的核心竞争力。

一直以来,在分布式训练中有两大流派,分别是allreduce和PS(Parameter Server)。过去三年中,尤其是百度提出allreduce,以及Uber开源基于allreduce的Horovod之后,行业内的认知中,allreduce是最好的分布式训练通信方式,而过去的PS实现的性能也确实与allreduce存在一定差距。

BytePS则颠覆了allreduce长期领先的局面,BytePS拥有着超出目前其他所有分布式训练框架一倍以上的性能,包括NVIDIA开源的NCCL,Uber开源的Horovod,以及Tensorflow、PyTorch、MXNet自带的分布式训练方案等。

BytePS开发团队表示,在公有云或者私有云这类共享集群中,经过精巧设计和高质量实现的PS,PS架构不仅不比allreduce差,而且在一些环境还能得到比allreduce还高一倍的速度。

测试中,BytePS团队使用了公有云上的虚拟机,每个虚拟机有8张Tesla V100 16GB GPU,GPU之间通过NVLink进行高速互连。每个GPU上的batch size选取为64。虚拟机之间通过20Gbps的TCP/IP网络进行连接。在这种情况下,由于机器之内带宽足够大,TCP/IP的网络带宽则成为了主要瓶颈。

BytePS选择了Resnet50和VGG16两个模型进行评测,其中Resnet50是计算密集型的模型(对通信要求低,优化空间小),VGG16是通信密集型的模型(对通信要求高,优化空间大),对照组选择了目前市面上最流行的通信框架之一Horovod-NCCL(基于allreduce算法实现),性能指标为每秒钟训练的ImageNet图片数量,越高代表越好。

通过两组实验结果可以看出,对于计算密集型的Resnet50模型,BytePS性能超过Horovod-NCCL近44%;而对于通信密集型的VGG16模型,BytePS性能可以超过Horovod-NCCL将近100%。

BytePS团队也在配有100Gbps的RDMA网络的私有集群做了测试,BytePS也有一定的性能提升,具体分析参见Github( https://github.com/bytedance/byteps)。

除了在性能上超出目前其他所有分布式训练框架外,BytePS可以兼容Tensorflow、PyTorch、MXNet等训练框架。BytePS团队表示,开发者只需要非常少的改动,就可以使用BytePS框架进行分布式训练,享受BytePS带来的高性能。

此前行业里的PS实现,都是针对特定通用框架,例如专门为TensorFlow实现的PS,也有专门为MXNet实现的PS。

字节跳动人工智能实验室开源的BytePS,通过实现一个通用的抽象层,抽象层可以被各种通用框架引用,实现了同时支持多个框架的可能性,因此能够支持Tensorflow、PyTorch、MXNet等行业主流训练框架。

BytePS 提供了 TensorFlow、PyTorch、 MXNet 以及Keras的插件,用户只要在代码中引用BytePS的插件,就可以获得高性能的分布式训练。BytePS的核心逻辑,则实现在BytePS core里。具体的通信细节,完全由BytePS完成,用户完全不需要操心。

BytePS团队表示,深度学习领域仍然有非常大的空间和可能性值得行业同仁们一起探索,开源BytePS,是希望利用BytePS在性能和功能上的先进性,降低开发者和深度学习领域参与者们的门槛,帮助更多同道中人一起探索深度学习,提升AI应用效率。

便携大屏让使用更便利，S Pen为学习与工作赋能，一直以来，三星Galaxy FE系列平板都以多元化功能和对消费者需求的深入洞察，成为用户的好伙伴。而随着人工智能时代的到来，新一代三星Galaxy Tab S10 FE系列也同样焕新而至，将高效、强悍、稳定的体验与丰富实用的三星智

自英伟达推出RTX 50系列显卡以来，强大AI算力和游戏性能引起全球玩家的高度关注，继高端型号悉数亮相后，备受广大玩家期待的RTX 5060Ti中高端显卡于4月17日正式面世!宏碁作为全球领先的科技企业，暗影骑士·焕作为首批搭载RTX 5060Ti显卡的台式机第一时间开售，为更多玩

4月12日~13日，为期2天的ROG DAY 2025已圆满落下帷幕。不仅发布并展示了一系列ROG潮酷新品，包括ROG CROSSHAIR X870E EXTREME、ROG B850小吹雪、华硕天选B850主板初音未来版等，以及以华硕主板为核心的高能全家桶，让现场玩家放肆玩!特别是“液氮超频实验局”现场液氮超

4月12日至13日，ROG DAY 2025粉丝嘉年华在长沙远大城金字塔圆满落幕。这不是普通的科技展会，而是一场由ROG LAB灵感实验室进行的硬核玩家朝圣之旅。更是为期两日，高能不断的装备进化狂欢盛宴!不止有新发布的ROGROG CROSSHAIR X870E EXTREME主板、ROG B850小吹雪主板和

当“浅春系”开始席卷各大社交平台，所有时髦精都在为打造春日风穿搭而努力。前有时尚博主发布浅春系穿搭公式，后有人们迎着明媚天气肆意享受自然气息，在“浅春系”这个赛道，索尼也带来了点亮春季的实用单品：高性能头戴降噪耳机WH-CH720N推出了惊喜新色，以蕴藏春日

2025年4月10日,中国显示器市场外资第一品牌飞利浦显示器,携全国终端渠道合作伙伴在福建泉州,隆重举办了以“AI焕视,E飞冲天”为主题的2025年渠道合作伙伴会议。2025年飞利浦显示器渠道大会隆重召开冠捷科技总裁宣建生博士通过视讯会议的方式参会并做重要讲话。冠捷科技资

4月12日，ROG玩家国度在长沙市远大城金字塔盛大举办了2025 ROG DAY活动。更为各位玩家带来了一场别开生面的ROG LAB“灵感实验室，冲破次元壁”新品发布会。华硕电脑开放平台中国区总经理俞元麟化身实验室社长，和闫紫境GwAwa一起带领虚拟实验室社员及现场共创者，为大家

备受内容创作者关注，由NVIDIA® GeForce RTX™ 5080笔记本电脑GPU驱动澎湃性能的专业性能轻薄本，ROG幻16 Air 2025现已正式开售。GeForce RTX™ 50系列笔记本电脑GPU搭载NVIDIA Blackwell架构，为游戏玩家和创作者带来全新玩法。RTX™ 50系列具备强大的AI算力，RTX™ 5

近期，根据洛图科技《中国耳机耳麦零售市场月度追踪》报告数据显示，2024年，中国耳机耳麦市场的全渠道销量为2.18亿副，同比增长7.6%;销额为428亿元，同比增长9.8%。这已经是中国耳机耳麦市场连续第五年保持增长的态势。而在中国耳机耳麦传统主流电商500元以上高端市场

2025年4月10日，海辰储能在第十三届储能国际峰会暨展览会(ESIE 2025)上重磅发布尺寸为73.5*286*216mm (W*L*H) 的∞Cell 587Ah储能电池及搭载该款电池的∞Power 6.25MWh 2h储能系统。∞Cell 587Ah储能电池已于2025年4月份开始全球送样，∞Power 6.25MWh 2h储能系统将在20

(2025年4月10日)今天，富士胶片商业创新(中国)有限公司与成都一扇窗公益服务中心举行了“富士胶片商业创新(中国) X 一扇窗计划”爱心捐赠仪式。富士胶片商业创新(中国)董事长兼总裁中村达也、副总裁朱德康代表公司向“一扇窗”及其帮扶学校河南周口小学捐赠了彩色数码多

一直以来，电池相机以其灵活的无线安装和使用便捷性，深受大众喜爱。然而，传统电池相机存在诸多技术壁垒，如：录像不完整、续航能力差、网络不够稳定等，导致用户体验感不够省心。近日，乐橙推出B7E-AOV智能电池相机，通过创新省心科技，延续了传统电池相机无线安装和

来源：量子位作者：金磊梦晨家人们，你知道近段时间大火的各种大模型一体机，里面到底是什么卡吗?相信很多小伙伴的第一反应，或许就是N卡。但在我们接触、体验了真实的大模型一体机之后，发现了一个大写的“万万没想到”：没错，里面也可以是英特尔的锐炫™ 显卡！那

当气温回暖唤醒街头的色彩感官，时尚的语汇也随之切换频道——从玻璃橱窗的装置美学到都市丛林的灯影流光，崭新的穿搭潮流已在潜移默化中悄然来临。作为时尚弄潮儿的你，如果也在为应季穿搭的时尚单品而纠结，不妨考虑下许多达人们力荐的智能穿戴设备——如三星Galaxy R

4月8日，2025年FIFA世俱杯全球官方空调——海信新风空调X3Pro挂机正式开启预售。这款新品不仅以行业首创的双新风口对流技术和AI省电41%两大核心科技引发行业热议，在2025AWE展上吸引了包括国际足球巨星萨内蒂、奥运冠军陈梦、搜狐创始人张朝阳等多位大咖的驻足体验与点

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.