ITBear旗下自媒体矩阵:

华为发布Atlas 900 SuperCluster,开创大模型训练新纪元

   时间:2023-09-23 16:31:53 来源:ITBEAR编辑:瑞雪 发表评论无障碍通道

【ITBEAR科技资讯】9月23日消息,华为在今日的全联接大会2023期间发布了一项重大突破,正式推出了Atlas 900 SuperCluster,这是一款全新架构的昇腾AI计算集群,专门设计用于支持超大规模模型训练,参数容量高达万亿级别。

华为企业BG总裁兼ICT基础设施业务管理委员会主任汪涛在发布会上介绍了这一创新产品,他表示,Atlas 900 SuperCluster采用了最新一代的华为星河AI智算交换机CloudEngine XH16800,该交换机具备高密度的800GE端口能力,使得只需要两层交换网络即可构建一个拥有2250个节点的超大规模集群,相当于18000张计算卡的规模。

突破大算力瓶颈:华为支持超万亿参数大模型训练 等效于18000张卡

更为引人注目的是,这款集群采用了全新的超节点架构,极大提升了大模型训练的性能。汪涛强调,大算力已经成为推动人工智能发展的核心引擎。为了满足日益增长的计算需求,华为进行了系统架构创新,将算力、运力、存力融为一体,成功突破了大算力瓶颈。

突破大算力瓶颈:华为支持超万亿参数大模型训练 等效于18000张卡

突破大算力瓶颈:华为支持超万亿参数大模型训练 等效于18000张卡

突破大算力瓶颈:华为支持超万亿参数大模型训练 等效于18000张卡

据ITBEAR科技资讯了解,为了进一步加速大模型创新,华为还发布了CANN7.0,这是一个更加开放、易于使用的平台。它不仅与业界主流的AI框架、加速库和大模型兼容,还深度开放底层能力,使得AI框架和加速库可以更加灵活地调用和管理计算资源,为开发者提供了更多的自定义高性能算子的可能性。

突破大算力瓶颈:华为支持超万亿参数大模型训练 等效于18000张卡

突破大算力瓶颈:华为支持超万亿参数大模型训练 等效于18000张卡

华为在计算、网络、存储、能源等领域的综合优势,使得这一新集群在器件级、节点级、集群级和业务级全面提升了系统的可靠性,将大模型训练的稳定性从天级提升到了月级水平。这个突破性的产品将为人工智能领域的发展提供更强大的支持,推动大模型时代的到来。

标签: 华为
举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version