ITBear旗下自媒体矩阵:

十万块英伟达H100助力,马斯克宣布“全球最大AI训练集群”投入使用

   时间:2024-07-23 10:24:13 来源:ITBEAR编辑:茹茹 发表评论无障碍通道

【ITBEAR科技资讯】7月23日消息,科技巨头埃隆·马斯克宣布了一项重大进展,其位于田纳西州孟菲斯的超级计算机集群(Memphis Supercluster)于当地时间凌晨4:20正式启动训练程序。这一里程碑式的时刻得益于xAI团队、X团队、英伟达及其众多支持公司的共同努力与贡献。

据马斯克介绍,孟菲斯超级计算机集群装备了令人瞩目的10万个英伟达H100 GPU,这些高性能芯片采用先进的液冷散热技术,并通过单一RDMA网络互连架构实现高效通信,从而构建成目前全球范围内最顶尖的AI训练集群。这一集群的规模不仅在GPU数量上远超同类设施,更是全面超越了最新Top500超级计算机榜单上的所有对手,包括拥有37888个AMD GPU的Frontier、配备60000个Intel GPU的Aurora,以及微软Eagle的14400个Nvidia H100 GPU配置。

马斯克进一步透露,他的目标是利用这一强大的计算资源,在今年12月之前训练出“世界上最强大的人工智能”——Grok3。孟菲斯超级计算机集群无疑将成为实现这一宏伟蓝图的坚实基石。

回溯至今年3月,随着相关协议的正式敲定,这座“超级计算机工厂(Gigafactory of Compute)”便迅速进入建设阶段,展现出了惊人的执行效率。大孟菲斯商会也在上月证实了xAI全新超级计算机工厂的筹备进展,标志着项目正稳步向前推进。

为了支持数据中心的长远发展,xAI已承诺将致力于改善孟菲斯的公共基础设施,包括建设新的变电站和污水处理设施,以确保电力和水资源的稳定供应。然而,这一大型项目的推进也引发了当地民众的担忧。孟菲斯市议会议员Pearl Walker近期表示,民众对于项目可能带来的水资源和能源供应问题感到忧虑。

此外,据ITBEAR科技资讯了解,xAI早在5月份就已宣布获得高达60亿美元(约合437.14亿元人民币)的资金支持,专门用于AI领域的研发工作。目前,该公司正积极为孟菲斯超级计算站点招募人才,发布的职位涵盖了光纤工头、网络工程师、项目经理等多个关键岗位,显示出对未来发展的坚定信心和充足准备。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version