ITBear旗下自媒体矩阵:

千帆3.0、百舸4.0全面升级,新版本有何惊喜?

   时间:2024-09-25 17:03:23 来源:ITBEAR作者:柳晴雪编辑:瑞雪 发表评论无障碍通道

【ITBEAR】9月25日消息,2024百度云智大会在北京盛大召开,标志着大模型及其配套技术正迅速崛起为新一代基础设施的核心。

百度智能云事业群总裁沈抖在大会上强调,大模型及其配套的算力管理平台、模型和应用开发平台正在加速成为行业的新基石。他指出,2024年大模型的产业应用正在以前所未有的速度推进,文心大模型在千帆大模型平台上的日均调用量已超过7亿次,累计帮助用户精调了3万个大模型,并开发出70多万个企业级应用。尤为引人注目的是,过去一年中,文心旗舰大模型的降价幅度超过90%,主力模型更是全面免费,极大地降低了企业创新和试错的成本。

据ITBEAR了解,为了满足企业对于大模型落地的全方位需求,百度智能云发布了百舸AI异构计算平台4.0。这一升级版平台面向万卡、十万卡集群全面升级了算力管理能力,致力于解决超大规模GPU集群的高成本与难运营两大挑战。

在集群创建阶段,百舸4.0预置了主流的大模型训练工具,实现了工具层面的秒级部署,将万卡集群的运行准备时间从几周缩减至1小时,显著提升了部署效率。开发实验阶段,百舸4.0升级后的可观测大盘能够对多芯适配、集群效能、任务自动容错等方面进行全方位监测,为用户提供直观决策依据。

百度智能云事业群总裁沈抖在大会上介绍新技术

在模型训练阶段,百舸4.0通过一系列创新,实现了接近无损的集群容错,有效训练时长占比在万卡集群上达到99.5%以上,业界领先。同时,通过集群设计、任务调度、并行策略、显存优化等技术,百舸4.0大幅提升了集群的模型训练效率,整体性能相比业界平均水平提升高达30%。

面向未来,沈抖预测,大模型的Scaling Law将在一段时间内持续有效,并预计很快会有更多的十万卡集群出现。然而,管理十万卡集群的难度远超万卡集群,对物理空间、能耗以及网络通信都提出了巨大挑战。针对这些难题,百舸4.0已经构建了十万卡级别的超大规模无拥塞HPN高性能网络、10ms级别超高精度网络监控,以及面向十万卡集群的分钟级故障恢复能力。

会上,生数科技联合创始人兼CEO唐家渝宣布,其公司开发的国内首款全面对标OpenAI Sora的视频大模型“Vidu”将通过百度智能云千帆大模型平台面向开发者、企业用户开放API服务。同时,对于自建智算中心的客户,百舸4.0对“一云多芯”能力进行了升级,多芯混合训练效能高达95%,保持业界领先。

此外,百度智能云还发布了千帆大模型平台3.0,全面升级了模型调用、模型开发、应用开发三大服务。升级后的千帆平台不仅支持调用包括文心系列大模型在内的近百个国内外大模型,还支持调用各种传统的小模型,并持续降低模型调用成本。在模型开发方面,千帆3.0提供了最完善的大模型工具链,并支持一站式的大、小模型开发服务。

沈抖还在现场演示了如何通过对话,在AI速搭平台上开发一个资产管理应用,只需一句话描述需求,大模型就能清晰理解并生成应用,极大地缩短了开发时间。

此次大会还展示了百度智能云在多个行业的成功应用案例,包括三星电子、猎聘、考试宝等,这些企业通过利用百度智能云的技术和平台,实现了业务效率的大幅提升和创新能力的增强。

关键词:#百度智能云# #大模型# #算力管理# #千帆平台# #产业应用#

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version