ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

大模型时代：算力浪费竟超50%！百度AI计算部负责人揭秘算力成本之谜

时间：2024-09-15 13:35:32 来源：ITBEAR作者：唐云泽编辑：瑞雪 发表评论无障碍通道

【ITBEAR】9月15日消息，在AI大模型时代，算力成本已成为业界关注的焦点。百度系统架构师、百度智能云AI计算部负责人王雁鹏近日分享了关于如何有效降低万卡集群算力开支的见解，提出了五大解决方案。

王雁鹏指出，随着深度学习技术的不断发展，GPU集群规模已达万卡级别，这使得大模型时代的算力成本远超人力成本。为了应对这一挑战，他提出了包括搭载RDMA网络、采用自动并行策略、确保训练稳定性、动态分配算力以及实现多芯异构混训在内的五大策略。

据ITBEAR了解，RDMA网络的应用在AI集群中显得尤为重要。与传统的IB网络相比，RDMA网络更适合AI集群的需求，它优先考虑吞吐量而非延迟，从而有效提升了AI集群的带宽有效率和模型性能。

此外，王雁鹏还强调了自动并行策略在AI集群演进中的重要性。通过采用“边计算边通信”的方式和显存优化的切分策略，百度成功提高了模型性能，甚至超越了开源模型和人工调优模型的效果。

在谈到训练稳定性时，王雁鹏表示，稳定不间断的任务运行对于AI训练至关重要。百度通过一系列技术手段，如Hang检测、慢节点检测等，确保了文心一言大模型的有效训练时长比例超过99%。

针对资源利用率问题，王雁鹏提出了训练一体的解决方案。通过动态分配算力流量和资源，百度百舸异构计算平台成功将资源利用率从50%提升至90%，从而有效应对了主流模型训练中的劣势。

最后，王雁鹏探讨了多芯异构混训在解决算力卡脖子问题中的关键作用。他提出，通过搭建跨芯沟通库和采用Accelerator抽象设计方法，百度实现了在千卡和万卡规模下性能损失的最小化。

展望未来，王雁鹏透露百度将继续在三个核心技术上寻求突破：实现更高效的拓扑和拥塞控制、扩大跨地域RDMA网络范围以及进一步提升训练故障恢复速度。这些技术突破将为百度在未来十万卡级别的AI集群竞争中占据有利地位提供有力支持。

关键词：#百度# #AI大模型# #算力成本# #RDMA网络# #多芯异构混训#

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

全新GL8陆尊来袭，26.99万起售！豪华MPV市场再添猛将

着眼于高端用户的智慧出行需求，全新GL8陆尊搭载全新一代VCS智能座舱，拥有EYEMAX30吋一体弧面6K屏、高通骁龙8155芯片以及5G通信技术等同级领先配备的加持，为用户带来沉浸式感官享受和精准流畅的交互…

10-31

Python登顶GitHub：AI浪潮下的编程新宠，你准备好了吗？

这主要是受到人工智能（AI）开发需求激增的推动，Python 还被广泛应用于数据科学和开源项目的开发。报告指出，与生成式 AI相关的项目贡献量在过去一年中增长了 59%，AI 相关的公共项目的贡献量几乎比…

10-31

实时音视频拓荒之旅：十年磨一剑，颠覆传统，引领未来新风尚！

在大会上，声网发布了他们的RTE+AI能力全景图，在全景图中，声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AIAgent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度，清…

10-31

AI长焦崛起：手机影像新趋势，计算摄影将颠覆传统光学影像？

在X100S、X200系列上，vivo通过AI大模型对超过十亿的物体数据学习，再结合AI多帧高像素算法，实现了远景画面的高清拍摄；OPPOFind X8系列更是直接宣传搭载了AI千里长焦，在20倍-120倍…

10-31

小米澎湃OS2来了！首款AIOS能否重塑系统口碑？

恰好，雷科技手上这台小米15是首批搭载HyperOS2.0的产品，在这几天的体验中，小雷也感受到了小米对于手机操作系统的一些新构思和小心机，以及对于手机未来的探索和思考。曾在操作UI上吃过亏的小米显然明…

10-31

小笨智能领跑工业搬运革新，开启智能化新篇章！

这不仅极大提升了小笨智能SLAM &机器人领域的智能化水平和服务效率，还将助力我们快速拓展市场边界，为客户提供更加高效、灵活、可靠的智慧服务解决方案，引领行业迈向新的发展阶段。未来，小笨智能将继续在工业智…

10-31

星环科技上榜！2024上海市制造业数字化解决方案推荐，实力不容小觑！

为深入贯彻党中央、国务院关于推进新型工业化、支持制造业企业及中小企业数字化转型的系列决策部署，落实《上海市制造业数字化转型实施方案》的任务要求，加快推进企业数字化转型，上海市经信委开展了2024年度上海市重点…

10-31

元宇宙巨亏44亿，Meta股价盘后大跌超3%，市场何去何从？

财报提及，三季度Meta元宇宙业务营业亏损44亿美元，而Meta还计划加大在AI上的投资，预计2025年资本支出将显著增加。Meta CFO表示，现实实验室在2024年运营亏损还将显著增长，原因是公司持续的产…

10-31

讯飞星火助力科研飞跃，AI for Science引领科技革新浪潮！

他认为，人工智能赋能科研工作有三个台阶，一是借助科研文献助手和代码助手提升基础工作效率，二是基于深度神经网络对科学任务进行精准建模，三是借助认知大模型学习领域知识并辅助设计科研实验方案。在今年的科大讯飞全球…

10-31

国晟科技跨界出手，新能源领域再布局，AI软件开发能否成新爆点？

10-31

智谱华章联手豆神教育，能否领跑教育行业新赛道？

2024年10月30日，豆神教育在北京举行豆神辞源大模型“名师超拟人，AI新时代”产品发布会，推出自主研发的端模一体教育产品——豆神AI，将客户端与大语言模型深度结合。与之类似，智谱华章有优秀的大模型开发及…

10-31

谷歌云联手沙特PIF，共建全球AI中心，Gemini大模型阿拉伯语能力再升级！

该合作将以联合研究阿拉伯语模型以及沙特特定的人工智能应用为特色，目前有待获得监管机构的批准。新的投资建立在谷歌云在沙特阿拉伯的现有业务基础上，其中包括去年启动的达曼云区域，该区域是谷歌云目前全球40个区域…

10-31

微软遭OpenAI拖累，预计收入锐减15亿美元！

微软在周三提交给美国证券交易委员会的文件中写道：我们对 OpenAI Global,LLC（简称OpenAI）进行了投资，并已承诺投资总额为 130 亿美元。在之前提交给美国证券交易委员会的文件中，微…

10-31

荣耀再迎强援：中国电信、中金资本等巨头联手入股！

10 月 31日消息，据《科创板日报》今日消息，荣耀股改引入新一轮投资者，中国电信、中金资本旗下基金、基石旗下基金、特发基金，以及新一轮代理商投资平台（金石星耀）等机构加入。对于此轮融资，荣耀称…

10-31

热闹的智算云，杭州的下一阶段？

只有形成智算云产业的自循环，中国云谷的建设才有意义。在《机器中的达尔文》一文中，塞缪尔·巴特勒提出了“机械王国”的理论：技术进化与生物进化的过程将多方面重合，但不会像生物进化漫长而平静，而是带有激烈且革命性的色彩。他不吝词藻描绘道：“如今机器被用来生

10-31

点击查看更多 +

全站最新

奔驰遭遇滑铁卢！三季度在华销量大跌12.9%，净利惨遭“腰斩”

新媒体风采再现："新闻发布会"翻新花样，信息传播迈入新纪元？

福特三季报揭晓：电动化转型困局依旧，未来何去何从？

味蕾盛宴开启！宁夏皇蔻酒庄闪耀登场第十四届全国优质农产品展销周

NASA毅力号火星探测器新发现：神秘绿斑岩石，引发科学界热议！

格力电器2024年Q3营收下滑，市场表现如何？

热门内容

本栏最新

Python登顶GitHub：AI浪潮下的编程新宠，你准备好了吗？

实时音视频拓荒之旅：十年磨一剑，颠覆传统，引领未来新风尚！

AI长焦崛起：手机影像新趋势，计算摄影将颠覆传统光学影像？

小米澎湃OS2来了！首款AIOS能否重塑系统口碑？

小笨智能领跑工业搬运革新，开启智能化新篇章！

星环科技上榜！2024上海市制造业数字化解决方案推荐，实力不容小觑！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.