【ITBEAR】9月25日消息,随着AI技术的迅猛发展,算力需求空前高涨,算法优化、硬件升级以及系统架构等多个层面均需深度创新,以满足日益增长的计算密集型任务处理需求。
在9月24日举行的全国高性能计算学术年会上,高通量以太网联盟(ETH+ Consortium)正式对外发布了高通量以太网ETH+协议的1.0版本。该联盟由中国科学院计算技术研究所、阿里云等超过40家机构共同组建。同时,基于ETH+协议的网络协议IP、开源网卡等相关硬件和系统也首次亮相。
据ITBEAR了解,智算网络的基石在于网络协议,以高通量以太网为核心的新一代开放智算网络正在加速从实验室走向产业化应用,旨在为大模型时代提供坚实的网络基础。在当前大模型时代,单纯依赖单卡性能的提升已无法充分应对训练和推理过程中迅猛增长的算力需求,网络在系统中的重要性日益凸显,资金投入和市场需求迅速增长,产业生态的竞争也愈发激烈。
在此背景下,中国科学院计算技术研究所和阿里云于去年7月联合发起了智算网络生态组织“高通量以太网联盟”,旨在基于开源开放的技术理念,构建我国的智算网络生态。该联盟的成员还包括北京大学、平头哥、盛科、腾讯、字节跳动、中兴、新华三、云合智网、壁仞等40余家机构和企业。
高通量以太网联盟的共同主席、阿里云研发副总裁、基础设施网络负责人蔡德忠表示,联盟集结了产学研用各方的力量,旨在基于开放的以太网生态,面向智算网络研发及制定统一的技术标准和底座。联盟将促进国内芯片公司间的合作与交流,推动技术创新和成果转化。高通量以太网ETH+协议通过优化帧格式,实现了有效载荷比提升74%,数据传输效率显著提高。同时,通过深度支持链路层和物理层的重传技术,ETH+以太网的语义可靠性得到了提升。基于RDMA在网计算技术,集合通信性能提升了30%以上。目前,已有多家芯片公司基于ETH+协议进行相关产品的研发和落地,预计明年初将有一批基于国产网络芯片的集群面世。
关键词:#高通量以太网联盟# #ETH+协议# #智算网络# #算力需求# #技术创新#