ITBear旗下自媒体矩阵:

IBM全新大型机:Telum II与Spyre加速器引领AI革命

   时间:2025-04-09 15:35:32 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

IBM近期发布了其最新一代大型机,该产品在保持传统关键任务工作负载的安全性和可靠性基础上,融入了人工智能技术,特别是大型语言模型(LLM)、智能助手及代理功能,标志着大型机技术的一次重大飞跃。

z17系列大型机搭载了升级的Telum II处理器和Spyre AI加速器卡。这两款硬件在去年的Hot Chips大会上就已备受瞩目,据IBM宣称,其AI性能相较于前代z16提升了7.5倍。

IBM指出,Telum II处理器不仅延续了z16中引入的针对交易欺诈检测的改进AI推理能力,Spyre卡更是为扩展AI处理提供了新方法,支持生成式AI和LLM,通过运用多种模型来提升预测准确性和减少误报率。

IBM院士及Z系统架构师Elpida Tzortzatos在介绍这款大型机的硬件增强功能时比喻道:“如果将数据比作新的燃料,那么基础设施就是推动企业AI之旅迈向成功的引擎。”她进一步表示,IBM在开发z17时,深入了解了客户需求,客户期望看到应用程序的更新以及大型机更加智能化。

然而,IBM并没有盲目跟风,简单地将生成式AI技术植入大型机中,而是进行了深思熟虑的规划。Tzortzatos强调:“生成式AI(GenAI)对客户至关重要,但它并非唯一的AI工具。尽管近期GenAI备受关注,但预测性AI在企业中仍将发挥核心作用。”她补充道,GenAI为新的应用场景开辟了道路,例如智能助手、文档总结、开发人员支持及自动化代码编写等。

IBM的watsonx Code Assistant for Z和watsonx Assistant for Z等助手便是这些应用的实例。Tzortzatos还提到,一个新兴趋势是将预测AI与大型语言和代码模型的优势相结合,以提取新的特征或见解,从而提升AI模型的准确性和效率。她以保险公司为例,展示了如何从结构化数据库和非结构化文本中提取关键信息,输入预测AI模型,以获得更精确的结果。

据Hot Chips的详细介绍,z17中的Telum II处理器与前代一样采用八核设计,但时钟频率提升至5.5 GHz。其缓存容量增加了40%,并新增了片上IO加速器或数据处理单元(DPU),旨在减轻Spyre AI加速器卡在处理新型AI模型时所需处理的大量数据负担。

Tzortzatos解释,随着大型语言模型和GenAI的模型复杂性和尺寸激增百倍,对AI计算能力提出了更高要求。Spyre AI加速器卡可插入PCIe插槽,每张卡最多配备32个核心,与Telum II芯片中的AI加速器架构类似。z17系统最多可支持48张Spyre卡。

与此同时,IBM正在准备z/OS 3.2操作系统,这是其针对Z系统的下一个主要版本,计划于今年第三季度发布。新版本将为系统提供对硬件加速AI功能的支持,并引入运营AI来优化系统管理。IBM表示,新平台将增强对现代数据访问方法、NoSQL数据库及混合云数据处理的支持,使AI能够利用更广泛的企业数据,提供更具前瞻性的业务洞察。

尽管IBM大型机面临着国际贸易政策变动带来的市场挑战,但Gartner基础设施和运营集团执行副总裁Mike Chuba认为,IBM已充分了解客户需求。他指出,IBM在大型机研发过程中投入更多时间,专注于解决客户面临的直接挑战,如z16引入的专用加速器,以及z17的升级版直接针对交易欺诈检测等AI应用。

回顾去年,IBM推出了为其大型机系统设计的更强大处理器,承诺增强片上AI加速功能,用于推理,并集成数据处理单元(DPU)以加强IO处理能力。IBM还提供了一个独立的AI加速器,旨在支持更大规模的推理任务。

Telum II处理器在Hot Chips 2024大会上发布,预计为大型机带来显著性能提升。IBM同时预览了Spyre AI加速器,并表示这两款芯片预计于2025年上半年随下一代IBM Z系统推出。据IBM称,全球约70%的交易通过其大型机处理,Hot Chips上展示的技术进步将使IBM能够将生成式AI引入这些关键任务工作负载。

与前代产品一样,Telum II是一款八核芯片,时钟频率提升至5.5 GHz。每个核心配备一个36 MB二级缓存,另有一个用于DPU的缓存,以及一个整体芯片缓存,共十个缓存。随着虚拟L3和虚拟L4分别扩展至360 MB和2.88 GB,缓存容量增加了40%。首款Telum处理器于2022年为z16带来了内置AI推理功能,能够在处理金融交易时进行实时欺诈检测。

IBM表示,Telum II处理器上的AI加速器功能显著增强,达到每秒24万亿次运算(TOPS)。尽管TOPS可能是一个具有误导性的指标,但Telum II的设计旨在使模型运行时能够与企业中最苛刻的工作负载并行运行。片上DPU的加入旨在满足日益增长的工作负载需求,特别是针对未来的AI工作负载和即将推出的Z系统Spyre加速器。

每个DPU包含四个处理集群,每个集群有八个可编程微控制器和一个管理这些集群的IO加速器,以及两个IO子系统,服务于IO抽屉域。DPU还具有独立的L1缓存和请求管理器,用于跟踪未完成请求。DPU位于主处理器结构和PCIe结构之间,直接连接以减少数据传输开销,提高吞吐量和功率效率。

IBM透露,未来Z系统的最高配置可能配备多达32个Telum II处理器和12个IO笼,每个笼子最多有16个PCIe插槽,使系统总共支持192个PCIe卡,极大扩展了IO容量。Spyre加速器将包含32个核心,架构与Telum II芯片中的AI加速器相似。IBM Z可通过PCIe安装多个Spyre加速器,根据需要扩展AI加速能力。例如,一个包含八张卡的集群将为单个IBM Z系统增加256个加速器核心。

Telum II和Spyre加速器均旨在支持IBM所称的集成AI,即利用多个AI模型来提高预测性能和准确性,相较于单个模型有显著优势。IBM Z和LinuxONE产品管理副总裁Tina Tarquinio表示:“Telum II处理器和Spyre加速器旨在提供高性能、安全且节能的企业计算解决方案。经过多年的开发,这些创新将被引入下一代IBM Z平台,使客户能够大规模利用LLM和生成式AI。”

IBM还希望超越推理,在其大型机上进行模型微调和训练。这将使银行和其他希望将数据保存在本地场所的企业能够在组织内部完全训练和部署模型。

Telum II和Spyre加速器均由三星采用5纳米工艺节点为IBM生产。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version