近期,AMD在ROCm开源软件堆栈方面迈出了新的一步,发布了备受期待的6.4.0版本。这一消息源自外媒Phoronix的报道,发布时间为当地时间4月11日。
此次更新的一大亮点在于,ROCm 6.4.0正式将Radeon PRO W7800 48GB显卡纳入支持范围。然而,值得注意的是,尽管呼声很高,新版本尚未全面支持“RDNA 4”架构的独立显卡以及“Strix Halo”处理器的大规模核显,这对于部分高端用户来说或许稍显遗憾。
除了显卡支持方面的更新,ROCm 6.4.0还带来了一系列技术改进。其中,Megatron-LM框架在ROCm版本中新增了多项融合功能,包括融合注意力机制、融合层范数以及融合旋转式位置编码RoPE内核支持,这无疑将进一步提升人工智能模型的训练效率。
在兼容性方面,ROCm 6.4.0也展现出了强大的实力,同时支持PyTorch的2.6和2.5版本,为用户提供了更多的选择空间。新版本中的rocDecode和rocPyDecode还新增了对VP9编解码的支持,进一步丰富了ROCm的应用场景。
对于使用Instinct加速器的用户来说,ROCm 6.4.0同样带来了好消息,它新增了对Oracle Linux 9操作系统的支持,使得用户能够在更多的平台上享受到ROCm带来的性能提升。
想要了解更多关于ROCm 6.4.0的信息,用户可以前往AMD官网的相关页面进行查阅。AMD在官方文档中详细列出了新版本的各项功能和改进,以及已知的问题和解决方案,为用户提供了全面的参考。
AMD还预告将在即将举行的Advancing AI 2025活动中分享AMD ROCm开放软件生态系统的最新进展。这无疑将吸引更多关注ROCm的用户和开发者的目光,共同期待ROCm在未来能够带来更加出色的表现。