ITBear旗下自媒体矩阵:

AMD开源3B参数语言模型Instella,性能直追Llama与Qwen

   时间:2025-03-06 16:19:37 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

AMD近日在其官方平台上宣布了一项重大举措,正式向开源社区推出了Radeon RX 9070系列的Linux驱动程序。这一行动不仅彰显了AMD对于开源生态的支持,同时也为Linux用户提供了更为丰富的硬件选择。

不仅如此,AMD还带来了一个令人瞩目的开源项目——Instella。Instella是一个拥有30亿参数的完全开源语言模型,代表了AMD在人工智能领域的最新探索成果。AMD强调,Instella是在其Instinct MI300X GPU上进行训练的,性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等模型相当,显示出强大的竞争力。

据AMD介绍,Instella模型是从头开始在Instinct MI300X硬件上训练的,其开源的特性意味着模型权重、训练超参数、数据集和代码都将完全公开。这一举措旨在促进人工智能社区内的创新与合作,鼓励开发者们基于Instella进行二次开发和优化。

AMD表示,Instella的开源发布是AMD对开源文化承诺的又一体现。通过开放Instella的源代码和数据集,AMD希望激发更多创新火花,推动人工智能技术的不断前行。同时,这也为开发者们提供了一个学习和研究先进语言模型的宝贵机会。

对于对Instella感兴趣的开发者们,AMD提供了详细的开源地址。通过访问(链接已移除),开发者们可以下载Instella的源代码、数据集和训练脚本等相关资源,开始他们的探索之旅。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version