AMD近日宣布了一项重大进展,他们已将全新的DeepSeek-V3模型成功集成到Instinct MI300X GPU上。此次集成旨在通过与SGLang的协同工作,实现前所未有的性能优化。
据AMD官方表示,DeepSeek V3已成为目前性能最强的开源大型语言模型(LLM),其能力甚至超越了备受瞩目的GPT-4。这一突破性的进展无疑为人工智能领域注入了新的活力。
SGLang与DeepSeek团队紧密合作,确保了DeepSeek V3在FP8格式下,从发布首日便能在英伟达和AMD的GPU上流畅运行。这一兼容性无疑将大大拓宽DeepSeek V3的应用场景和受众范围。
AMD在公告中还特别感谢了美团搜索与推荐算法平台团队以及DataCrunch的支持,他们为DeepSeek V3的研发提供了宝贵的GPU资源。这些资源的投入对于加速DeepSeek V3的研发进程起到了至关重要的作用。
自DeepSeek-R1大模型发布以来,其受欢迎程度迅速攀升。在短短几天内,该模型便成功登顶中美两区苹果应用市场的免费榜榜单。这一成就不仅彰显了DeepSeek模型的强大实力,也吸引了众多科技巨头的关注。亚马逊、微软等公司纷纷宣布将接入DeepSeek模型,以期在人工智能领域取得更大的突破。
有趣的是,曾经对DeepSeek持批评态度的OpenAI也改变了立场。OpenAI的首席执行官奥尔特曼在东京的一次活动中表示,OpenAI并没有起诉DeepSeek的计划。他强调,公司将专注于打造出色的产品,并以模型能力引领世界。同时,奥尔特曼对DeepSeek给予了高度评价,认为它是一个令人印象深刻的模型,并对有新的竞争者表示欢迎。