近日,市场传出重磅消息,据悉,人工智能领域的新兴势力DeepSeek正考虑以高达100亿美元的估值进行新一轮融资。据传,阿里巴巴集团计划投资10亿美元参与此次融资,且阿里云有望成为DeepSeek首选的推理算力提供商。这一消息迅速在市场上发酵,推动阿里巴巴美股(NYSE: BABA)股价飙升超过6%。
然而,截至消息发布时,阿里巴巴与DeepSeek双方均未对传闻作出正式回应。这两家均坐落于杭州的科技巨头,其动态备受业界关注。据钛媒体AGI从知情人士处了解到的信息,DeepSeek目前的实际估值仅在数十亿美元左右,远低于市场传闻的百亿估值。该消息最初在投资圈和量化交易群体中迅速传播,引起了多家投资机构的高度兴趣。
金沙江创投主管合伙人朱啸虎在接受腾讯科技采访时表示,一旦DeepSeek开放融资,他将毫不犹豫地参与投资。朱啸虎强调,参与DeepSeek的投资不仅在于财务回报,更在于见证人类通用人工智能(AGI)和AI意识的诞生,这些都具有深远的意义。他还指出,DeepSeek应开放融资以加速发展,因为未来的研发需要大量资金投入,尤其是算力卡等关键资源。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年,由中资对冲基金幻方量化创立。公司创始人兼CEO梁文锋引领着这支不到140人的团队,在人工智能领域不断探索前行。自成立以来,DeepSeek已相继发布了多个大模型,包括DeepSeek-Coder、DeepSeek-LLM以及用于高级多模态理解的专家混合视觉语言模型DeepSeek-VL2等。
其中,DeepSeek-V3大模型的训练基于2048块英伟达GPU集群,耗时55天,耗资557.6万美元。该模型在评测中表现优异,超越了LLaMA 3.1-405B等开源模型,甚至能与闭源模型GPT-4o相抗衡。DeepSeek还发布了推理模型DeepSeek-R1,该模型在数学、代码、自然语言推理等任务上的性能与OpenAI的o1正式版相当,且成本低于预期。
DeepSeek的快速发展不仅体现在技术上,还体现在市场影响力上。今年1月,DeepSeek智能助手在美区苹果App Store下载榜上超越ChatGPT,成功登顶免费应用榜榜首。这一成就不仅彰显了DeepSeek的技术实力,也为其未来的发展奠定了坚实的基础。
对于如何留住年轻人才,梁文锋表示,高薪和充足的算力是关键。他认为,中国AI领域要摆脱跟随者的角色,就必须在原创性上取得突破。梁文锋强调:“我们经常说中国AI和美国有一两年差距,但真实的差距在于原创和模仿。如果这个不改变,中国永远只能是追随者。因此,有些探索是逃不掉的。”