在人工智能领域,一款名为DeepSeek的大模型突然爆火,引发了全球范围内的广泛关注。然而,在这场大模型战役的前线,有一个人却在DeepSeek-V3发布前心存疑虑,他就是硅基流动公司的创始人袁进辉。
袁进辉在社交媒体上分享了一个故事:DeepSeek爆火的前一个月,梁文锋曾向他建议,硅基流动应该部署DeepSeek-V3,并准备至少20台H800服务器,最好是80台。袁进辉迅速进行了成本估算,发现仅一个月的算力成本就可能高达五六百万,而且服务器还不一定能完全利用。“风险太大了,所以我们没有下注。”他回忆道。
然而,DeepSeek迅速走红,巨大的流量导致其官网和App崩溃,用户急于找到能正常使用的渠道。袁进辉对此深感懊悔:“现在DeepSeek这么火,我们却因为决策失误而错失良机。”
但懊悔很快转化为了行动。面对算力不足的问题,硅基流动找到了华为,全力推进DeepSeek-R1 & V3在昇腾芯片上的适配工作。春节期间,硅基流动团队没有休息一天,最终成功承接住了第一波流量。
2月1日,硅基流动首发了基于华为昇腾算力的满血版DeepSeek-R1 & V3,迅速吸引了大量开发者和个人用户。这一合作不仅消除了市场对国产芯片性能瓶颈的疑虑,还无意间引发了一场国产替代的狂欢。
硅基流动借此机会证明了自己的AI Infra实力。袁进辉表示:“尤其这次上线DeepSeek R1 & V3之后,合作线索如潮水般涌来,我们暂时都看不过来。”
事实上,在硅基流动爆火之前,公司已经在2024年底完成了亿元人民币的Pre-A轮融资,由华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投。值得注意的是,本轮融资之前,硅基流动已经引入了美团作为战略股东。
硅基流动的发展历程令人瞩目。自2023年8月成立并发布MaaS平台SiliconCloud以来,公司经历了十倍以上的市场增长。SiliconCloud就像一个“大模型API超市”,开发者只需注册账号,选择所需的模型,即可开发应用,无需购买服务器。经过硅基流动的适配和优化,模型甚至能比原厂模型响应更快、推理成本更低。
目前,SiliconCloud已经拥有超过三百万用户,日均调用量超过千亿Token。在开发者圈子中,硅基流动因提供亲民价格和优异性能的模型服务而被誉为“赛博菩萨”。平台上已经上线了包括满血版DeepSeek-R1 & V3在内的上百款主流模型,还提供从模型训练、微调、托管到部署的全套工具。
硅基流动还在2024年7月推出了一款基于ComfyUI的云节点插件BizyAir。这是一款图像生成工具,让AI开发者与创作者无需考虑显卡和环境限制,即可直接使用云计算资源完成生图任务。目前,BizyAir已经支持数十种模型,并获得了近万名用户。
在商业化方面,硅基流动也取得了显著进展。公司与华为、亚马逊云科技、英伟达等顶级云厂商、芯片厂商、大模型公司及应用公司建立了合作伙伴关系。在大语言模型、文生图、视频生成等多个场景,硅基流动已经有了标杆客户案例的落地。
袁进辉在接受采访时表示,自GPT-4o和DeepSeek等模型出现后,大模型在语言能力和知识能力方面的限制已经得到了较好的解决,但在逻辑推理能力方面仍有待提升。然而,随着OpenAI o1和DeepSeek R1的发布,大模型在逻辑能力上取得了重大突破。
“可以预期,国内外基于DeepSeek等开源模型的应用将迎来爆发式增长。”袁进辉充满信心地说。
对于硅基流动的未来,袁进辉表示将继续致力于提供高性能、低成本的AI服务,推动人工智能技术的普及和应用。