在北京海淀,一家新兴的AI基础设施服务商——硅基流动(SiliconFlow),正逐渐成为业界瞩目的焦点。据悉,该公司在2024年底成功完成了亿元人民币的Pre-A轮融资,此轮融资由华创资本主导,普华资本跟投,同时老股东耀途资本也继续追加投资。
硅基流动自2023年8月成立以来,便致力于构建大模型时代的AI基础设施平台。通过算法、系统与硬件的协同创新,硅基流动为AI应用的开发和使用提供了更为便捷的途径。其核心产品涵盖了SiliconCloud一站式AI云计算平台、SiliconLLM高性能大语言模型推理引擎,以及OneDiff开源AI编译框架。这些产品共同构成了硅基流动的“AI模型水电煤”,助力企业和开发者以更低的成本和更高的效率运用AI技术。
硅基流动的创始人袁进辉博士,拥有清华大学计算机系的博士学位,并在微软亚洲研究院有过任职经历。他的创业旅程始于2017年,当时他创立了一流科技,专注于深度学习算法框架OneFlow的研发。2023年,OneFlow被光年之外以1亿美元估值并购,袁进辉也加入光年之外。然而,随着光年之外被美团收购,袁进辉决定再次出发,成立了硅基流动,专注于AI推理部署领域。
袁进辉认为,随着AI大模型规模的日益扩大,推理的计算需求和算力消耗远超训练阶段,而推理市场的优化潜力巨大。因此,硅基流动的使命是通过自研推理引擎,实现AI模型的按需使用,让开发者实现“Token自由”。自成立以来,硅基流动发展迅速,2024年4月,SiliconCloud平台正式上线,提供大模型API服务,支持主流模型的训练、微调和部署。同年年底,硅基流动又引入了美团作为战略股东,进一步壮大了其资本实力。
在盈利模式上,硅基流动采取了多种策略。一方面,平台通过API调用量向开发者收费,对中小客户采用阶梯定价策略,根据客户的使用量划分不同的价格区间。另一方面,在视频生成、多模态交互等高阶功能方面,平台按照使用的Token数量收费。硅基流动还提供基于昇腾、寒武纪等国产芯片的弹性算力资源,支持按需付费的灵活模式。
从行业发展阶段来看,硅基流动所处的AI基础设施服务——模型推理与加速服务领域,正处于高速发展期与成长期之间的过渡阶段。近年来,随着OpenAI发布GPT-3、ChatGPT横空出世等事件的影响,全球AI基础设施市场规模不断扩大。预计到2030年,该市场规模将超过1000亿美元。而中国作为全球最大的AI应用市场,年均增长率约为15%。
目前,市场上已经形成了五层完整的服务体系,包括基础模型API、专业推理服务商、AI云服务提供商、超大规模云服务商以及AI硬件供应商。硅基流动在其中更倾向于专业推理服务商的角色,其竞争对手包括潞晨科技、超云、Fireworks AI、DeepInfra等。虽然竞争较为激烈,但各家都有一定的发展机会。
随着AI技术在医疗、金融、教育、工业等各个行业的渗透不断加深,硅基流动等专业推理服务商将针对不同行业的特定需求,开发出更多定制化的推理解决方案,进一步拓展市场空间。例如,在医疗领域,硅基流动可以提供医学影像诊断、疾病预测等推理服务;在金融领域,则可以进行风险评估、欺诈检测等。