在人工智能(AI)领域的一次革命性飞跃中,OpenAI从一个默默无闻的企业迅速崛起,成为全球瞩目的科技巨头,估值惊人地突破了1500亿美元大关。然而,在探讨谁是AI时代最大受益者的议题上,NVIDIA无疑是一个不可忽视的名字。
根据最新财报数据,NVIDIA在2024年第三财季实现了惊人的业绩,营收高达350.82亿美元,同比增长93.61%,归母净利润更是达到了193.09亿美元,同比增长108.90%。尤为其数据中心业务营收达到了308亿美元,同比增长率高达112%。这一系列耀眼的数字不仅巩固了NVIDIA的行业地位,更使其市值超越了微软,跃居全球第二。
NVIDIA与AI企业之间形成了互利共赢的紧密关系。AI企业依赖NVIDIA提供的GPU和专业AI计算卡,以满足大模型训练和推理的庞大需求。这种需求成为了NVIDIA营收和利润屡创新高的重要推动力。因此,NVIDIA也深知需要投入成本来扶持AI公司,培养潜在的客户群体。
据英国《金融时报》报道,NVIDIA在2024年积极参与了50多轮融资和多笔交易,向AI初创企业累计投资约10亿美元,相比2023年的8.72亿美元增长了约15%。这一趋势预示着,NVIDIA在2025年很可能会继续加大对AI初创公司的投资力度。
除了NVIDIA,国内外众多互联网公司也在不断增加对AI领域的投入,一边组建自己的AI团队,一边积极投资其他AI公司。这种趋势对于小型AI公司而言无疑是一个利好消息,因此,2024年见证了无数企业涌入AI行业的热潮。天眼查数据显示,仅在国内,2024年新增的AI相关企业就超过了50万家。
然而,在AI技术日益成熟的背景下,进军AI行业是否真的还有机会?这成为了摆在众多企业面前的一个严峻问题。
AI大模型的黑盒特性导致其在可解释性和可调试性方面存在局限,同时,语义理解能力、数学逻辑和推理能力,以及可能存在的AI“幻觉”等问题,都是开发者需要面对的技术难题。训练一款成熟可用的大模型,不仅需要招募大量技术人才,还需要应对行业内激烈的人才竞争,导致吸纳AI人才的成本不断攀升。
以小米为例,小米CEO雷军亲自出手,挖来了参与过DeepSeek-V2大模型开发工作的罗福莉。尽管具体年薪数字或许有所夸张,但罗福莉的年薪至少达到了七位数,这无疑反映了AI人才市场的激烈竞争。
除了人才成本,GPU算力也是AI公司面临的一大挑战。小米正在着手打造万卡算力集群,而百度集团执行副总裁沈抖曾表示,一个1.6万张GPU的集群,采购成本就高达数十亿元,这还不包括搭建、运营和维护成本。
用于训练大模型的数据也成为了制约AI公司发展的关键因素。原定2024年中后期面世的GPT-5,至今未能完成训练,主要原因之一就是数据不足。为解决这一问题,OpenAI不得不招聘工程师、数学家和物理学家来编写数据。
人才、算力、数据三大成本的高昂,使得即便是互联网巨头也倍感压力,更不用说那些刚刚涌入AI行业的初创公司了。
然而,并非没有低成本训练大模型的方法。DeepSeek-V3模型的到来,以其低至557.6万美元的训练成本,引起了业界的广泛关注。这一成本大约只是GPT-4的二十分之一,不到GPT-5的二百分之一。经过实测,DeepSeek-V3在文字生成、数学推理等领域的体验不逊于国内知名的AI应用。
DeepSeek的成功在于其采用了MLA架构、MoE架构、FP8混合精度训练框架以及模型蒸馏等技术。这些技术虽然降低了训练成本,但也以牺牲精度为代价。尤其是模型蒸馏技术,存在“学生模型”能力无法超过“教师模型”的缺陷。
尽管DeepSeek-V3在某些方面存在争议,但其成功仍然为其他AI公司和考虑入场的企业指明了一条新的道路。通过降低精度、压缩内容、蒸馏模型等方法,无需数亿美元的高昂成本,也能训练出表现出色的AI大模型。
AI行业正处于从快速发展期向成熟期过渡的关键阶段。尽管门槛相比过去有所提高,但任何企业都仍有机会成长为行业巨头。只是能否抓住这些机会,则取决于AI公司的技术实力、管理能力和战略眼光。
当前,AI行业依然欢迎新玩家的加入,但只适合两类企业。一类是财力雄厚、志在行业顶峰的企业,它们将承担起引领行业进步的责任。另一类则是以“够用就行”为目的、不追求极致功能特性的公司,它们可以通过降低成本的方法打造体验不错的大模型。
对于那些空有野心却实力不足的企业或创业者而言,AI行业已经不再是适合他们的乐园。尽管有NVIDIA、微软等巨头的投资支持,但这些资金相对于顶级AI大模型的开发工作来说仍然是杯水车薪。AI行业依然是野心家的乐园,只是入场需要更加谨慎。