近期,全球英文技术社区对中国人工智能(AI)产业的迅猛发展表达了震惊与不解。这一情绪的触发点主要集中在两大创新成果上:宇树科技(Unitree)的轮足式机器狗B2-W和开源MoE模型DeepSeek-V3。
宇树科技,曾经被视为波士顿动力的追随者,其产品形态和商业定位一度缺乏亮点。然而,自B系列型号问世以来,宇树的机器狗在灵活性方面已能与波士顿动力相媲美。特别是B2-W的推出,更是令人刮目相看。它采用了更具挑战性但同时也更难平衡的动轮方案,并在短短一年内完成了户外复杂环境的训练。许多国外网友在观看相关视频后,甚至怀疑这是计算机生成的图像(CGI),而非真实场景。
波士顿动力作为行业先驱,曾短暂尝试过动轮方案,但其测试方案远多于宇树。然而,由于美国科技行业对制造业的普遍忽视,波士顿动力最终难逃被多次转卖的命运。现代汽车在2020年以折扣价从软银手中购得波士顿动力,而软银又是在2017年从谷歌手中接手的。谷歌之所以出售,是因为觉得该项目过于烧钱,难以承受。
这一现象反映了美国科技行业对制造业的深刻偏见。A16Z的合伙人马克·安德森在2011年曾发表文章《软件吞噬世界》,指出软件公司因其边际成本低而注定将接管一切。这一观点在随后的十几年里得到了部分验证,但也导致了美国科技行业对制造业的严重忽视。如今,从投行到企业,从CEO到程序员,美国人对制造业的厌弃已成为本能。
然而,软件终究不能脱离硬件运行。在制造业领域,中国凭借强大的供应链和试错资本,正在迅速追赶并超越西方。宇树的机器狗和DeepSeek的MoE模型就是这一趋势的生动写照。在“从零到一”的创新阶段,这些新兴科技的原型机往往产自欧美。但在“从一到十”的落地阶段,中国的追赶成果开始密集呈现。进入“从十到百”的量产阶段后,中国的供应链成本直接决定了比赛的胜负。
DeepSeek-V3的推出更是让全球大模型厂商震惊。在微软、meta、谷歌都在争相构建10万卡集群进行大模型训练时,DeepSeek仅用了2000个GPU、不到600万美金和2个月的时间,就实现了与GPT-4o和Claude 3.5 Sonnet相当的性能。这一成果不仅大幅降低了成本,还保持了高质量,且是开源的。评论区里充斥着“中国人怎么做到的?”这样的疑问。
DeepSeek的创始人梁文锋表示,公司从不缺钱,缺的是高端芯片。在算力受限的情况下,中国的大模型公司不得不寻求更高效的解决方案。这种适得其反的剧情,无疑是对美国科技行业偏见的讽刺。梁文锋还提到,他的几家公司从量化交易到大模型开发,并非金融转为科技的过程,而是数学技能在不同应用场景之间的切换。
在采访中,梁文锋展现出了清醒和聪明的特质。他认为,中国AI的发展不能永远处于跟随的位置。过去三十多年里,中国基本没有参与到真正的技术创新中。但现在,随着经济体量的增长和大厂利润的增加,中国已经具备了创新的能力。他强调,中国AI的发展需要整个技术社区和产业的共同努力,需要有人站到技术的前沿。
梁文锋的乐观态度和对未来的坚定信念令人印象深刻。他表示,中国AI的发展需要时间和过程,需要被事实教育。当硬核创新的人功成名就时,群体性想法就会改变。他相信,随着越来越多像他这样的80后、90后站上主流舞台,中国AI的未来将更加光明。