ITBear旗下自媒体矩阵:

梁文峰:从对冲基金经理到DeepSeek创始人,如何改写AI版图?

   时间:2025-01-28 19:56:15 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在人工智能界风起云涌之际,一家名为DeepSeek的中国初创公司凭借其开源人工智能模型R1,成功吸引了全球的目光。尽管ChatGPT的推出让OpenAI的首席执行官Sam Altman名声大噪,但DeepSeek的创始人梁文峰在美国却鲜有人知,直到R1模型的发布,才让他在人工智能领域崭露头角。

DeepSeek发布的R1模型,在“数学、代码和推理任务”上的表现,据称可与OpenAI的o1模型相媲美,但其使用的计算能力却仅为后者的一小部分。这一成就不仅震惊了硅谷,也让整个人工智能行业为之震动。那么,这位引领DeepSeek走向成功的领导者,究竟有着怎样的背景和职业生涯呢?

梁文峰的成长故事始于中国广东的一个五线城市,时间要追溯到1980年代。他的父亲是一名平凡的小学教师,而文峰则凭借自己的努力,考入了中国历史悠久、排名靠前的浙江大学,并在那里完成了本科和研究生的学业。中国电子商务的先驱、拼多多前首席执行官黄峥也曾是该校的学子。

尽管文峰的职业生涯始于金融领域,但他对人工智能的热爱却从未减退。2015年,他与两位浙江大学校友共同创立了量化对冲基金High-Flyer,该基金依靠数学和人工智能技术进行量化投资,并迅速崭露头角。据High-Flyer网站显示,截至2019年,其管理的资产已至少达到100亿美元。

然而,文峰并未满足于此。在运营High-Flyer期间,他开始积极购买Nvidia的GPU,计划构建一个庞大的芯片集群来训练自己的人工智能模型。这一举动在当时或许并不被人看好,但文峰却坚信自己的选择。2023年5月,他推出了DeepSeek,作为High-Flyer资助的人工智能实验室的一个分支。

DeepSeek的V3模型在2024年年底引发了轰动。据DeepSeek研究人员估计,他们使用2000块Nvidia H800芯片构建和训练该模型的成本不到600万美元,远低于许多竞争对手。这一成就不仅展示了DeepSeek的技术实力,也为其赢得了业界的广泛认可。

随后,DeepSeek在2025年1月20日推出了R1模型,再次震惊了硅谷。这一模型的发布,不仅巩固了DeepSeek在人工智能领域的地位,也让更多人对这位低调的领导者产生了浓厚的兴趣。

在谈到DeepSeek的发展理念时,文峰表示,他的主要关注点是研究大型模型,实现通用人工智能。他强调,DeepSeek的原则是不亏本销售,也不追求超额利润,而是希望在成本之上获得适度的利润空间。同时,他还表示公司不会采用闭源技术,而是致力于建立强大的技术生态系统。

对于中国人工智能产业的发展,文峰充满了期待。他认为,中国的人工智能不可能永远只是个追随者。尽管目前中国和美国在人工智能领域存在一定的差距,但真正的差距在于原创和模仿之间。如果这种情况不改变,中国将永远无法超越美国。因此,他希望DeepSeek能够成为改变这种状况的先锋。

在文峰的带领下,DeepSeek正朝着实现通用人工智能的目标迈进。他们的努力和成就,不仅为中国人工智能产业的发展注入了新的活力,也为全球人工智能领域带来了新的希望。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version