滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

低成本训练大突破，DeepSeek能否成为AI界新星？

时间：2025-01-02 12:33:38 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近期，杭州的AI创业公司DeepSeek凭借其开源模型DeepSeek-V3在业界引起了轩然大波。这款模型在各类基准测试中展现出了与付费版GPT-4o相当的性能水平，但其所依赖的训练成本却远低于后者。

尤为值得注意的是，DeepSeek-V3是在中国公司面临制裁、算力受限且无法购买足量显卡的背景下诞生的。通过采用小数据集蒸馏等创新方法，DeepSeek成功降低了模型训练的成本，其总训练成本仅为557.6万美元，相比之下GPT-4o等模型的训练成本高达1亿美元。因此，DeepSeek被形象地称为“AI界的拼多多”。

这一消息不仅挑战了“大模型的智能程度=英伟达提供的算力”这一传统认知，还在一定程度上影响了英伟达的股价。在消息传播的过程中，出现了一种有趣的“出口转内销”再传出的现象。国外媒体引述国内消息时，特别强调了DeepSeek对GPU需求降低的突破，这标志着美国对中国的AI封锁战略并未如愿，无需搭建大型GPU集群也能取得显著效果。这一观点在Twitter等社交媒体上被重新译介后，引起了硅谷业内人士的广泛关注。

与此同时，DeepSeek的团队成员也备受瞩目。此前，DeepSeek的前员工罗福莉加入小米的消息在业界流传甚广，尽管她早已自我官宣，但“95后天才少女”的称号无疑为这一消息增添了更多的话题性。这一事件不仅提升了小米的关注度，更从侧面证明了DeepSeek团队的实力和吸引力。

在DeepSeek出圈之前，AI业界对其评价颇高。尽管有人指出其训练数据集可能使用了ChatGPT的输出结果，但这一插曲并未影响DeepSeek的声誉。毕竟，如果仅凭ChatGPT的输出就能取得如此成果，那么任何人都可以尝试。事实上，谷歌也在采用类似的方法，其Gemini模型的事实核查人员是外包的，并允许他们借助其他模型生成的结果来核对答案。

在AI领域，提出新概念往往意味着巨大的商业机会。DeepSeek提出的“低成本训练”概念正是如此。与此类似，月之暗面（Kimi）因提出“超长文本（tokens）”概念而走红，并获得了大量的融资和关注。然而，随着时间的推移，Kimi的产品发布和创新能力逐渐放缓，其关注度也有所下降。这再次证明了新概念对于创业公司的重要性。

相比之下，DeepSeek凭借其低成本训练概念在业界崭露头角。如果今年各大厂商还在寻找新的投资标的，那么DeepSeek无疑是一个值得考虑的选择。毕竟，能够定义一个新概念并引领行业潮流的创业公司并不多见。对于DeepSeek来说，其未来的发展前景充满了无限可能。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

Marvell崛起：ASIC能否助力其挑战博通地位？

此外世芯当前的客户主要是英特尔和亚马逊，但近期 Marvell 与亚马逊达成了 5年合作协议，未来有望进一步加深两者的合作关系，Marvell 与亚马逊合作的 Inferential ASIC 项目也将在…

01-03

英伟达或进军AI PC市场，CES 2025或成股价上涨新催化剂？

01-03

AI创业热潮下，英伟达豪掷10亿投资，初创公司机遇与挑战并存？

01-03

AI影像盛行，好照片易得，摄影艺术何在？

01-03

AI Agent引领新风潮，巨头企业竞相布局赋能数字化转型

01-03

父爱科技梦：80后父亲用AI技术为孩子重塑教育未来

01-03

星巴克中国困局：本土化合作能否成为救命稻草？

近年来，瑞幸咖啡以超乎想象的速度崛起，不仅凭借平价策略和数字化创新迅速圈粉，更在门店数量上和销售额上成功超越星巴克，彻底改写了中国咖啡市场的竞争格局。但至少，引入本地合作伙伴可以让星巴克更深入地了解当地消费者…

01-03

Autodesk内测生成式CAD大模型，600亿市值巨头引领设计领域新变革？

Raji Arasu所说的基础模型，即2024年5月被曝出的名为“ Bernini”的生成式AI项目，该项目可将文本、手绘草图等转换成3D文件。 Bernini的训练过程也同样使用了英伟达GPU，但在GPU…

01-03

AI创业热潮下，英伟达豪掷10亿投资，初创公司机会与挑战并存？

01-03

苹果2025年新品大爆发，能否打赢翻身仗？

01-03

中国加速计算服务器市场2028年将超550亿，AI服务器需求持续增长

01-03

2028年中国加速计算服务器市场或突破550亿美元大关

01-03

阿里云携通义大模型，携手雷鸟创新AI眼镜，共探智能新视界

01-03

AI界痛失英才：DeepMind科学家Felix Hill离世，万字遗文谈研究者压力

三言科技 1月3日消息，据报道，谷歌DeepMind研究科学家Felix Hill在2024年12月5日离世，年仅41岁。据了解，Felix Hill在AI界颇有影响力，他参与创建了自然语言理解基准GLUE…

01-03

美利信新成立实业公司，业务范围涉足AI软件开发领域

01-03

点击查看更多 +

全站最新

韦尔股份：车规级芯片布局广泛，汽车电子领域成果丰硕

韦尔股份：汽车电子领域布局广泛，汽车CIS解决方案覆盖多应用

智界R7纯电版热销1.5万台，能否成为国产新能源围剿特斯拉的先锋？

华为畅享70X发布：6100mAh大电池+一键北斗，性价比超越Mate系列？

太原167名驾驶人驾驶证被注销，涉及酒驾等违法行为！

霸王茶姬冰勃朗健康基底乳真相：无反式脂肪却高脂，消费者何去何从？

热门内容

本栏最新

Marvell崛起：ASIC能否助力其挑战博通地位？

英伟达或进军AI PC市场，CES 2025或成股价上涨新催化剂？

AI影像盛行，好照片易得，摄影艺术何在？

AI Agent引领新风潮，巨头企业竞相布局赋能数字化转型

父爱科技梦：80后父亲用AI技术为孩子重塑教育未来

Autodesk内测生成式CAD大模型，600亿市值巨头引领设计领域新变革？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.