滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek团队揭秘：清北应届生领衔，年轻力量如何撑起AI大模型新篇章？

时间：2025-01-04 16:11:18 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在人工智能领域，一支年轻的团队正以惊人的速度崛起，他们的名字叫做DeepSeek。近期，DeepSeek发布的DeepSeek-v3大模型，以仅为Llama 3 405B模型1/11的算力，实现了超越前者的性能，这一成就迅速在AI圈内引起了轰动。

随着DeepSeek-v3的发布，关于该团队的各种传闻也随之而来，其中最为引人注目的是“雷军开出千万年薪挖角DeepSeek研究员罗福莉”的消息。这一传闻不仅让科技圈沸腾，更让全网都对这支神秘的团队充满了好奇。

DeepSeek究竟有何魅力？为何能吸引如此多的关注？从各种资料中，我们可以发现，这支团队的最大特点就是年轻和充满活力。团队成员中，应届生、在读生占据了相当大的比例，特别是来自清华大学和北京大学的应届生，更是团队中的佼佼者。

在这些年轻的面孔中，不乏已经在学术界崭露头角的佼佼者。例如，有的成员在DeepSeek搞研究的同时，其博士学位论文还获得了奖项的认可。他们中的一些人，从DeepSeek LLM v1开始，就参与了团队的工作，一直到现在，已经成为了团队中的中坚力量。

DeepSeek的核心成员中，高华佐和曾旺丁是MLA架构的关键创新者。MLA（Multi-head Latent Attention）是DeepSeek-V2中的一项重要创新，它大幅减少了计算量和推理显存，为DeepSeek-V2的成功奠定了坚实的基础。而曾旺丁，则来自北京邮电大学，其导师是北邮人工智能与网络搜索教研中心主任张洪刚。

除了MLA，DeepSeek-V2还涉及到了另一项关键成果——GRPO。GRPO是PPO的一种变体RL算法，它显著减少了训练资源的需求，受到了业内的广泛关注。这一成果的背后，也有着年轻研究员的辛勤付出。邵智宏、朱琪豪和Peiyi Wang等核心作者，在DeepSeek实习期间就完成了这一工作。

邵智宏是清华大学交互式人工智能（CoAI）课题组博士生，师从黄民烈教授。他的研究领域包括自然语言处理和深度学习，对构建一个稳健且可扩展的AI系统有着浓厚的兴趣。朱琪豪则是北京大学计算机学院软件研究所的博士毕业生，他的研究方向是深度代码学习，曾发表多篇CCF-A类论文。

DeepSeek的创始人梁文锋，在团队的建设上有着独到的见解。他强调，团队的核心技术岗位主要以应届和毕业一两年的人为主，看能力而不是看经验。这一理念贯穿了整个团队的招聘和人才培养过程，使得团队能够吸引并留住大量的年轻才俊。

除了团队成员的年轻化，DeepSeek在国内AI公司中还有着另一个突出的特点：非常重视模型算法和硬件工程的配合。在DeepSeek-v3的论文中，有200位作者参与了这一工作，他们不仅负责AI算法和数据，还参与了硬件的优化和算力的提升。

这种软硬件协同的设计，使得DeepSeek能够以极低的算力实现高性能的大模型训练。而这一切的背后，离不开团队中那些既懂算法又懂硬件的年轻工程师们的辛勤付出。

DeepSeek的运作模式也让人想起了另一家AI界的巨头——OpenAI。同样不看经验、重用新人，同样面对潜力方向时从顶层开始设计布局和资源推动。或许，在未来的某一天，DeepSeek会成为组织形态上最像OpenAI的中国AI公司。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

马斯克重磅！Grok 3预训练完成，计算量飙升十倍引领AI新潮流

01-05

扫地机器人进化新形态，追觅机械手引领家庭服务智能革命

运动能力上，扫地机器人具备灵活运动能力，其可以适应大部分的家庭地面环境，且不需要像人形机器那样精准模拟人类的运动方式，在此基础上通过大模型加持理解和适应复杂的指令，能加速具身智能的落地。即便当下加装机械手…

01-05

微软豪掷800亿美元，2025财年全力押注人工智能数据中心建设

自2022年年底，美国开放人工智能研究中心（OpenAI）推出ChatGPT，引发人工智能领域前所未有的投资热潮。为了在构建下一代人工智能系统的竞争中占得先机，2024年微软向英伟达购买近50万块AI芯片，…

01-05

安卓芯片单核性能飙升，苹果A18 Pro地位还保得住吗？

01-04

安卓芯片新突破，单核能否撼动苹果A18 Pro地位？

01-04

马斯克宣布：Grok 3已完成预训练，计算量大幅提升10倍！

三言科技 1月4日消息，今日马斯克在X平台宣布：Grok 3即将推出，其预训练现已完成，计算量比Grok 2高10倍。据了解，去年12月14日，xAI宣布向所有X平台用户免费推出新版本Grok-2模型。…

01-04

谷歌DeepMind新成果：CAT4D让普通视频秒变动态3D场景

01-04

马斯克官宣：Grok 3预训练完成，计算量飙升十倍即将面世！

01-04

我国AI技术新突破！博鳌超级医院成功应用全球首个人工智能耳蜗植入系统

01-04

2025搜索大战一触即发，谷歌能否保住王座？

01-04

微软2025财年AI数据中心投资将超800亿美元，过半资金投美国

01-04

AI教育新突破！精准学超拟人老师，能否成为孩子作业辅导新救星？

01-03

寒武纪七年亏损路，陈天石身家760亿，AI芯片龙头何时扭亏为盈？

01-03

零售数字化新纪元：多点数智Dmall OS 3.0引领行业飞跃

01-03

AI赋能企业新升级，智慧发票助手打造高效财务管理

01-03

点击查看更多 +

全站最新

威奥易氧O2ark携手老年保健协会，引领家庭健康管理新时代！

vivo X200S真机曝光：天玑9400+直屏旗舰来袭，性能再升级！

零跑B01轿车谍照曝光，前脸设计与B10相似，配置及上市时间成谜

《艾尔登法环》衍生新作，宫崎英高缺席，新导演能否续写辉煌？

手机《我的世界》全攻略：探索无限创意，打造个性化沙盒世界

广汽传祺S7内饰曝光，5座布局科技感十足，2月即将上市可预定！

热门内容

本栏最新

马斯克重磅！Grok 3预训练完成，计算量飙升十倍引领AI新潮流