滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

低成本高效率！斯坦福团队打造出媲美OpenAI的推理AI模型

时间：2025-02-06 10:32:36 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，人工智能领域迎来了一项引人注目的新突破。一项由斯坦福大学与华盛顿大学联手完成的研究显示，科学家们仅花费不到50美元（当前汇率约364元人民币）的云计算成本，便成功打造出一个具备卓越“推理”能力的人工智能模型，命名为s1。

s1模型在数学逻辑与编程能力测试中，展现出了与业界顶尖推理模型，如OpenAI的o1和DeepSeek的r1不相上下的表现。更令人瞩目的是，s1模型及其训练数据和代码已在GitHub平台全面开源，供全球开发者学习与研究。

s1团队透露，该模型的诞生得益于“蒸馏”技术，这是一种通过训练模型来模仿另一模型的答案，从而提炼出“推理”能力的创新方法。s1正是从谷歌的Gemini 2.0 Flash Thinking Experimental模型中蒸馏而来。值得注意的是，加州大学伯克利分校的研究团队也采用了同样的蒸馏方法，以约450美元的成本开发出了一款人工智能推理模型。

s1模型的横空出世，引发了业界对于人工智能模型商品化的深刻反思。若能以极低的成本复制出价值数百万美元的模型，大型科技公司的竞争优势何在？这一话题引发了广泛讨论。不出所料，OpenAI等人工智能巨头对此表示担忧，此前就曾指责DeepSeek不当获取其API数据用于模型蒸馏。

s1团队则致力于探索实现高效推理性能和“测试时扩展”的最简化路径，这些正是OpenAI的o1模型所展现出的突破性进展。s1的论文指出，通过监督微调（SFT）方法，即便使用较小的数据集也能成功蒸馏出推理模型。在SFT过程中，模型被明确指示模仿特定行为，相较于DeepSeek用于训练R1模型的大规模强化学习方法，SFT更具成本效益。

谷歌通过其Google AI Studio平台免费提供Gemini 2.0 Flash Thinking Experimental模型的访问权限，但每日使用有限制，并明确禁止逆向工程以开发竞争服务。然而，s1团队巧妙地利用了这一资源。他们基于阿里巴巴旗下中国人工智能实验室Qwen提供的一款小型免费模型，创建了仅包含1000个精心挑选的问题及其答案的数据集，并引入了谷歌Gemini 2.0 Flash Thinking Experimental为每个答案提供的“思考”过程。

在训练过程中，s1团队使用了16个Nvidia H100 GPU，耗时不到30分钟便完成了训练，成本仅为约20美元。训练后的s1在某些人工智能基准测试中取得了优异成绩。斯坦福大学参与该项目的研究员Niklas Muennighoff向TechCrunch透露了这一信息。

s1团队还采用了一个独特的技巧来提升模型的准确性：让s1在推理过程中“等待”。论文显示，在推理步骤中加入“等待”一词，有助于模型获得更精确的答案。这一创新方法无疑为人工智能领域带来了新的启示。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

MediaGo荣获2025年GDPR合规认证，强化用户数据隐私安全防线

02-06

软银或65亿美元收购Ampere，芯片设计领域再掀波澜？

02-06

《梅根2.0》惊悚回归！环球影业官宣6月27日内地上映日期

02-06

低成本高效能！斯坦福团队打造媲美OpenAI推理模型s1

02-06

AI领域大咖许主洪正式入职阿里，将如何引领AI To C业务革新？

02-06

高通股价盘后走低，AI增长能否抵消智能手机需求放缓影响？

02-06

DeepSeek突破引爆！AI投资新风潮来袭？

02-06

小屏旗舰新选择！这三款手机手感绝佳，国补后价格亲民

02-06

软银或65亿美元收购芯片设计公司Ampere，芯片行业AI投资热升温？

02-06

卡斯谈DeepSeek：AI模型平价化加速，英伟达股价波动折射市场认知差异

OpenAI原全球市场应用负责人、人工智能与商业战略专家卡斯（Zack Kass）表示，DeepSeek是一个巨大的成功，令人兴奋。对于英伟达股价巨震及未来表现，在卡斯看来，抄底英伟达与否并非核心问题，关键在…

02-06

ChatGPT搜索全面开放！无需账号，人人可用

02-06

谷歌股价大跌市值蒸发2000亿，人工智能高投入引发投资者担忧

02-06

谷歌Gemini 2.0人工智能模型套件全面发布，功能再升级！

02-06

ChatGPT搜索功能全面开放，无需注册即可体验！

三言科技 2月6日消息，OpenAI宣布，ChatGPT搜索功能现在已向所有用户开放，无需注册。…

02-06

中文在线升级AI创作能力，DeepSeek-R1已应用于内部网文创作流程

三言科技 2月6日消息，昨日，中文在线发文称，基于DeepSeek V3与R1提出的技术路线，中文在线正着力研发并训练升级版“中文逍遥”，以进一步提升该大模型的创作能力。目前，公司已在部分内部AI网文创作流程…

02-06

点击查看更多 +

全站最新

小米今年能否创历史新高？两款Ultra产品或成关键

荣耀新笔记本曝光：轻薄高颜值，性能续航双在线！

2025年春节支付盛宴：银联网联交易暴增，移动支付新挑战浮现

vivo X200 Pro mini或将添新紫，小屏旗舰配色再升级？

2024年大尺寸交互平板显示面板出货微降，2025年能否迎来正增长？

海滩洗车陷沙损失大，正确洗车方法你get了吗？

热门内容

本栏最新

《梅根2.0》惊悚回归！环球影业官宣6月27日内地上映日期

低成本高效能！斯坦福团队打造媲美OpenAI推理模型s1

AI领域大咖许主洪正式入职阿里，将如何引领AI To C业务革新？

DeepSeek突破引爆！AI投资新风潮来袭？

小屏旗舰新选择！这三款手机手感绝佳，国补后价格亲民

软银或65亿美元收购芯片设计公司Ampere，芯片行业AI投资热升温？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.