滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

ChatGPT后浪推前浪，国产o1大模型加速崛起能否弯道超车？

时间：2024-12-02 22:22:35 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在ChatGPT问世后的第二年，人工智能领域正经历一场新的变革。OpenAI及其国内同行正试图超越现有的技术框架，探索大模型发展的新路径。

随着Scaling Law的局限性逐渐显现，今年9月，OpenAI推出了全新系列模型o1，重新定义了“会思考的大模型”。OpenAI的CEO奥特曼对此信心满满，认为AI的发展不仅没有放缓，反而预示着未来几年内的重大突破。

受到o1发布的启发，国内大模型厂商迅速行动，纷纷效仿并推出了各自的o1类深度思考模型。短短两个多月内，kimi的k0 math、Deepseek的DeepSeek-R1-Lite以及昆仑万维的“天工大模型4.0”o1版相继问世，这些模型都着重强调了大模型的逻辑思考能力。

在没有OpenAI公开o1具体技术细节的情况下，国内企业展现出了惊人的研发速度和技术实力。11月16日，月之暗面发布了k0 math，通过强化学习和思维链推理技术，显著提升了数学推理能力。四天后，Deepseek推出了DeepSeek-R1-Lite，毫无保留地展示了模型的完整思考过程，其思维链长度可达数万字，并在多项测试中超越了o1-Preview。

昆仑万维也不甘落后，于11月27日发布了天工大模型4.0 o1版，成为国内首款实现中文逻辑推理的模型。该模型提供了三种版本，包括开源的Skywork O1 Open、优化中文支持能力的Skywork O1 Lite，以及完整展示模型思考过程的Skywork O1 Preview。

这些国产“o1”大模型不仅在数学和代码能力上逼近甚至超过了o1，还学会了“慢思考”。通过引入思维链（CoT），大模型能够将复杂问题拆解为多个小问题，模拟人类的逐步推理过程。这种能力使得大模型在解决一些往常无法回答的问题时，也能给出正确答案。

例如，Deepseek R1在面对“Responsibility中有几个字母i？”的问题时，能够拆解单词并逐一比较字母，最终给出正确答案。昆仑万维的大模型在面对陷阱问题时，也能通过思维链模式自行避开问题，找到准确的翻译结果。

然而，慢思考模型也面临着挑战。虽然它们在一些特定学科上的表现大幅提升，但大量耗费tokens的方式却未必能换来用户需要的回报。在某些情况下，增加思维链的长度可以提高效率，但并不意味着在所有情况下都是最优解。因此，大模型需要学会对问题难度进行判别，从而决定是否采用深度思考模式。

从特定场景下的强化学习应用转向通用模型，在训练算力和成本的平衡上还存在一定难度。目前，国产慢思考大模型的开发主要基于规模较小的基座模型，如Skywork O1 Open基于Llama 3.1 8B的开源模型。这意味着在训练RL阶段，所需的算力可能并不比预训练少。

尽管如此，大厂们仍将o1视为下一个必备项。在OpenAI和智谱给出的“通往AGI五阶段”的定义中，o1的出现标志着大模型能力突破到了L2阶段，开始真正拥有逻辑思维能力。国内厂商在同步跟进o1类产品的同时，已经开始思考如何将o1的能力与现有AI应用方向结合。

在数据枯竭的情况下，o1为Scaling Law提供了新的支撑。更多大模型公司的加入，将联手探索出更大的可能性。同时，思维链的能力已经帮助提升了AI技术的使用效果。例如，智谱的“会反思的AI搜索”结合了思维链能力，能够给出更加精准的答案。

当大模型开始学会“自我思考”，通往L3（Agent）的大门也正在被推开。然而，如何平衡大模型的推理进化和用户对效率的需求，仍然是国内大模型厂商需要解决的问题。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

AI新突破？2025年或能“解码”动物叫声沟通之谜

12-27

藤仓股价暴涨背后：日本企业全球竞争力困境凸显

12-27

2024年AIGC全球融资近470亿，中国占比10.66%，投资活跃度如何？

As of the end of October 2024, U.S. companies had secured the mostfinancing globally, topping the list…

12-27

联发科天玑8400芯片发布，全大核设计引领中高端手机市场新潮流

在笔者看来，一方面，这要得益于自家旗舰芯片天玑9400在性能、能效比、AI能力上能够与骁龙8至尊版对标，同时，联发科与vivo深度合作的关系，也让其将手机头部厂商纳入自己的基本盘。REDMI总经理王腾近期透露…

12-27

阿里云全栈AI高可用架构发布，共筑AI时代云上新治理体系

12-27

RockAI刘凡平：非Transformer架构大模型引领科技创新，荣登创新人物榜

12-27

字节跳动AI投入猛增，2024年近BAT总和，2025年或再翻倍？

12-27

零售商家点赞：这朵“营销云”如何助力业绩飞跃？

12-27

俄罗斯自研CPU亮相AI服务器，双路96核可搭八块GPU引关注

12-27

微软硬推Copilot并涨价，Microsoft 365用户不满情绪高涨

12-27

图森未来：自动驾驶之光黯淡，AIGC转型能否照亮前路？

2024年8月，一份《股东致图森未来公司董事会》的股东文件指出：陈默与郝佳男（图森未来中国区CEO），投入人工智能动画和视频游戏领域，是为了转移图森未来退市后的资金，涉嫌自营交易。在陈默的宏伟蓝图中，图森…

12-27

微软与OpenAI：千亿盈利成通用人工智能新标尺？

12-27

腾讯迈瑞联手发布“启元”，打造全球首个重症医疗AI大模型！

12-27

荣旗科技全资控股新公司，耀旗科技涉足智能机器人销售领域

12-27

平治信息携手成立新科技公司，涉足人工智能与智能机器人领域

12-27

点击查看更多 +

全站最新

荣耀福州新公司开业，业务涵盖智能机器人销售等多元化领域

东方甄选三周年自营爆品揭晓，烤肠销量破2.3亿根引领热潮

乐道L60百日交付量破2万，新能源市场再现强劲势头

崩铁遗器内圈“牢九门”全解析，下三门真的如此不堪吗？

《燕云十六声》PC公测盛启，武侠新世界等你来探索！

微信投骰子秘籍：让聚会游戏与日常决策更添趣味

热门内容

本栏最新

AI新突破？2025年或能“解码”动物叫声沟通之谜

2024年AIGC全球融资近470亿，中国占比10.66%，投资活跃度如何？

联发科天玑8400芯片发布，全大核设计引领中高端手机市场新潮流

阿里云全栈AI高可用架构发布，共筑AI时代云上新治理体系

RockAI刘凡平：非Transformer架构大模型引领科技创新，荣登创新人物榜

零售商家点赞：这朵“营销云”如何助力业绩飞跃？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.