昆仑万维集团近日宣布了一项重要更新,其天工大模型4.0系列中的o1版和4o版已全面上线,覆盖网页端与App端,且面向公众免费开放使用。
天工大模型4.0 o1版被标榜为国内首款具备中文逻辑推理功能的o1模型。它不仅包含了开源的基础模型,还推出了两款性能更为出色的专用版本。这款模型在处理数学、代码、逻辑推理、常识判断以及伦理决策等复杂问题上,展现出了高超的能力。
与此同时,天工大模型4.0 4o版作为一款多模态模型,同样引起了广泛关注。昆仑万维还推出了由该模型赋能的实时语音对话助手Skyo。Skyo以其出色的情感表达能力、快速响应以及多语言流畅切换的特点,为用户提供了全新的智能对话体验。
据官方介绍,天工大模型背后的Skywork o1采用了三阶段的自研训练方案。首先,通过自研的多智能体系统,构建高质量的分步思考、反思和验证数据,以此对基座模型进行进一步的预训练和监督微调。这一过程中,大规模使用自蒸馏和拒绝采样技术,显著提升了模型的训练效率和逻辑推理能力。
其次,Skywork o1团队研发了适配分步推理强化的Skywork o1 Process Reward Model(PRM)。实验证明,该模型能够有效捕捉复杂推理任务中间步骤和思考步骤对最终答案的影响,结合自研的分步推理强化算法,进一步加强了模型的推理和思考能力。
最后,Skywork o1还基于天工自研的Q*线上推理算法,配合模型在线思考,寻找最佳推理路径。这一创新举措不仅在全球范围内首次实现了Q*算法的公开,还大大提升了模型的线上推理能力。