腾讯于2月27日正式揭晓了其自研的快速思考模型——Turbo S,标志着腾讯在人工智能领域迈出了重要一步。
据腾讯介绍,Turbo S与之前的Deepseek R1、混元T1等慢思考模型有着显著区别。这些慢思考模型往往需要“思考后再回答”,而Turbo S则能实现“秒回”,其吐字速度提升了一倍,首字时延降低了44%。Turbo S在知识、数理、创作等多个方面均展现出卓越性能。通过模型架构的创新,Turbo S的部署成本大幅降低,进一步推动了大模型应用的普及。
研究显示,人类在日常生活中约90%至95%的决策依赖于直觉。Turbo S所代表的快思考模式,正如人类的“直觉”,使大模型能够在通用场景下迅速响应。而慢思考则更像是理性思维,通过逻辑分析来提供解决问题的思路。快慢思考的结合,使得大模型在解决问题时更加智能和高效。
在多个业界公认的公开基准测试中,腾讯混元Turbo S在知识、数学、推理等领域均表现出色,与DeepSeek V3、GPT 4o、Claude3.5等模型相媲美。通过长短思维链的融合,Turbo S在保持文科类问题快速思考体验的同时,还基于自研的混元T1慢思考模型合成了长思维链数据,从而改进了理科推理能力。
在架构方面,Turbo S创新性地采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache缓存占用,从而实现了训练和推理成本的降低。这一融合模式突破了传统纯Transformer结构大模型在长文训练和推理方面成本高昂的难题,既发挥了Mamba高效处理长序列的能力,又保留了Transformer善于捕捉复杂上下文的优势。
腾讯表示,Turbo S将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,腾讯自研了推理模型T1,该模型已在腾讯元宝平台上线,用户可以根据自己的需求选择Deepseek R1或腾讯混元T1模型进行回答。
腾讯混元还透露,正式版的腾讯混元T1模型API将很快上线,对外提供接入服务。在定价方面,Turbo S的输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相较于前代混元Turbo模型,价格有了显著的下降。
腾讯的这一系列创新不仅展示了其在人工智能领域的深厚积累,也为大模型应用的广泛普及奠定了坚实基础。