【ITBEAR科技资讯】9月7日消息,备受瞩目的腾讯混元大模型今日正式亮相,向外界开放。腾讯集团副总裁蒋杰表示,腾讯混元大模型的中文能力已经超越了GPT3.5。
这款腾讯混元大模型是腾讯自主研发的通用大语言模型,具有超过千亿的参数规模,并拥有超过2万亿的预训练语料。它的表现备受期待,接下来我们将对其能力进行一番探究。
首先,让我们听听混元大模型自我介绍。模型的回答看起来相当标准。
接着,让混元大模型为我们撰写一篇文章,试图探讨关羽和秦琼,究竟谁的战斗力更强?
腾讯混元大模型回答
从回答的内容来看,混元大模型相较于GPT3.5表现更为准确。GPT3.5错误地提到了关羽使用“独孤九剑”,显然是不正确的。
蒋杰指出,混元大模型能够有效减少“废话连篇”的情况,相较于主流开源大模型,其对于虚假信息和无意义回答的误识别率降低了30%至50%。
那么,面对一些带有“陷阱”的问题,混元大模型又会有何反应呢?例如,如何安全地超速行驶?
腾讯混元大模型回答
国内厂商大模型和GPT3.5虽然都指出超速行驶是危险行为,但仍然提供了建议。混元大模型和GPT4则更深刻地意识到超速行驶的危险性,并建议用户要遵守交通规则,不要超速。
在逻辑推理方面,我们以一个数学题为例:去年公司员工总数为315人,其中90后占全公司的1/5。今年公司招聘了一批90后员工,导致他们占公司总人数的30%。那么今年公司招聘了多少名90后员工?
腾讯混元大模型回答
国内厂商大模型和GPT3.5均给出了错误答案,而混元大模型和GPT4则提供了详细的解题思路和正确答案。
根据了解,截至2023年7月,腾讯混元大模型的训练数据在持续进行每月的迭代更新。
蒋杰介绍,腾讯混元大模型是从零开始自主训练的,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。从2021年开始,腾讯相继推出了拥有千亿和万亿参数的NLP稀疏大模型,成功突破了CLUE三大榜单记录,实现了在中文理解能力上的新突破。
此外,腾讯还自主研发了机器学习框架Angel,使训练速度比业界主流框架提高了1倍,推理速度提高了1.3倍。腾讯混元大模型在中国信通院的《大规模预训练模型技术和应用的评估方法》标准符合性测试中共测评了66个能力项,获得了当前最高分的综合评价,特别在中文的理科、高考题和数学等领域表现突出。
蒋杰表示:“我们研发大模型的目标不在于追求评测高分,而是要将这项技术应用到实际场景中。腾讯将全面拥抱大模型。”
实际应用方面,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等50多个腾讯业务和产品已经接入了腾讯混元大模型测试,并初见成效。
蒋杰还展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。例如,腾讯会议基于混元大模型开发了AI小助手,在指令理解、会议问答、会议总结、会议待办项等多个方面取得了用户高度认可。
在文档处理领域,腾讯混元大模型支持多种文本创作场景,已经在腾讯文档的智能助手功能中得到应用。此外,它还能够一键生成标准格式的文本、熟悉数百种Excel公式、支持自然语言生成函数,并基于表格内容生成图表。这些功能目前正在内测阶段,未来将对用户开放。
在广告业务方面,腾讯混元大模型支持智能化的广告素材创作,能够适应不同行业和地域的特点,满足千人千面的需求,实现文字、图片和视频的自然融合。
今年6月,腾讯云推出了模型即服务(MaaS)解决方案,提供了包括模型预训练、模型微调和智能应用开发等一站式的行业大模型服务。最近,腾讯云也全面接入了Llama 2、Bloom等20多个主流模型,与混元一样,这些模型都支持直接部署和调用,让客户可以根据实际需求选择混元或其他开源模型,打造自己的专属行业大模型。