登顶CLUE榜单，腾讯云小微与腾讯AI Lab联合团队提出基于知识的中文预训练模型

时间：2021-10-18 14:27:13 来源：互联网编辑：星辉 发表评论无障碍通道

2018年以来，以BERT、GPT等为代表的大规模预训练模型，带来了人工智能领域新的突破，由于其强大的通用性和卓越的迁移能力，掀起了预训练模型往大规模参数化发展的浪潮。其中微软、谷歌、Facebook、NVIDIA等诸多公司在预训练算法上持续大量投入。国内如百度、华为、阿里等公司也相继投入到大规模预训练模型算法的研究中。现阶段，在中文自然语言处理方向上，预训练也如雨后春笋一样涌现。现有算法主要依赖纯文本学习，缺少知识指导学习，模型能力存在局限。

2021年10月13日，腾讯云小微与腾讯AI Lab联合团队提出了基于知识的中文预训练模型——“神农”，该模型仅包含十亿级参数量，并一举登顶CLUE总排行榜、1.1分类任务、阅读理解任务和命名实体任务四个榜单，刷新业界记录。

10月13日，“神农”刷新CLUE分类榜单纪录;HUMAN 为人类标注成绩，非模型效果，不参与排名。

同时，“神农”登顶CLUE阅读理解、NER榜单，刷新业界记录。

作为中文语言理解领域最具权威性的测评基准之一，CLUE涵盖文本相似度、分类、自然语言推理、阅读理解、NER等众多语义分析和理解类子任务。近段时间，各大公司纷纷用CLUE作为预训练算法能力的验证和衡量标准。此次登顶CLUE榜单，不仅代表了云小微与腾讯AI Lab联合团队在中文预训练研究领域达到业内领先水平，并且推动中文预训练模型在理解和推理方面提升了一个新高度。

联合团队致力于将知识融入预训练模型，进而充分发挥已有参数下的模型潜力。模型结构方面，“神农”基于 Transformer 架构，仅包含十亿级的参数量。从数据量来看，“神农”以数百 GB 级的平文本做基石，涵盖百科、论坛博客、新闻、财经等众多领域的高质量文本。相对于业界其他中文预训练模型，“神农”在以下三个方面获得了突破性进展：

第一，“神农”从两个角度对知识进行建模，分别是“通用型推理知识”和“任务型知识”。通用型知识指的是现有知识，比如词法、句法、图谱等，这类知识的特点是通用性强，覆盖度广。虽然能整体提高模型的能力，但是在特定场景中往往不容易发挥作用。而任务型知识旨在挖掘场景下特有的知识，并通过将其泛化来提升预训练模型的能力。二者可谓相辅相成。

第二，联合团队将汉语中典型的篇章推理知识作为通用知识融入预训练过程中，如因果、对比、递进、转折关系等。中文是表达极其丰富的语言，存在大量指示性的虚词。这些虚词在中文的语义理解中起着至关重要的作用。比如：

这段话的语义可谓一波三折，而引起语义起伏变化的正是这些虚词。通过引入这类知识可以强化模型对中文的理解能力。

第三，“神农”提出基于对比学习的任务型知识挖掘和融入算法。通过定义知识模板，该算法可以为指定任务“定制知识”，并将其融入到训练过程中。另外，“神农”将挖掘出来的知识在大规模单语文本中进行泛化，大大提高了知识的表达能力。

“神农”正是通过充分利用这两类知识，进一步强化了中文预训练模型的能力，在包含文本分类、阅读理解等多类任务上表现出色。

一直以来，腾讯云小微团队和腾讯AI Lab团队持续深耕知识挖掘、语义理解技术以及预训练技术。云小微方面，依托自研的知识挖掘算法和深度学习技术，基于平台对行业知识的长期积累，能快速搭建多个领域的知识结构，有效地从非结构化文件中抽取关键信息，为行业提供全流程知识构建服务。在此加持下，团队通过将行业知识与预训练技术相结合，可以更好地服务应用，为各行各业输出完整的AI解决方案，不断渗透智慧生活各个场景。目前已在智能网联汽车、智慧文旅、智慧教育等多行业领域落地应用，服务广泛的用户群体。腾讯AI Lab始终强调研究与应用并重发展，其研究覆盖机器学习、计算机视觉、语音识别及自然语言处理等四大核心方向，其中自然语言处理方向强调赋予计算机系统以自然语言文本理解与外界交互的能力，并不断探索最前沿的文本理解和生成技术。实验室立足未来，开放合作，致力于不断提升AI的认知、决策与创造力，向“Make AI Everywhere”的愿景迈步。

本次两个团队强强联合，深入探索知识与预训练的融合技术，提出了全新的基于知识的预训练方法，在这一领域又迈出了坚实的一步。

在大会上，声网发布了他们的RTE+AI能力全景图，在全景图中，声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AIAgent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度，清…

在X100S、X200系列上，vivo通过AI大模型对超过十亿的物体数据学习，再结合AI多帧高像素算法，实现了远景画面的高清拍摄；OPPOFind X8系列更是直接宣传搭载了AI千里长焦，在20倍-120倍…

恰好，雷科技手上这台小米15是首批搭载HyperOS2.0的产品，在这几天的体验中，小雷也感受到了小米对于手机操作系统的一些新构思和小心机，以及对于手机未来的探索和思考。曾在操作UI上吃过亏的小米显然明…

这不仅极大提升了小笨智能SLAM &机器人领域的智能化水平和服务效率，还将助力我们快速拓展市场边界，为客户提供更加高效、灵活、可靠的智慧服务解决方案，引领行业迈向新的发展阶段。未来，小笨智能将继续在工业智…

为深入贯彻党中央、国务院关于推进新型工业化、支持制造业企业及中小企业数字化转型的系列决策部署，落实《上海市制造业数字化转型实施方案》的任务要求，加快推进企业数字化转型，上海市经信委开展了2024年度上海市重点…

财报提及，三季度Meta元宇宙业务营业亏损44亿美元，而Meta还计划加大在AI上的投资，预计2025年资本支出将显著增加。Meta CFO表示，现实实验室在2024年运营亏损还将显著增长，原因是公司持续的产…

他认为，人工智能赋能科研工作有三个台阶，一是借助科研文献助手和代码助手提升基础工作效率，二是基于深度神经网络对科学任务进行精准建模，三是借助认知大模型学习领域知识并辅助设计科研实验方案。在今年的科大讯飞全球…

2024年10月30日，豆神教育在北京举行豆神辞源大模型“名师超拟人，AI新时代”产品发布会，推出自主研发的端模一体教育产品——豆神AI，将客户端与大语言模型深度结合。与之类似，智谱华章有优秀的大模型开发及…

该合作将以联合研究阿拉伯语模型以及沙特特定的人工智能应用为特色，目前有待获得监管机构的批准。新的投资建立在谷歌云在沙特阿拉伯的现有业务基础上，其中包括去年启动的达曼云区域，该区域是谷歌云目前全球40个区域…

微软在周三提交给美国证券交易委员会的文件中写道：我们对 OpenAI Global,LLC（简称OpenAI）进行了投资，并已承诺投资总额为 130 亿美元。在之前提交给美国证券交易委员会的文件中，微…

10 月 31日消息，据《科创板日报》今日消息，荣耀股改引入新一轮投资者，中国电信、中金资本旗下基金、基石旗下基金、特发基金，以及新一轮代理商投资平台（金石星耀）等机构加入。对于此轮融资，荣耀称…

只有形成智算云产业的自循环，中国云谷的建设才有意义。在《机器中的达尔文》一文中，塞缪尔·巴特勒提出了“机械王国”的理论：技术进化与生物进化的过程将多方面重合，但不会像生物进化漫长而平静，而是带有激烈且革命性的色彩。他不吝词藻描绘道：“如今机器被用来生

近日，腾讯音乐娱乐集团（Tencent Music Entertainment Group，简称 “TME”）与中兴通讯近日达成了一项具有重大意义的战略合作，这次的战略合作不仅包含音乐产品合作，也将在音乐AI…

作为 NVIDIA Compute (GPU)、Networking (网络)的双 Elite 精英级合作伙伴,超擎数智在 NVIDIA中国开发者之夜现场展示了擎天系列AI服务器、NVIDIA Quant…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.