滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

百度机器阅读理解竞赛评审结束最大、最具挑战性数据集获评“超赞”

时间：2018-05-25 11:42:51 来源：互联网编辑：星辉 发表评论无障碍通道

近日，由中国中文信息学会(CIPS)、中国计算机学会(CCF)联手百度公司共同举办的“2018机器阅读理解技术竞赛” 圆满落幕。来自全球各地的1062支参赛队伍，在百度提供的中文阅读理解数据集基础上，对测试问题进行不断探索，使得参赛系统水平得到显著提升。大赛更多信息可登录2018机器阅读理解技术竞赛官网http://mrc2018.cipsc.org.cn/查看。赛后，获奖选手纷纷表示，百度向大众开放大规模中文阅读理解数据集意义深远。

共享优质数据集百度直击行业数据缺失痛点

在机器学习领域，数据是机器学习的原料，也是推进行业结构转型升级的燃料，而对于个人研究者与高校学子来说，数据缺失成为研究的困境所在。作为最大的中文搜索引擎，百度在数据方面具有得天独厚的优势。2017年底，全球规模最大的“BROAD”百度AI公开数据集计划(Baidu Research Open-Access Dataset)正式启动，百度面向公众开放包括室外场景理解数据集、视频精彩片段数据集、阅读理解数据集3个数据集。

来自北京大学Dlib实验室的尹伊淳正是在阅读了百度DuReader数据集的论文后，才选择参与到本次百度机器阅读理解技术竞赛中的。这批公开的、大规模、高质量的真实数据集大大激发了他对于这项工作的兴趣，使得他在最终角逐中获得了总排名第二的好成绩。

本次机器阅读理解竞赛中百度提供给参赛者的，正是面向真实应用场景的大规模阅读理解数据集。该数据集是迄今为止最大的中文阅读理解数据集，其中包含来自百度搜索的30万个真实问题，每个问题对应5个候选文档文本，以及人工撰写的优质答案。东北大学自然语言处理实验室知识图谱团队在赛后表示，“数据集的开放使得机器阅读理解系统得以映射到真实的使用场景中。”对于机器阅读理解技术研究者而言，百度数据集弥合了国内的真实场景语料多文档阅读理解数据集的空白，也为加速AI产品落地带来了启示。更多数据集论文可登录https://arxiv.org/abs/1711.05073查看，供业界交流使用。

获奖团队好评如潮百度数据集带来真实创想

在比赛中，选手们依托百度阅读理解数据集，参赛系统整体水平得到了显著提升。比赛期间排行榜高分不断刷新，ROUGE-L评价指标由最初的35.96提升至终赛的63.38，接近半数的系统结果超过了基线系统。

赛后，就百度数据集的数量与质量，本次机器阅读理解技术竞赛的获奖团队，给出了一致好评。选手们纷纷表示，面向真实场景的大型阅读数据集，为自然语言研究引入了宝贵的创想。

最终在竞赛中拔得头筹的北京奇点机智科技有限公司(Naturali)团队表示，此次比赛数据集聚焦于实用场景，问题来源于真实用户，类型多样，其中来源于真实网络文档的数据，有别于经过精心编辑的文档，更有利于机器阅读理解研究“从理想照进现实”。

面向高校开源不断百度助力AI人才培养与升级

作为一名机器学习方向的研究生，来自上海理工大学的王忠萌选手此前的研究材料以各种英文数据集为主。竞赛中与百度数据集的交汇，点燃了他对中文机器阅读理解的兴趣。正如评测委员会成员刘凯所说，此次竞赛提供的数据，将帮助参赛者挖掘更多中文阅读理解问题，同时更深入地接触到实际的应用需求，最终起到引导参赛者关注中文机器阅读理解的目的。

百度中文数据集的公开，只是百度数据集分享计划的一小部分。百度通过本次竞赛为学术界和工业界提供了一个公开的阅读理解技术交流平台，将大量优质的数据集与研究成果将触达到更多高校学子和企业研究人员，降低了AI研究的门槛，使得个人研究者也能积极参与到系统研发与调试中去。这不仅直接推进了AI技术的发展进度，还将大量潜在的AI人才吸引到行业之中，培养与成就更多中国人工智能领域的精英技术人才，打造优良的行业生态。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

顺丰航空引领！国内全货机首次SAF商业飞行成功落地

12-19

中央经济工作会议力推哪些新兴经济模式？

12-19

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

12-19

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

12-19

宠物粮市场乱象频发，铲屎官如何为宠物选对粮？

据“趣解商业”了解，“源鲜”曾是网易严选、喵梵思等国产中高端品牌多次合作的代工厂，在不少养宠人心中有较高信任度；“源鲜”的塌房，再次挑动了许多养宠人的神经。 Erica还提到，宠粮本质上属于快消行业，并不是靠…

12-19

柔韧机器人：具身智能的新赛道与革命性突破？

相比于现阶段普遍使用的基于电机关节、金属材料、复杂传感器和精密加工工艺的“刚性”机器人技术，万勋科技通过使用软性材料与气/液驱动，以软材料仿生肌肉和神经元智能复刻人类肌肉柔韧特性，具备轻巧灵活、安全互动、易…

12-19

北京中关村科学城国际医谷开工，打造医疗健康产业集聚新高地

作为项目建设推进方，北京海新域城市更新集团相关负责人介绍，中关村科学城国际医谷项目将在产业链上游吸引顶尖研发机构和企业，汇聚创新源头力量；在中游通过公共技术服务平台降低研发门槛，助力创新的想法实施；在下游建…

12-19

《猎人克莱文》IGN仅评3分，高成本制作却换来低质口碑？

12-19

中兴通讯股价异动，公司称生产经营正常，无未公开重大信息影响股价

12-19

顺丰控股11月速运物流营收微增，供应链及国际业务增长超两成

12-19

澳门风情画轴展开，智界新S7穿梭其中成焦点

12-19

国产高端仪器新突破！首套高精度激光干涉仪测评装置研制成功

12-19

中国大陆TFT基Micro LED量产线点亮，新一代显示技术破茧而出！

12-19

字节跳动警示：勿盲从“豆包概念股”市场传言

三言科技12月19日消息，今日，字节跳动发布声明称，近期，资本市场出现炒作“豆包概念股”现象，流传着众多夸大其词甚至虚构内容。涉及字节跳动资本开支、数据中心花费、AI硬件、应用合作等多方面。字节跳动强调，投…

12-19

第十六届无锡新能源展盛启，27大项目签约，新能源装备之都蓄势待发！

12-19

点击查看更多 +

全站最新

黑洞风狂飙！时速3600万英里，能否重塑宇宙星系新貌？

月亮对地球有多重要？《我们真的需要月亮吗》纪录片深度解读

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

iQOO Neo10 Pro：游戏玩家新宠，旗舰性能畅爽体验

国产DDR5新突破！光威金百达32GB套装仅需499元首发

热门内容

本栏最新

中央经济工作会议力推哪些新兴经济模式？

水滴公司Q3财报亮点：营收稳步增长，运营利润达2650万

技嘉冰雕X870I主板全白亮相，AORUS PRO ICE图赏来袭！

宠物粮市场乱象频发，铲屎官如何为宠物选对粮？

柔韧机器人：具身智能的新赛道与革命性突破？

北京中关村科学城国际医谷开工，打造医疗健康产业集聚新高地

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.

百度机器阅读理解竞赛评审结束 最大、最具挑战性数据集获评“超赞”

百度机器阅读理解竞赛评审结束最大、最具挑战性数据集获评“超赞”