ITBear旗下自媒体矩阵:

百度松果计划与中科院合作 锁定知识图谱构建方法

   时间:2016-04-21 21:34:41 来源:互联网编辑:星辉 发表评论无障碍通道

近日,百度 “松果计划”公布了由百度与中科院计算技术研究所合作开展“面向全网数据的知识图谱构建方法研究”的专项课题研究。该项目由百度互联网数据研发部(Web Data)主导,研究课题未来输出的知识数据将可以直接运用于百度搜索、度秘等百度产品中。此外,百度会为中科院数据挖掘领域的资深专家与优秀同学提供技术支持,并为表现突出的实习生开通进入百度的“绿色通道”。

近年来,知识图谱这个“概念”离人们越来越近。在大数据时代还未成形的时候,先知先觉的互联网大咖们早已将这一知识图谱“概念”转化为实际应用,服务于用户的生活。知识图谱的核心就是实体的属性信息以及实体与实体间的关系网络。大家比较熟悉的有社交图谱,比如社交软件帮你推荐好友,这是基于社交网络大数据挖掘产生的奇妙化学反应。但知识图谱的应用远不止于此,从明星八卦到多学科融合,它能覆盖到我们工作生活的方方面面。

不过,随着整个网络数据量的增加,知识图谱在帮助人们发现实体与实体之间隐秘关系的同时,也面临着诸多难题,目前,大多数互联网产品都有知识类数据的需求,但依据当前的技术,知识数据的提取较多地依赖于人工干预,造成了大量的人力、财力及时间等方面的消耗,同时在数据的挖掘源方面也仅局限于少量的网站。因此,如何高效地提取知识数据是目前亟待解决的问题所在。

百度是最早建立知识图谱并将其应用到产品中的互联网企业,目前百度知识图谱发展非常迅猛,其中不乏亮眼的表现,例如在用户搜索时可以直接给出答案、搜索结果场景化、可以产生多维度的信息展示、丰富的相关信息推荐。即便如此,互联网下庞大的数据计算量和持续更新的知识提取及入库对百度来说也是巨大的挑战。

基于此,百度 “松果计划”与中科院合作,以“面向全网数据的知识图谱构建方法研究”为本次合作研究课题,共同研究提高知识生产效率的方法。百度互联网数据研发部与中科院计算技术研究所在知识图谱方面的合作,在去年已经有了不错的成果,共同建立了全自动知识数据生产系统模型的雏形,已支持精准问答下的人物职位问答、娱乐人物关系问答以及图谱中间页人物关系图谱的生成。

本次课题将会探索构建一个高效的知识数据全自动生产系统模型来优化处理知识数据,完成大规模数据生产,从而将单领域知识数据生产速度从月级降到周级,同时可以面向全网网页库产出亿级别可用的知识数据。该课题研究输出的知识数据未来还将可以直接运用于百度的产品中,例如百度搜索、度秘等,并使这些产品在提升搜索效率、优化搜索交互体验、丰富搜索结果的摘要展现形式等方面有巨大提升。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version