在当前各种朋友圈关系愈发狗血和错综复杂的时代,要用只言片语说清楚还真不容易,每次有重大新闻、花边新闻发生的时候,为了满足读者的需要,不少媒体的编辑们开始操刀画图,谁和谁是前男女朋友,谁又是谁之前的同事,谁又是谁的七大姑八大姨隔壁家的朋友,一副朋友圈的图能让编辑们彻夜吐血。
不过,对于还在回味《小时代3》的粉丝们,度娘有了新用途。百度一下“小时代”,右边栏多了个“小时代3人物关系图”,点击进去后,南湘、顾里和她们的闺蜜、男友、朋友敌人们,一目了然。再点击人物,还有更多关系内容,角色介绍、扮演者介绍、剧照、小说作者、小说内容,简直就是小时代的百科全书。
这个应用非常有意思。互联网带来了海量的信息,这让人拥有了无以伦比的能力,你想要什么都有,但是,海量信息同时也带来个问题,信息的碎片化、同质化,对于一个用户的某个需求来说,信息噪声太多,为了找到自己想要的东西,不断的要打开各种各样的网页。能自动把信息组织起来,提供一个整合的结果而不是网页的链接,这是搜索追求的目标。对于用户来说,不再是寻找网页,而是寻找结果。这个技术,就是知识图谱。
知识图谱是围绕关键词的信息重组,并以图文并茂的方式展现知识的方方面面,关键词可以是人物、地点、商品、事件,知识图谱为互联网知识和信息的理解提供了更自然、更直接的表达。目前百度的知识图谱已经涵盖十几大领域,数十个类别,拥有上亿实体量,从小时代这看似简单的图形化表达背后,可以一窥百度知识图谱的大数据算法以及自然语言处理的技术所到达的能力。
在海量数据挖掘的今天,需要有高速有效精准的算法,百度知识图谱将杂乱无章的数据进行分类梳理,并通百度前端可视化团队的开源产品Echart力导向图等工具,把结果展示出来。这样一来,复杂的知识体系通过数据挖掘、信息处理、知识计量和图形绘制显示出来,关系网越来越完善,和用户的互动也越来越强,也满足了不同用户的各种需求。
实际上,除了画朋友圈,百度图谱还能干很多事,这些已经在我们日常的搜索中悄然在右侧栏出现。
比如知识图谱能够挖掘更多新闻背后的故事。最近你搜搜最热的人物,你能看到按时间梳理的其被查脉络,以及他的朋友圈。娱乐八卦人物背后的故事也是大家搜索的最爱,在7月初传出汤唯结婚信息的时候,百度一下“汤唯”,右侧栏会出现 “那些年汤唯爱过的男人们”。
知识图谱还能帮助把复杂的事情变简单。当然画朋友圈是其中一项,但还有很多应用场景,比如旅游,搜索一下“鼓浪屿“,右边栏会出现所在地去厦门的机票,还有鼓浪屿的地图以及拥挤程度,还有厦门的相关景点、周边交通信息等。
目前,百度知识图谱技术主要在搜索页面的右侧有所体现,在用户点击搜索键之后,百度会在呈现关键词搜索页面的同时,于右侧栏目向用户推荐与关键词相关的词条,同时百度还会通过分析海量的搜索数据发现用户搜索习惯,并据此对搜索结果进行持续优化。而据一名百度内部程序猿透露,百度还会在左侧部分进行革新,并且知识图谱还将广泛应用到与自然语言息息相关的各个产品之中。
为什么度娘有能力来把这件事做好?众所周知,知识图谱对“语义识别”技术门槛极高,对社会化开源内容有很强的支撑需求,且是依赖大量用户的行为数据库的产品形态。百度搜索本身就是一个大数据来源,同时百度还拥有来自像百度百科、百度知道、百度文库等产品的多方面数据支持,这些共同将百度打造成一个数据航母战斗群,促使百度能够在一年时间里完成了近百亿实体知识图谱的构建并且实现了平台化,这样百度知识图谱就能够快速切换支撑多个产品的发展。通过构建宏大的知识网络,整合碎片化信息,再以图文并茂的方式展现出来,人们便可以在轻点鼠标的片刻,迅速获取知识、找到所求。
值得一提的是,就在几天前,百度刚刚推出了极简首页,入口更简单,而知识图谱则是让得到的结果更丰富,这一减一加,体现了搜索的未来。