ITBear旗下自媒体矩阵:

深度学习“看见”未来 百度产品惊艳革新

   时间:2014-04-11 17:28:38 来源:互联网编辑:星辉 发表评论无障碍通道

4月4日,百度深度学习研究院(IDL) 常务副院长余凯做了“Deep Learning Unfolds Big Data Era”的主题演讲,这次百度“深度技术大讲堂”在清华大学的活动吸引了中国科学院张钹院士、机器学习专家美国哥伦比亚大学Tony Jebara教授、清华大学计算机系主任马少平教授以及中科院张云泉教授悉数到场,报告内容的含金量自然不在话下。

深度学习为何受到业界如此聚焦?作为机器学习研究中的一个新的领域,深度学习的动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。作为机器学习的重要分支,深度学习技术近年席卷产业界和学术界。

深度学习是最接近人脑的复杂模型,也是目前向人工智能走得最近的方法。

技术模拟人脑? 互联网巨头齐齐下手

Facebook、Google、Yahoo!、IBM、苹果、微软、百度等均在此方面做了多种尝试,百度还在美国硅谷特别成立了首家研究院——百度深度学习研究院(IDL),招揽全球机器学习领域的青年才俊。

互联网企业为何看重深度学习技术?从百度的产品与服务中,我们不难猜测一二。据了解,百度在用GPU提升计算效率、处理海量训练数据、OCR识别、图像识别、人脸识别、语音识别等方面取得了巨大提升,到目前为止,已经有超过8项深度学习技术在百度产品上线。

在百度图片中搜索“泰姬陵”,选择一张图片后,在大图显示页面的右侧,有一个“相似图片”的按钮(如图一),点击后发现,与原图构图相似的图片在这里都能找到(如图二)。这一功能的实现,就是基于深度学习技术。在对图片构图分析的基础上,得出该图片的主要特征,通过图片标注和文字标注等形式,与图片库的图片进行一一比对,最终得出相似图片的结果。这种搜索图片的方式对于喜欢某类图片风格的用户来说,大大提升了搜索效率,无须再逐一搜索,用户体验显著提升。

1

图一

2

图二

语音识别+贴吧 深度学习提升互联网产品活力

语音识别方面,百度的表现也可圈可点。2012年底百度上线了第一款基于DNN的语音搜索系统,成为最早采用DNN技术进行商业语音服务的公司之一;2013年百度推出的百度手机输入法Android平台3.5版,中文语音识别率突破90%,这样的成绩在业界尚属第一次。

深度学习技术对百度影响深远。百度贴吧具有极强的开放性,所以贴吧里会存在部分垃圾信息,百度基于深度学习色情图像识别率超过传统方法100%,在清除垃圾信息方面更给力,为给用户创造了一个良好的使用环境;深度学习还让百度在在语音识别领域的错误率相对降低了20-30%;全流量上线广告CTR预估,提升CTR3.7%。

这些技术技术提升带来的产品用户体验变革其实正在慢慢改变品牌的市场口碑,关于企业的行业地位远期来看自然是有增无减。

成功条件:大数据+计算能力+复杂模型+高效算法

伴随大数据时代的来临,深度学习的用武之地越来越多。百度深度学习研究院首席科学家张潼认为,近年深度学习的成功条件可以归纳为“大数据+大规模计算能力+复杂模型+高效算法”。

百度能够在深度学习方面取得现有的成绩,原因之一就是百度在大数据等方面具有天然优势。作为全球最大中文搜索引擎的百度,每天响应网民60亿次的搜索请求,因此能够得到海量、真实的大数据,因此才能开展深度学习研究,没有足够的数据样本,深度学习将毫无意义。

 

在深度学习方面投入巨大资源,也许正因为互联网公司看到了“大数据+深度模型”的未来,在海量信息中,深度学习将为企业探索到更多的有效信息,用产品高质的用户体验夺取市场竞争的先机。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version