ITBear旗下自媒体矩阵:

百度机器海选:机器如何认出“姐妹花”

   时间:2013-04-03 15:00:08 来源:ITBEAR编辑:星辉 发表评论无障碍通道

娱乐界往往是新技术的“尝鲜者”,因新技术引入促成“重要事件”的不乏先例,以卡梅隆在电影中大量采用3D技术最为典型。在今后一段时期,“机器海选”可能会成为娱乐界会特别关注的技术方案。

4月1日,由百度发起的“机器海选”活动迅速蹿红。“用机器代替评委,以算法决定评判标准,用手机拍照就能参与”,这种新玩法吸引了众多网友关注。一天之内,APP下载使用量近2万次,微活动相关话题达到了7万多条。


演员贾玲(左)原来相似歌手李宇春

对网友们来说,APP客户端本身是个娱乐软件,上传照片就能测出与自己与明星相似的程度,但这仅仅是表象。如果判断无误的话,背后其实是百度为海量视觉搜索系统做的一次beta测试,人脸不过是切入点之一(百度开发的全球首个全网人脸识别产品于去年底上线,今年百度APP iOS版推出狗、图书、海报等细分图像搜索)。究其技术本身而言,这是百度在“人脸识别”技术和“海量数据分析处理”的一次合练。

对于人类来说,因为大脑的精密性,认识一张图片并不难。而对机器来说,要先从图片中识别出是否有人脸,再确定出人脸的特征到底是怎样的?后面还要与海量的人脸图片相对比。其技术难度超过大多数人的想象。为什么百度的识人技术能做到准确呢?背后到底是哪些技术做支撑呢?不妨把我们自己的行为和机器行为做个对比。

先来说说人脸识别,要将真实世界的图像转化为机器能识别处理的数据,必须要“见多识广”,以海量数据学习做支撑,起步工作是将几千万人脸数据让机器学习出来,识别人的特质,把物理世界的脸变成机器可以理解的脸,以前有指纹库、DNA库,现在相当于也有了人脸库。作为搜索引擎公司,百度能够索引互联网上数以百亿计的图片资源,而且业务本身就决定了它要拥有海量数据的高性能处理平台,这样的优势是学术界经常使用几千个研究样本难以比拟的。

为什么人能看出两张人脸的差异和相似处呢?因为每张人脸都是有特征的,有些人类可以快速看出来,比如肤色、纹理、轮廓、五官距离、几何造型等等。还有一些认识的层次更深一些,观察力不强的人很难快速说出来,比如颧骨高低、鼻子挺拔程度等等。我们现在的要求是,机器必须能像人一样认识这些特征,这样才能从不同照片中准确认出一个人。

从方法上说,百度的人脸识别其实是将人脸快速用几万个维度表示出来,同时要克服光照、姿态、表情、角度等有可能影响提取特征的环境因素,把人脸改造成一张机器参数表示的面孔,再通过开发的极其精密的算法将维度缩减为一定数量的特征。这个过程很类似于大脑的思考,甄选出独一无二的信息来。方法实现的核心在于算法,这是百度视觉技术的核心,投入优势资源打造的重武器。而依靠搜索技术长期建立的大数据处理能力,机器算法可以在很短时间内并行分析处理完成。

值得期待的是,机器学习领域的前沿技术——“深度学习”已被应用于视觉和语音等多媒体技术中,系统会通过神经网络的方法,不停自动学习特征和组合,它能让系统辨识发生飞跃,未来前景是让机器像正常人一样学习,拥有人脑的分析能力,智能分辨图片中的每个物体。

今年年初,百度对外宣布成立百度研究院,初期就重点聚焦于“深度学习”技术,这说明百度其实已经从前期投入中尝到了甜头,并坚信继续加大的技术投入将给百度的基础核心技术带来回报。种种迹象表明,机器大脑时代渐近了!

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version