5G时代,更多物理设备链接到高可靠、低延迟的网络空间,越来越多的场景需要更高效的视觉计算、更低延时的体验,更好的隐私保护。在刚刚结束的百度AI开发者大会上,百度大脑视觉技术再次升级!百度视觉技术部、增强现实技术部总监吴中勤全新发布视觉语义化平台2.0-软硬一体解决方案,让边缘设备更聪明、更高效。
会上,吴中勤着重通过飞桨-PaddleSlim,FaceID多模态人脸识别组件和AI相机3大技术和应用,展示了视觉语义化技术在软硬件结合方面的全新升级。
模型压缩平台PaddleSlim,助力端算法快速高效落地
随着移动设备被广泛使用,在移动互联网产品和众多边缘设备应用深度学习和神经网络技术已经成为必然趋势。但对于开发者来说,除了模型的训练,在产品化过程中还会遇到各种各样的工程化问题,例如安装包大小、运行内存占用大小、推理速度和效果等。当前主流的模型很难直接高效的部署到各种智能设备中。
飞桨(PaddlePaddle),作为中国首个也是目前国内唯一开源开放、功能完备的端到端深度学习平台,深受开发者的欢迎。PaddleSlim,是飞桨平台中强大的模型压缩工具,来源于百度视觉团队的工业实践。不仅简单易用,而且支持的压缩方式种类和效果业界领先。
PaddleSlim 实现了目前主流的网络量化、剪枝、蒸馏三种压缩策略,并可快速配置多种压缩策略组合使用。针对体积已经很小的 MobileNetV1 模型,在模型效果不损失的前提下实现 70% 以上的体积压缩。以人脸技术为例,在精度几乎不衰减的情况下,模型速度提升接近9倍.同时也新增了基于模拟退火的自动剪枝策略 AMC 和轻量级模型结构自动搜索功能 Light-NAS,对比 MobileNet v2 在 ImageNet 1000 类分类任务上精度无损情况下 FLOPS 减少 17%,在百度的OCR识别等业务线应用,精度无损甚至提高的情况下,速度均带来了大幅提升。同时压缩工具简单易用,极大的提升了模型压缩的开发效率。
通过飞桨Paddle-Slim可助力开发者快速将不同场景的端算法进行有效的往边缘移植,为用户提供相应速度更快、交互性更好的产品.
多模态人脸识别开发组件FaceID,直击软硬件适配痛点
现在AI落地如火如荼,百度人脸业务的增长速度今年比去年同比调用量增长了10倍,但是很多开发者都会面临和AI产品结合时应该配置什么摄像头,应该买什么品牌型号等问题,之后还有一系列的适配的工作。为了确保给开发者提供领先且实用易用的产品。百度联合生态合作伙伴推出软硬一体的多模态人脸识别组件FaceID。
Face ID软硬结合开发套件均支持RGB单目、3D结构光、近红外3种模态,并搭载业界领先的人脸检测、人脸关键点、人脸活体、人脸识别的全流程能力,较之前全流程业务速度可控制在500ms以内。同时可支持5万底库。极大拓展开发套件的应用范围。从易用性角度,基于大量的客户反馈和建议,优化了底层API设计,更符合场景化业务开发,有效降低开发周期。在场景支持上,对于人脸通行、人证核验等典型场景,百度提供了场景化示例工程,并配合多种高级设置,帮助开发者一分钟跑通业务流程。
这款软硬一体、即插即用的人脸识别组件,能够极大地帮助开发者节约部署与维护成本,目前已落地政务、金融、教育、零售、公共出行等多个行业,设备覆盖量超过1200万台。
AI相机,即拿即用的软硬一体解决方案
此次发布的软硬一体AI相机系列产品,将领先的AI视觉技术与智能芯片技术联合优化,实现了端上的AI视觉计算。系列包括“寻相人脸抓拍机”、“寻相鱼眼人流相机”、“寻相智能户外相机”等多种形态的AI相机产品,可以实现人脸检测、跟踪、人体分析、车辆分析等功能,产品稳定性、功耗、综合效果行业领先。
如“寻相人脸抓拍机”利用Intel Movidius 技术,可支持帧率25 Hz、20张人脸在复杂光照条件下的高精度抓拍,在客户实际场景使用达到96%抓拍和识别召回率。
寻相 VX-HT01人脸抓拍机
除了人脸产品,我们也将人体分析、商品识别、SLAM等算法升级成为软硬结合产品,研制了客流分析相机、智能货柜、无人零售店、服务机器人等产品,均已经落地投入使用。
以品牌连锁门店为例,利用人脸抓拍机和人流分析相机百度构建了门店智能监控方案,用于统计线下门店转化率,识别重复到店顾客,绘制商区热力图。这套方案易部署、性价比高、产品可靠,已经签约落地多家品牌连锁企业,在3C卖场、手机品牌店、通信营业厅、便利店等多个场景中帮助企业主进行做出“更智慧”的运营决策。
百度完整的软硬一体产品线,可助力开发者、企业灵活地组合各软硬件产品及功能,解决不同场景下对视觉语义化技术的需求。
在高性能的软硬结合产品的背后,隐藏着百度模型加速、人脸识别、物体检测等多项取得了学术竞赛第一的领先算法,积累了多年的异构计算优化技术,以及和深圳供应链的深度整合能力。
在即将到来的5G时代,百度视觉语义化平台的软硬结合解决方案无疑对视觉技术在不同场景的落地需求提供了坚实助力。弥合虚拟世界与物理世界的间隙,刷新人们探索世界的方式,未来,人工智能视觉技术将离你我身边越来越近。