本文来源于南方日报,由郜小平撰文,以下为原文:
5秒!对着物流单据扫描、信息录入,这是整个流程的用时,而且,单据识别召回率与准确率均超过了98%。在这之前,人工录入环节需要3分钟。
作为物流行业领军企业的中外运提出智能化转型方向,这家企业对接世界上不同公司的货物运输,内部涉及到非常复杂的表单数据录入流程,几乎每个货运码头都需要人工录入,成本高、效率低,录入时间不能灵活处理,但通过腾讯云,诸多问题迎刃而解。
这背后,为腾讯云提供计算机视觉AI技术的便是腾讯优图实验室。一直以来,作为腾讯消费互联网业务背后的“隐形 AI 战队”,优图为包括 QQ、微信、腾讯微视等提供技术支持,而随着腾讯战略转型拥抱产业互联网,优图以计算机视觉技术为核心,专注人脸、人体、图像等视觉领域的前沿研究和产品落地,加速与实体经济深度融合,在社会民生领域广泛应用。
如今,腾讯优图在技术研究和产业落地“两条腿”支撑下,通过产业应用实践对技术进行检验,不断加速产业数字化升级,探索如何让AI真正惠及社会大众,为“科技向善”加速。
快跑阶段已过
多年服务C端技术积累,领先优势持续扩大
疫情之下,小小的口罩,带来的是安全感。然而,全民佩戴口罩也对诸如高铁闸机等需要人脸识别的场景提出了挑战:戴口罩人群由于面部区域大范围被口罩遮挡,现有算法无法准确检测人脸位置、定位五官关键点,大大降低现有的人脸识别算法效果。
即便戴口罩,不同场景千差万别:谁偷偷摘下了口罩,谁戴错了,单靠人工排查怎么减少疏漏?再比如,在高铁闸机等需要人脸识别的场景,能不能不摘口罩实现人脸识别,降低感染风险?
针对这些难题,优图迅速成立攻坚小组取得了突破,成功研发出了口罩佩戴识别专用AI。这套AI既能对戴口罩者实现人脸识别,又能发现口罩佩戴错误人员,口罩佩戴识别准确率超过99%。
对于社区人员管理和排查,腾讯优图还能结合人体识别技术(ReID)进行身份确认。人体识别技术不完全依赖人脸识别,而是结合了着装、体态、发型等特征进行辨认。
疫情期间,各大AI厂商纷纷推出各自的识别解决方案,甚至形成了同质化竞争的格局。但在黄飞跃看来,事实上,企业的差距其实越来越大。
“不能只看准确率,还要看识别的规模,比如是针对几千还是几十万人的识别,还要识别老人、小孩等不同人群的差异,不同口罩、不同光照下的差异,还有长相相似的人群区分,这部分提升空间越来越难,尤其是针对细分领域,差别依然很大。”腾讯优图实验室总监黄飞跃说。
在黄飞跃看来,人脸识别已经过了快速奔跑、粗放增长的阶段,不同企业的差距不仅仅是技术,还包括生态整合能力,也不只是单一的识别率问题,还包括服务客户的能力和硬件输出的能力。
与产业结合
推动企业数字化提质增效
依托前沿技术研究,腾讯优图视觉AI早已走出实验室,加速产业数字化升级。
这背后,是腾讯全面拥抱产业互联网。在2018年9月腾讯组织架构大变革之前,优图实验室的工作主要集中在腾讯内部的内容技术中台的打造之上,转型后则更多的放在了通过腾讯云等业务为载体的技术对外输出之中。
针对工业企业,从供应链、研发、生产到营销、服务的全流程问题,腾讯优图的AI能力正在助力工业行业提升生产效率,降低生产成本,保证科学管理和智能生产。
对于华星光电来说,面板属于精密仪器,对产品良率的要求非常高。但是面板一些细微瑕疵非常微小,不容易被检测出来。由于缺陷种类多达120种,在不同线路、不同产品上的缺陷特征又不一样,一个质检员从入职到上岗,需要2-3个月的岗前培训才能胜任。
腾讯云结合在工业视觉的能力提供相关解决方案,通过AI算法来学习华星工厂AOI设备拍摄的缺陷照片,对缺陷进行自动分类,给华星上线了一百多个算法模型,这背后便是来自优图的图像识别算法。
“图片检测其实挺考眼力的,因为很多图片看上去都差不多。”华星光电工作人员说,过去,产线上每天产生一两百万张图片,每个人要看1万多张图片,对比传统的人力判片方式,AI识别速度提升5-10倍,缩减人力50%,
华星光电高级副总裁陈盛中也感慨道,“用AI、大数据等进行判别,最终回归到了人的价值。实际上,用人来判别图片,这样的简单重复劳动,对个人并没有实现增值,相反,让人脱身从事大数据分析,将有更大的价值”。
从生产流程向两端延伸,腾讯优图进一步将人工智能覆盖整个产业链,提升管理和运作效率。在国外某知名企业的应用中,通过图像分析和统计,大型大工厂车间里的各种信息,比如不同工种的工人区域分布是否最优,货物的摆放是否合理。这些信息会有助于管理层判断当前的业务流程是否合理,是否有优化的空间,进而提升工厂的管理和运作效率。
腾讯优图在为工业企业提供解决方案层面,具有“人工和自动化相结合”“通用性和定制化相结合”“公有化和私有化相结合”等三大策略,推动传统制造业迈向高质量发展。
发力新基建
助力腾讯打造”底座建设“
自新冠肺炎疫情发生以来,以人工智能为代表的新兴科技,已经从云端“落地”。与此同时,产业互联网的快速发展在网络、算力、算法和安全等方面都提出了更高要求,迫切需要进一步加快以5G、数据中心、人工智能、物联网等为核心内容的新型基础设施建设。
对此,腾讯在持续推动新一代信息技术与制造业深度融合,助力新基建的底座建设。事实上,作为腾讯顶级的AI实验室之一,腾讯优图拥有超过800项全球专利。在零售、金融、工业等领域都有非常深厚的沉淀,经过这两年的摸爬滚打,为各行各业积累了相当多的案例和经验。
在与中外运的合作中,除了单据录入,目前中国外运在订舱委托、订舱确认件、提单样本、发票四个环节都应用了腾讯云OCR技术,基于优图领先的深度学习算法,将过去大量需要人工操作的业务流程变成全自动化,大大降低企业负担。
在智慧生活方面,在腾讯与步步高合作的智慧门店中,刷脸识别会员、刷脸支付均依托于优图人脸识别技术,消费者在2秒内即可完成支付,门店收银效率提升了两倍,为步步高节省30%以上的人力成本。
从人工智能在零售、物流等产业的快速落地中不难看出,AI与产业融合的趋势愈发明显,AI将成为各行各业降本提效的关键武器,助力行业升级转型。未来,随着5G、云、大数据和人工智能对产业的深入,优图也将继续以技术创新为驱动,为各行各业提供数字转型、智能升级、融合创新等服务的基础设施体系。
【高端访谈】
腾讯优图实验室总监黄飞跃:
与产业互联网结合发挥更大价值
12 年前,黄飞跃从清华大学博士毕业,随即加入腾讯刚成立不到一年的腾讯研究院,带着 5 个人的小组,第一个项目是做一款名为“QQ影像”的桌面处理软件。如今,这个团队已经扩展到数百人的规模,并凭借已有的技术积累与产品落地能力加速向To B的产业互联网迈进。
笔者:一直以来,腾讯优图以服务内部为主,而现在逐步向外拓展,这背后是一个怎样的逻辑?
黄飞跃:从内部到外部,是一个比较顺的逻辑。我们先在内部探索,但其实对AI技术来说,外部才是很大一个市场,我们需要寻找更大的价值,而伴随着腾讯向产业互联网迈进,优图的核心技术也开始以业务形态来对外输出。
笔者:腾讯之前以服务C端为主,和现在服务B端时有怎样的不同?
黄飞跃:从C到B端,技术本质上来说都是相通的,C端需要一种技术运营商的思维,要求对线上客户有实时的反馈和提高,而B端有较多都是线下场景,场景千差万别,复杂程度也会更高,同样是人脸识别技术,到了线下就涉及室内还是室外、白天还是傍晚等等,B端对技术和要求会更高一些,客户可能会更倾向于稳定性,而不是高频率的创新性。
B端考虑的问题也更多,比如有些客户对安全要求比较高,还有客户使用的是低端摄像头,获取的数据分辨力差一些,那我们的算法就要在安全性、便利性等方面得到平衡,使客户在不同的场合都能用起来。