CCR2017在沪召开搜狗COO茹立云：AI推动五项核心图像技术取得突破

时间：2017-10-18 10:14:36 来源：互联网编辑：星辉 发表评论无障碍通道

10月12-15日，中华医学会第24次全国放射学学术大会(CCR 2017)在上海世博中心拉开帷幕，聚集了国内外一流的专家学者及业内人士共6000余人，集中展示和交流了中国影像医学的历史传承与跨越式发展。搜狗公司COO茹立云受邀出席此次大会，以“人工智能在图像领域的进展”为题，分享了人工智能推动图像技术取得的五项重大突破，并指出人工智能技术在医疗领域应用前景广阔，未来将能发挥更大作用。

(搜狗公司COO茹立云出席CCR2017并发表主题演讲)

随着移动互联网及社交网络的发展，图片成为主要的信息载体，在这种情况下，计算机的图像识别技术就显得尤为重要。茹立云介绍，21世纪初，图像的检索基本上是由人工去定义特征，在机器上做简单的匹配。人工智能技术的发展，让机器对图像中内容的理解能力实现了全面提升。具体而言，面对一张图片时，机器会最先判断“图像里有什么”，精准识别图像中的内容;其次判断“图像中物体在哪儿”，以精准定位物体的位置;最后会对“图像内容表达什么”进行智能语义分析。

“机器对图像理解能力的提升，则直接推动了OCR文字识别、识图搜索、人脸识别、图文翻译、图像生成这五大图像技术的突破。其中，前三项技术主要用于解决‘图像里有什么’和‘图像中物体在哪儿’的问题，后两项则对应解决‘图像内容表达什么’的问题。”茹立云指出，并一一介绍了这五大技术突破的具体发展情况。

在文字识别方面，其目标是检测并识别图像中的文字。“传统文字检测方法步骤繁琐、人工设计流程多，且无法应对复杂背景和低质量文字。现有技术体现了深度学习模型的端到端的特点，减少了中间环节，从而能降低识别错误率。图片中的文字无论是印刷体、手写体或者夹杂在复杂背景中，都能被机器准确读出来。”茹立云还以搜狗翻译APP最新推出的“菜单翻译”功能为例，展示了文字识别技术的具体应用。这项功能基于搜狗领先的图像识别技术，对于用户从任意角度扫描的中英文菜单，均可准确识别，并在原菜单的对应位置标识出相应的翻译结果。

(图：“菜单翻译”功能翻译前后对比截图)

识图搜索则旨在解决图像分类、查找相同图、相似图等问题。茹立云表示，当前的识图搜索技术，以深度学习算法替代了人工设计，有效提升了相同图和相似图搜索结果的质量。“如搜狗图片的拍照购物功能，用户只需将喜欢的衣服拍照上传，或者从手机里上传相关照片，系统即可对上传照片进行快速处理，并与数据库中上亿张商品图片进行高速比对，为用户找到相同和相近的商品。再如搜狗图片的‘识狗’、‘识花’功能，用户只需上传相关照片，即可直接识别出狗或者花的种类。”茹立云举例说。

人脸识别方面，他指出，在深度学习以及大数据的驱动下，人工智能在人脸识别的某些方面已远超人类的识别能力。并且，人脸识别的实际应用场景也已日趋成熟，已经越来越多地应用到了机场安检、人流监控、疑犯查找、身份认证等场景下。例如商店的监控器，就可以利用人脸识别技术，对经常出入店铺的熟客进行针对性营销，将能更好提升销量。

图文翻译技术，其目的是使机器准确理解图像背后的语义。“传统的图像识别技术，只能粗略识别出图像中的基本内容，如图像中有一个人。而人工智能支持下的图文翻译技术，不仅能告诉你图片中有一个人，还能分辨出这个人的性别、他手上拿的东西、他周围有什么物体等更细致的内容。”茹立云说，这项技术的突破，也能给人带来极大便利，例如盲人朋友以前只能通过声音或者文字转化成的声音来获取信息，现在还能把图片信息转化成的声音，让他更好了解视觉化的世界。

而人工智能技术发展到更高阶段，则是图像生成技术，目前这一技术也已被广泛应用到了人脸合成、图像修复、风格迁移等方面。“例如图像修复方面，AI能通过深度学习，将带马赛克或者画面遮挡的图片修复成完整图片，再如黑白照片上色变成彩色照片，等等。”茹立云举例说。

回到大会核心话题——影像医学领域，茹立云指出，未来图像AI在医疗领域的应用前景将会非常广阔，主要包括三方面：首先是辅助诊断，人工智能可以学习更多医学影像方面的数据，进一步辅助医生诊断决策;其次是疗效评估，对于肿瘤等重大疾病，可依据AI大数据分析，在治疗前判断治疗方案对患者的疗效;再次是预后预测，科学预测患者生存期，提取患者特征，建立模型，定量分析，给出预后预测。

10 月 31 日消息，科技媒体 Android Headline 昨日（10 月 30 日）发布博文，展示了 One UI 7系统的诸多新功能 / 新特性，涵盖了新版图标、智能通知管理、作业帮助、家长控制…

同时，在中国三星多产融合模式和可持续发展理念的启发下，杨维娜等创领者不仅利用废弃青柿子打造了现代化柿子漆生产线，还研发出了一系列柿子深加工产品，并致力于柿染文化的传承，从而带动了富平整体文旅产业生态的提升，为…

截至2024年8月31日，滔搏全国门店直播账号数量突破300个，公司在抖音平台的直播销售额跻身平台运动户外榜第一。目前，双方已经携手开启了美国百年经典运动品牌Mitchell& Ness在国内的运营，在香港…

案例中的Imrich Molnár利用Mole3D扫描仪+3D打印机为朋友制作手臂康复辅具，相较于传统的依赖医生个人经验和手工制作的方式，其一，辅具精度更高、更贴合患者手臂，舒适度也更好;其二，手臂康复辅具…

基于先进的材料技术和三十多年的车灯防水透气应用经验，戈尔公司(W.L.GoreAssociates)向业界发布《车灯凝露解决方案白皮书》。该白皮书深入分析了车灯凝露现象的成因，并提出了应对汽车电动化和智能化趋势下的车灯凝露管理解决方案，以助力行业应对新挑战，推动汽车照明

作为Hi MateBook 系列新品，Hi MateBook 14与Hi MateBook D 16 通过差异化定位，满足了用户对于移动办公和高效办公的个性化需求，同时，也彰显了该系列杰出的共性，在信号、跨…

近日，第12届百度奖学金正式启动申报。百度奖学金面向全球范围内计算机领域的优秀华人学生进行评选，10位获奖者每人将获得可自由支配的20万元人民币奖学金。在全球人工智能技术快速发展的背景下，AI已经成为推动经济创新与社会进步的关键因素。随着国际间在AI领域的竞争

随着AI浪潮的到来，钉钉在产品与服务中融入了AI技术，通过打造AI PaaS平台，将技术与场景深度融合，丰富交互对象与形式，提升企业工作效率。此次获奖，不仅是对钉钉内部团队数字化、智能化管理实践价值的肯定，…

这种特性极大地简化了物联网开发的复杂性，让开发者能够更加专注于应用场景和功能的创新。活动现场还举行了华为云物联网开发者认证的考试，充分激发同学们的学习热情，认证课程学习与考试不仅提升了他们的专业技能，也为未来…

相较于同业公司，公司的主要优势有：（1）网络可视化的技术积累和场景经验；（2）和上游CPU和GPU芯片厂商的深度合作基础；（3）具备高性能和国产化算力集群的交付、组网、调优经验，模型代训能力。分析指出，恒为…

快科技10月31日消息，据媒体报道，近日有多名消费者在黑猫投诉、小红书等平台反馈称，在李佳琦直播间花200多元抢原价599元的正品耐克鞋，到手后发现了溢胶、开线、线头多等诸多瑕疵。大量消费者表示，自己在李佳…

快科技10月31日消息，博主数码闲聊站爆料，联发科天玑84000基于台积电4nm制程打造，首发Cortex-A725全大核架构，安兔兔跑分在170万-180万之间，作为对比，骁龙8 Gen2跑分在160万左右…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.

CCR2017在沪召开 搜狗COO茹立云：AI推动五项核心图像技术取得突破

CCR2017在沪召开搜狗COO茹立云：AI推动五项核心图像技术取得突破