金山AI Lab获 2019国际大数据分析竞赛双料冠军

时间：2019-11-01 13:51:48 来源：中国企业报道编辑：星辉 发表评论无障碍通道

近日，金山AI Lab获得了计算机视觉界的顶级竞赛之一MS COCO Image Captioning以及IEEE特别发起的国际大数据分析竞赛(IEEE ISI World Cup 2019)双料冠军。

两大顶级赛事竞争激烈

MS COCO(Microsoft Common Objects in Context，常见物体图像识别)是计算机视觉领域最受关注和最权威的比赛之一，是图像(物体)识别方向最重要的标杆，也是目前国际领域唯一能够汇集谷歌、微软、Facebook 三大巨头以及国际顶尖院校共同参与的大赛。目前MS COCO 竞赛，共有物体检测 (Detection)、人体关键点检测 (Keypoints)、图像分割 (Stuff)、全景分割(Panoptic)和图像描述生成 (Captions) 五个类别的比赛任务，其中图像描述生成任务 (Captions)需要同时对图像与文本进行深度的理解与融合，相比其他任务更具有挑战性。包括腾讯、华为、Microsoft、中科院自动化所、北京大学、中国科学技术大学、UC Berkeley、Stanford University等企业、科研机构和高校，迄今共有 200 多支队伍参与了这项比赛。

而由IEEE(IEEE ISI安全信息学领域的旗舰会议)，特别发起的国际大数据分析竞赛(IEEE ISI World Cup 2019)同样竞争激烈，有来自中国、美国、巴基斯坦、英国、德国等7个国家的企业、高校共363支队伍，1001名选手参战。

金山AI Lab在图像描述、大数据分析两大领域表现不俗

金山AI Lab在大数据人工智能飞速发展的背景下成立。目前，金山AI Lab以NLP为核心，涵盖图像、文本、语音三大方向，主要研究内容分为知识图谱、机器翻译、内容推荐和智能校对等。研究项目主要分为两类，一类是专注于落地的项目，如机器翻译、智能校对等;另一类是专注于基础服务的项目，例如知识图谱，可以对这些直接落地的项目提供长期的辅助研究。这两项比赛取得的成功很好地证明了金山AI Lab在图像及大数据分析方面的实力。

MS COCO比赛中，金山AI Lab团队参与了挑战性最大的图像描述生成任务 (Captions)项目。图像描述生成(image caption)是使机器理解图像内容，并用人类语言描述其所理解的图像内容。图像描述生成(image caption)技术是一个结合计算机视觉与 NLP技术的多模态交叉研究领域，这个任务不仅仅需要理解图像，更需要理解自然语言，是深度学习处理多模态数据的一个重要任务。

金山AI Lab团队使用目前流行的Transformer模型，并针对图像信息利用不充分的问题提出了结合图像关键信息的keywords Transformer、利用动态卷积结构改进Transformer的解码端、提出了有效的多特征融合机制和多模型系统融合等技术，使生成的图像描述更准确、相关性更高、句子更流畅。结合WPS在办公场景下的优势，前述技术可以在公式识别、图像描述、图像检索等场景大显身手。

总体流程

#FormatImgID_3#

keywords transformer模型

Keywords_MIA Transformer模型

在ISI World Cup竞赛中，金山AI Lab派出两支团队分别参加两个任务，一支队伍在M2中以44分夺得冠军，分数比其他队伍高了接近一倍，达到了参赛队伍中的领先水平，可以在生产环境中直接应用，解决企业痛点。在M2上面，金山AI Lab使用了递进优化的策略，对数据进行多层次的分类，避免了数据分布因极度不均衡而带来的训练失效问题。另一支队伍在M1中取得第五名。

在X100S、X200系列上，vivo通过AI大模型对超过十亿的物体数据学习，再结合AI多帧高像素算法，实现了远景画面的高清拍摄；OPPOFind X8系列更是直接宣传搭载了AI千里长焦，在20倍-120倍…

恰好，雷科技手上这台小米15是首批搭载HyperOS2.0的产品，在这几天的体验中，小雷也感受到了小米对于手机操作系统的一些新构思和小心机，以及对于手机未来的探索和思考。曾在操作UI上吃过亏的小米显然明…

这不仅极大提升了小笨智能SLAM &机器人领域的智能化水平和服务效率，还将助力我们快速拓展市场边界，为客户提供更加高效、灵活、可靠的智慧服务解决方案，引领行业迈向新的发展阶段。未来，小笨智能将继续在工业智…

为深入贯彻党中央、国务院关于推进新型工业化、支持制造业企业及中小企业数字化转型的系列决策部署，落实《上海市制造业数字化转型实施方案》的任务要求，加快推进企业数字化转型，上海市经信委开展了2024年度上海市重点…

财报提及，三季度Meta元宇宙业务营业亏损44亿美元，而Meta还计划加大在AI上的投资，预计2025年资本支出将显著增加。Meta CFO表示，现实实验室在2024年运营亏损还将显著增长，原因是公司持续的产…

他认为，人工智能赋能科研工作有三个台阶，一是借助科研文献助手和代码助手提升基础工作效率，二是基于深度神经网络对科学任务进行精准建模，三是借助认知大模型学习领域知识并辅助设计科研实验方案。在今年的科大讯飞全球…

2024年10月30日，豆神教育在北京举行豆神辞源大模型“名师超拟人，AI新时代”产品发布会，推出自主研发的端模一体教育产品——豆神AI，将客户端与大语言模型深度结合。与之类似，智谱华章有优秀的大模型开发及…

该合作将以联合研究阿拉伯语模型以及沙特特定的人工智能应用为特色，目前有待获得监管机构的批准。新的投资建立在谷歌云在沙特阿拉伯的现有业务基础上，其中包括去年启动的达曼云区域，该区域是谷歌云目前全球40个区域…

微软在周三提交给美国证券交易委员会的文件中写道：我们对 OpenAI Global,LLC（简称OpenAI）进行了投资，并已承诺投资总额为 130 亿美元。在之前提交给美国证券交易委员会的文件中，微…

10 月 31日消息，据《科创板日报》今日消息，荣耀股改引入新一轮投资者，中国电信、中金资本旗下基金、基石旗下基金、特发基金，以及新一轮代理商投资平台（金石星耀）等机构加入。对于此轮融资，荣耀称…

只有形成智算云产业的自循环，中国云谷的建设才有意义。在《机器中的达尔文》一文中，塞缪尔·巴特勒提出了“机械王国”的理论：技术进化与生物进化的过程将多方面重合，但不会像生物进化漫长而平静，而是带有激烈且革命性的色彩。他不吝词藻描绘道：“如今机器被用来生

近日，腾讯音乐娱乐集团（Tencent Music Entertainment Group，简称 “TME”）与中兴通讯近日达成了一项具有重大意义的战略合作，这次的战略合作不仅包含音乐产品合作，也将在音乐AI…

作为 NVIDIA Compute (GPU)、Networking (网络)的双 Elite 精英级合作伙伴,超擎数智在 NVIDIA中国开发者之夜现场展示了擎天系列AI服务器、NVIDIA Quant…

财报显示，按照美国通用会计准则(GAAP)计算，微软第一财季总营收为655.85亿美元，较上年同期的565.17亿美元增长16%，按固定汇率计算同比增长16%；净利润为246.67亿美元，较上年同期的222.…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.