滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

腾讯优图深度学习性能优化取得突破

时间：2015-05-29 14:34:02 来源：ITBEAR编辑：星辉 发表评论无障碍通道

腾讯旗下的图像技术团队—优图团队，近日在国际著名深度学习开源框架Cuda-Convnet2项目上做出了重要的代码提交，将其GPU训练性能提升50%之多，显示了腾讯在深度学习领域的又一重大进展及腾讯积极参与开源项目与业界共享技术研究进展的开放心态。

近年来，深度学习及相关领域已然成为最活跃的计算机研究领域之一，无论是学术界还是互联网科技巨头，均在此方向投入了巨大的研究资源。深度学习在计算机视觉、语音识别等领域均带来了巨大的、非常领先的研究成果。但由于其超级庞大的网络计算规模和海量的训练数据，深度学习的训练往往耗时巨大，已经成为深度学习目前研究和实践中一个巨大瓶颈。腾讯优图团队在GPU kernel层面做了大量底层优化工作，极大缓解了深度学习训练性能这个瓶颈。

优图团队的优化工作主要基于Alex Krizhevsky实现的CUDA-Convnet2框架。Alex Krizhevsky是深度学习领域非常有影响力的研究者之一，是著名的AlexNet模型的发明者。CUDA-Convnet2模型是一种支持多GPU并行运行的深度学习算法框架，是所有同类开源框架中性能最优秀的框架。

优图团队的深度学习系统在CUDA-Convnet2的基础上，实现了更为高效的GPU利用。测试结果表明(如图表1所示)，batchSize为32或64时，优化后的内核速度提升超过50%，这也弥补了之前CUDA-Convnet2在batchSize 32或64时的不足。batchSize为128时，内核速度有10%以上的提升，在对jpeg解码部分做优化后，整体性能提升也达到50%。

图表 1 优图优化前后的性能对比

之所以取得如此大的进展，是因为优图团队在精通GPU硬件架构和深度学习算法的基础上，采用了更加前沿的优化策略。优图团队的优化理念源自于当前的GPU计算主频已足够高，而数据访问速度跟不上运算速度，造成GPU的空转。其优化点主要包含如下几点：

1. 更大的共享内存带宽。现在的GPU都具有高达64~128 bit的共享内存带宽，且共享内存具有访问速度快等特点。为了充分利用共享内存的硬件性能，优图团队采用矢量化的数据类型来匹配更大的内存带宽，使得数据的访问速度呈倍数增加，极大提升了数据的传输速度;

2. 巧妙的数据拓扑结构和精心组织的访问指令顺序。由于大部分GPU都支持并发访问的特性，为了进一步提升内存访问速度，优图团队巧妙的排列数据拓扑结构和数据访问指令顺序。众所周知，页面冲突是内存并发访问的最大的难题，因此，通过巧妙的排列数据结构可以最大程度减少页面冲突，提升并发访问的几率。同时在充分利用指令集的并发流水线基础上，优化数据的访问指令顺序，提升指令间并行度，也可以大幅提升数据访问速度;

3. 高效的数据传输粒度。由于GPU程序分为运算和数据访问两个部分，当数据访问速度跟不上GPU的运算速度时，为了最大程度利用GPU性能，应尽量避免GPU的运算部分或数据访问部分处于长期空转的状态，因此必须优化数据的访问粒度。将过大的数据访问粒度切割成若干个小的访问粒度，合适插入到GPU的运算周期中。

腾讯优图团队长期致力于各种图像技术和深度学习方向的研究和应用。在人脸检测和人脸识别，图像美化和人像美容等方向上均有深厚的积累并取得了业内领先的成果。此次深度学习性能优化的重要进展和开源贡献相信能够为业界在深度学习的研究上提供非常有益的帮助。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

前程无忧2025人力资源管理杰出奖颁奖盛典暨高峰论坛在厦门盛大启幕

4月18日以“人才向上、共筑未来”为主题的2025人力资源管理杰出奖颁奖盛典暨高峰论坛在厦门香格里拉酒店隆重举行。本届活动汇聚了全国近200家获奖企业代表和人力资源行业专家，共同探讨智能时代下人才战略的变革与创新，见证杰出雇主荣耀时刻。作为国内人力资源领域最具

04-18

阿斯麦：中国市场芯片设备需求超预期，美设厂计划暂无

04-18

王倩解读：动力电池安全新国标，如何为绿色出行筑起安全防线？

04-18

河北储备粮管理公司正式成立，注册资本高达3.8亿元！

04-18

黄金牛市下，赤峰黄金何以领跑A股金企？

2022-2024年，央行购金连续三年购金超1000吨，占总需求量20%以上，对金价的影响更大了。本轮黄金股显著落后金价涨幅，于今年初才开始启动大周期，主升浪确认源于赤峰黄金、招金矿业为首的龙头在4月11日…

04-18

湖北黄冈5.44亿液晶产业投资基金正式启动！

04-18

天翼云HBlock：教育考试院存储架构革新，数据存储痛点迎刃而解！

04-18

慧算账十年磨一剑，AI引领财税服务智能升级新航程

04-18

REDMI Turbo 4 Pro下周来袭！搭载骁龙8s，直面2.5K档竞品

04-18

小天鹅技术创新引领品牌飞跃，荣获三项行业大奖彰显实力

04-18

木星遭“氨冰雹”暴雨袭击，或改写气态行星研究篇章

04-18

霸王茶姬创始人商业布局揭秘：名下竟关联16家企业！

04-18

恒安集团创始人许连捷离世，留下生活用纸龙头与超十亿公益捐赠

04-18

关注公众号免费领取AI资料

内容是ITBEAR官方公益提供，没有任何套路，不收取任何费用！！！关注以上公众号，回复数字1，免费领取！（非微信打开，可先截图，然后在微信扫一扫里，选择相册里的截图扫码）以下是部分内容截图，内容持续更新AI已经是职场人的必备技能，不懂AI的人，会逐步被社会淘汰

04-18

安卓16新变化：勿扰模式快捷开关重磅回归！

04-18

点击查看更多 +

全站最新

怀旧风来袭！Windows 95“画图”挂镜售价2880元，你会买吗？

2025款帕萨特插电混动版来袭，豪华外观配亲民价，动力如何？

马自达EZ-60内饰大改，智能化与科技化并进，增程SUV来袭！

努比亚Z70S Ultra摄影师版来袭：复古相机设计，真全面屏引领潮流！

OPPO Find X8 Ultra升级新版本，凝光影像与跨端互联功能来袭！

问界新M7牧野青配色登场，科技与色彩碰撞豪华新境界

热门内容

本栏最新

王倩解读：动力电池安全新国标，如何为绿色出行筑起安全防线？

河北储备粮管理公司正式成立，注册资本高达3.8亿元！

黄金牛市下，赤峰黄金何以领跑A股金企？

湖北黄冈5.44亿液晶产业投资基金正式启动！

REDMI Turbo 4 Pro下周来袭！搭载骁龙8s，直面2.5K档竞品

小天鹅技术创新引领品牌飞跃，荣获三项行业大奖彰显实力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.