滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

摩尔线程新突破：Round Attention让AI对话更流畅，显存节省高达82％

时间：2025-03-04 20:15:06 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

摩尔线程科研团队近期公布了一项创新研究成果，名为《Round Attention：利用轮次块稀疏性革新多轮对话优化路径》。这一突破性进展使得推理引擎的端到端延迟显著低于当前主流的Flash Attention，同时在键值缓存（kv-cache）显存占用上实现了最高82%的节省。

随着AI大型语言模型的快速发展，语言模型服务在日常问题解决任务中的应用日益广泛。然而，长时间的用户交互带来了两大挑战：一是上下文长度的急剧增加导致自注意力机制的计算开销剧增，因其复杂度与长度的平方成正比；二是键值缓存技术虽然在一定程度上缓解了冗余计算问题，但随之而来的GPU内存需求激增，限制了推理批处理的规模，降低了GPU的利用率。

为了应对这些挑战，摩尔线程提出了Round Attention机制。该机制的核心在于以轮次为单位分析Attention规律，专为多轮对话场景设计。通过对轮次粒度的Attention分布进行深入研究，摩尔线程发现了两个重要规律，这些规律为优化提供了理论基础。

基于这些发现，摩尔线程进一步设计了Round Attention推理流水线。这一流水线将稀疏性从传统的Token级提升到了块级，通过选取最相关的块参与Attention计算，显著减少了计算耗时。同时，将不相关的块卸载到CPU内存，从而有效节省了显存占用。这一策略在保持推理精度的前提下，显著提升了推理效率并降低了资源消耗。

摩尔线程指出，轮次块稀疏性具有三大显著优势：首先，以轮次为自然边界的划分保证了语义的完整性；其次，在分水岭层实现了注意力的稳定性；最后，在端到端层面实现了存储与传输的优化。这些优势共同促成了Round Attention的高效表现。

实验结果显示，与主流的Flash Attention推理引擎相比，Round Attention在端到端延迟方面表现出色，同时在kv-cache显存占用上节省了55%至82%。在主观评测和客观评测的两个数据集上，模型推理准确率基本保持不变，验证了Round Attention的有效性和实用性。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

京东上新！三星堆、故宫等国宝文创文具，你想要的这里都有

03-04

算能科技发布SRA3-40：RISC-V众核服务器新标杆，首搭DeepSeek技术

03-04

良品铺子创始人杨银芬辞任董事长，程虹接力，公司未来何去何从？

根据最新公告，杨银芬先生因个人原因提交了书面辞职报告，辞去了他所担任的公司董事长、总经理以及董事会战略与发展委员会委员的职务。2023年年报显示，杨银芬当年从公司获取的报酬为207.13万元。此外，程虹还是…

03-04

2025年电商新风向：东方甄选等玩家能否借鉴胖东来模式逆袭？

去年一年的价格战让各大电商平台元气大伤，东方甄选这类企业也在吃尽直播带货红利后，陷入暂时的迷茫，线上也要接受胖东来的“爆改”吗？例如，永辉2024年前三季度财报披露数据显示，线上占比超两成；高鑫零售2024…

03-04

万辰集团董事长被查，好想来量贩零食业务能否稳住局面？

这之后，万辰集团也被称为“量贩零食第一股”，量贩零食就成了万辰的中流砥柱，营收占比如今超过了90%。长期来看，万辰集团还需要在治理优化、成本控制及品牌差异化上进一步突破，否则行业地位将会被鸣鸣很忙等对手进一…

03-04

港股“雪王”上市狂欢，大消费板块财富密码何在？

从三个关键环节来看，一是在产业最上游，蜜雪冰城在全国建立产业基地，如四川安岳、重庆潼南的柠檬基地，同时其采购网络覆盖全球六大洲38国；二是在生产加工方面，蜜雪冰城2012年建立首家中央工厂，为中国现制饮品行…

03-04

马云再倡公益：十年坚持，是我们需要公益的深刻体现

三言科技 3月4日消息，据阿里阿巴巴公益，3月3日，马云再一次面向全体员工发出公益倡议。马云在倡议信中说，“公益三小时十年了，十年前，我们刚刚上市，在资本市场的喧器里，在阿里人一夜暴富的舆论中，静下心来，我…

03-04

女教练陆子颜：用温柔与智慧，解锁3000本驾照的“驾驶秘籍”

03-04

雪王登基：蜜雪冰城如何靠4元柠檬水成就千亿市值传奇？

03-04

Mueyeco目爱可：守护儿童视力与大脑发育的藏红花酸藻油新选择

03-04

京东眼镜生态仓上线，20余品牌共推24小时一站式配镜新体验！

03-04

华为Mate 70 Pro优享版3月5日开售，性能微降价格更亲民！

03-04

英伟达、博通测试英特尔18A制程，代工合作能否成真？

03-04

谷歌Play商店升级：力推小组件应用，开发者迎来新机遇

03-04

iPhone版谷歌Gemini大升级，锁屏小组件助力AI体验再飞跃

03-04

点击查看更多 +

全站最新

Nothing Phone（3a）系列发布：标准版379美元起，Pro版配置更升级！

燃油智驾新标杆！全新探岳L来袭，17.69万起能否再掀波澜？

小米武汉智能家电工厂年底投产，首款中央空调即将下线

小米SU7 Ultra车险破局，保费低于同价位燃油车引热议！

混动老将转型纯电，广本P7“止痛车”能否引领新能源新风潮？

王兴兴与宇树科技：非共识创业者的逆袭之路

热门内容

本栏最新

京东上新！三星堆、故宫等国宝文创文具，你想要的这里都有

雪王登基：蜜雪冰城如何靠4元柠檬水成就千亿市值传奇？

Mueyeco目爱可：守护儿童视力与大脑发育的藏红花酸藻油新选择

石狮校服展倒计时4天！全攻略助你逛展无忧，精彩活动抢先看！

新茶饮巨头蜜雪冰城上市，顺丰同城助力品牌全渠道即时配送布局

RTX 50系列性能未超40系，竟因放弃32位OpenCL支持？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.