滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

DeepSeek新论文引热议：原生稀疏注意力机制能否革新大语言模型？

时间：2025-02-19 11:51:36 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，科技界再度掀起波澜，一项名为“DeepSeek”的新研究迅速抢占微博热搜头名，引发广泛关注。

这一热潮的源头，源自DeepSeek团队最新提交的一篇论文，而更令人瞩目的是，该项目的创始人梁文锋亲自参与撰写，并亲自提交了这篇研究成果。

论文题为《原生稀疏注意力：硬件对齐和原生可训练的稀疏注意力》，其核心内容直指当前大语言模型面临的计算成本挑战，特别是长上下文建模的高昂代价。面对这一难题，论文提出了一种创新的解决方案——NSA（Native Sparse Attention），即原生可训练的稀疏注意力机制。

NSA通过结合算法创新与硬件优化，旨在实现高效的长上下文建模。它采用了一种动态分层稀疏策略，巧妙地将粗粒度的token压缩与细粒度的token选择相结合，从而在保证上下文意识的同时，也确保了局部精度。这一策略不仅提高了效率，更在保持模型能力方面展现出了巨大潜力。

论文中，DeepSeek团队详细阐述了NSA的两项关键创新。首先，他们通过算术强度平衡算法设计，以及对现代硬件实现的优化，实现了显著的计算加速。这一创新不仅提升了计算效率，更为大规模模型的训练和应用提供了有力支持。其次，NSA启用了端到端训练，这一举措使得在不牺牲模型性能的前提下，大幅减少了训练前的计算量。

实验结果显示，采用NSA预训练的模型在多个基准测试中表现优异，不仅保持了与全注意力模型相当的性能，甚至在长上下文任务和基于指令的推理中超越了后者。更令人振奋的是，NSA在解码、向前传播和向后传播过程中，对于64k长度序列的处理速度实现了对全注意力的大幅超越，这充分验证了其在整个模型生命周期中的高效性。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

全新Trident 660震撼上市：66900元，科技升级，配置爆表，乐趣无限！

02-20

OPPO Watch X2评测：运动健康全搞定，高端设计价格亲民！

02-20

徕卡Summilux-M 50 f/1.4镜头复刻归来，售价30800元，经典再现！

02-20

RTX 5070 Ti 显卡正式发售：货源紧张，价格普遍溢价

02-20

天工机器人：连续攀爬百级阶梯，雪地高速奔跑，具身智能再突破！

机器人前瞻2月17日报道，今天，国地共建具身智能机器人创新中心公布了最新具身智能小脑研发技术成果，升级后的天工机器人实现了基于视觉的感知行走，可实现无磕碰、不踩棱、不踏空地跨越连续上百级楼梯和35厘米大高差…

02-20

阿里云营收破300亿，AI驱动增长迅猛，未来三年云AI基建投入将超十年总和

02-20

轮胎更换指南：这些信号提示你该换胎了！

02-20

DF MAX-AGM启停电池新上市，以革新科技和服务，护航高端车主新旅程

02-20

钢琴热退潮：中产标配变闲置，万元钢琴难寻买家

02-20

阿里Q3财报亮眼，云与AI业务强劲增长，盘前股价飙升10%

02-20

私募热潮回归？1月备案私募证券产品超700，量化私募表现抢眼

02-20

影石Link 2C灵动白版上市：AI智能4K摄像头，售价878元起

02-20

B站春晚合作大获成功，日活用户数激增20%彰显全民内容承接力

02-20

iGame RTX 5070 Ti Advanced OC 16GB开箱：全新设计，炫彩光效抢眼！

02-20

影驰RTX 5070 Ti白金版显卡美图鉴赏：冷白色调诠释清新工业风

02-20

点击查看更多 +

全站最新

新本田雅阁到店！全新前脸霸气侧漏，尺寸逼近5米，你会心动吗？

DF MAX-AGM启停电池新上市，高端车型能源新选择！

全新Trident 660震撼上市：66900元，科技升级，配置爆表，乐趣无限！

豪华B级车新标杆！奥迪A5L荣获设计大奖，上海车展即将闪耀登场

比亚迪严惩“黑公关”，力促新能源汽车行业健康发展

大疆RS 4 Mini稳定器发布：轻量便携，售价1999元引关注

热门内容

本栏最新

全新Trident 660震撼上市：66900元，科技升级，配置爆表，乐趣无限！

OPPO Watch X2评测：运动健康全搞定，高端设计价格亲民！

徕卡Summilux-M 50 f/1.4镜头复刻归来，售价30800元，经典再现！

RTX 5070 Ti 显卡正式发售：货源紧张，价格普遍溢价

天工机器人：连续攀爬百级阶梯，雪地高速奔跑，具身智能再突破！

阿里云营收破300亿，AI驱动增长迅猛，未来三年云AI基建投入将超十年总和

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.