滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

月之暗面与DeepSeek论文“撞车”，国产大模型稀疏注意力技术竞赛升温

时间：2025-02-19 15:48:00 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在人工智能领域，一场围绕大模型技术的开源竞赛正愈演愈烈。就在DeepSeek发布其最新的稀疏注意力框架NSA论文后不久，另一支备受瞩目的大模型团队“月之暗面Kimi”也迅速跟进，公布了名为MoBA的论文，同样聚焦于提升大模型在处理超长序列任务时的效率和性能。

据悉，MoBA框架旨在通过实现高效、动态的注意力选择，来解决长文本处理中的效率难题。与NSA类似，MoBA也是一个稀疏注意力框架，但其最大上下文长度可扩展至惊人的10M，远超NSA的64k限制。这一突破性的进展，无疑为长文本处理任务提供了更为强大的工具。

MoBA还借鉴了MoE中细粒度划分的思想，通过增加块的数量和减小块的大小，模型能够更精准地捕捉局部信息，同时减少不必要的计算。这一设计使得MoBA能够在保持与全注意力机制相当效果的同时，显著提升计算效率。

实验结果表明，MoBA在处理长达100万tokens的序列时，其速度比全注意力架构快6.5倍；在扩展到1000万tokens时，与标准Flash Attention相比，MoBA的计算时间实现了16倍的加速比。这一显著的优势，使得MoBA在处理极长序列任务时具有极高的性价比。

MoBA框架还具备高度的灵活性和兼容性。它能够在全注意力和稀疏注意力模式之间无缝切换，从而最大化与现有预训练模型的兼容性。这一特性使得MoBA能够轻松融入现有的AI系统中，为开发者提供更为便捷和高效的解决方案。

除了MoBA框架的发布外，月之暗面团队还面向开发者推出了一款最新的模型——Kimi Latest。这款模型旨在弥合Kimi智能助手和开放平台之间模型的差异，为开发者提供更为稳定和高效的AI解决方案。Kimi Latest模型支持自动上下文缓存，缓存命中的Tokens费用仅为1元/百万tokens，大大降低了开发者的使用成本。

随着DeepSeek、月之暗面等国内大模型团队的纷纷开源和技术分享，一场围绕大模型技术的开源军备竞赛正愈演愈烈。这不仅有助于推动AI技术的快速发展和应用落地，也为开发者提供了更为丰富和多样的选择。在这场竞赛中，月之暗面团队凭借其创新的MoBA框架和Kimi Latest模型，无疑成为了备受瞩目的焦点之一。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

美团新动向：无人机与AI并进，引领消费科技新浪潮

三言科技2月21日消息，今日，美团宣布，将继续加强在无人机、人工智能等前沿科技领域的自主创新，以推动新型消费场景的拓展和新质生产力的培育。截至2024年底，美团无人机已开通53条航线，累计配送订单超45万单…

02-21

黄仁勋澄清DeepSeek误解：AI后处理仍需大算力，预训练非全部

三言科技2月21日消息，日前，英伟达CEO黄仁勋在一场活动中首次回应了DeepSeek，他表示投资者对 DeepSeek在人工智能领域取得的进展存在误解，这导致了市场对英伟达股票的错误反应。 DeepSee…

02-21

AI加持的成人娃娃，能否成为你的赛博女友？

02-21

DeepSeek：小公司大动作，一周内将开源5大代码库引发热议

02-21

Meta辩称：下载盗版资料未分享即合法，AI训练素材争议何解？

02-21

阿里2025：AI引领翻身仗，电商与即时零售能否乘势而上？

02-21

AI推理亿次，中国最宜居城市花落珠海香洲区？

02-21

《和平精英》牵手DeepSeek，数字代言人“吉莉”将拥有人工智能

三言科技2月21日，今日，腾讯旗下战术竞技手游《和平精英》宣布，将接入 DeepSeek，为数字代言人 " 吉莉 "注入人工智能。根据计划，2 月 25 日将开启灰度测试，并在短期内面向全量用户开放。《和平…

02-21

阿里B2B跨境电商强劲增长，国际站七年GMV飙升25倍引领新潮流

02-21

具身智能新纪元：AgiBot World引领百万真机数据集探索

02-21

京东外卖0佣金入局，能否成为餐饮行业的破冰之旅？

毫无疑问，对美团和饿了么来说，京东外卖是搅局者，双寡头长期占据外卖市场90%以上份额，京东这样的实力玩家入局，或将重塑行业格局。她认为京东的入局对行业来说肯定是一件好事，能让平台之间互相制衡下，让平台多给…

02-21

恒生季检新动向：腾讯音乐、地平线机器人加入恒生科技指数

02-21

《和平精英》手游牵手DeepSeek，数字代言人“吉莉”将获AI加持！

02-21

DeepSeek大模型如何重塑AI Agent行业生态与竞争格局？

微盟基于DeepSeek推出了面向零售行业的导购Agent产品“导购任务AI+”，阅文集团作家助手接入DeepSeek模型辅助写作，万兴科技为其视频、图片和文档生成软件接入DeepSeek模型提升创意制作能力…

02-21

阿里云Q3业绩飙升，吴泳铭宣布未来三年史上最大资本支出计划！

可以说阿里云已经初步渡过了大模型时代的筑底期，比较难得的是，阿里云在保证营收盘的时候还兼顾了利润盘，虽然利润不多，但总归是有一些，这也与集团方面的兜底有关。目前仍然是AI技术发展的极早期，大模型的能力还在…

02-21

点击查看更多 +

全站最新

2025年1月轻卡销量盘点：福田稳居榜首，重汽跃升，东风江铃名次下滑

奔驰坚守大排量！V8、V12继续轰鸣，中国市场特推1.5T混动

悍途PHEV插电混动皮卡来袭，霸气外观配双电机四驱，油耗仅1.6L！

《传奇世界无双》归来！万元豪礼相送，创新玩法再燃青春热血！

《三角洲行动》DLC“黑鹰坠落”上线，GTX1060起，你准备好挑战了吗？

互动影游2025：大浪淘沙后，谁能成为下一个“完蛋！”？

热门内容

本栏最新

DeepSeek：小公司大动作，一周内将开源5大代码库引发热议

AI推理亿次，中国最宜居城市花落珠海香洲区？

具身智能新纪元：AgiBot World引领百万真机数据集探索

恒生季检新动向：腾讯音乐、地平线机器人加入恒生科技指数

《和平精英》手游牵手DeepSeek，数字代言人“吉莉”将获AI加持！

DeepSeek大模型如何重塑AI Agent行业生态与竞争格局？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.