滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

StreamingLLM框架亮相：突破文本长度限制

时间：2023-10-06 17:59:05 来源：ITBEAR编辑：茹茹 发表评论无障碍通道

【ITBEAR科技资讯】10月06日消息，麻省理工学院与meta AI的研究人员最近宣布他们成功开发了一项名为StreamingLLM的创新框架，该框架被认为能够解决大型语言模型面临的内存和泛化问题，使其能够轻松处理无限长度的文本内容。

这一研究的关键焦点在于克服实现高效流式语言模型(Efficient Streaming Language Models，ESLM)时所面临的障碍，尤其是在长时间多轮对话等场景下可能出现的问题。

据ITBEAR科技资讯了解，研究人员指出，构建流式语言模型主要面临两大挑战。解码阶段获取标记(token)的键(Key)和值(Value)状态会耗费大量内存。其次，现有的大型语言模型很难泛化到处理超出其训练序列长度的长文本。

过去的研究尝试解决这些挑战，例如扩展注意力窗口以处理长文本或建立一个固定大小的活动窗口，只关注最近的标记状态以维护内存使用和解码速度。然而，这些策略在处理超出缓存大小的序列时表现不佳。

StreamingLLM采用了一种名为"注意力下沉"的策略，通过观察到自回归语言模型中，某些标记会获得大量的注意力，即使它们在语义上并不重要，这些标记也会吸引模型的关注。这种策略确保了无论输入序列的长度如何，模型的注意力计算都能保持稳定。

StreamingLLM的重要贡献在于提供了一种简单而高效的解决方案，使语言模型能够处理无限长度的文本，而无需进行微调。这将有助于解决当前流式应用中语言模型面临的问题。虽然流式语言模型在未来将变得更加重要，但由于内存效率和长序列处理性能等方面的限制，相关模型的发展仍面临挑战。

据研究团队验证，StreamingLLM能够使Llama 2、MPT、Falcon和Pythia等模型可靠地处理长达400万个标记的文本，从而为流式语言模型的部署提供了更多可能性。这一创新有望推动自然语言处理领域的发展，并为各种应用场景带来更强大的语言模型支持。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

04-18

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

04-18

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

04-18

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

04-18

AI造游戏，路还长吗？

04-18

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

04-18

智平方AlphaBot 2升级亮相：DeepSeek技术赋能，开启通用智能新篇章

04-18

谷歌Gemini 2.5 Flash突破性发布：成本大幅降低，性能依旧强劲

04-18

关税风暴中，全球AI产业如何破局前行？

此外，由于对等关税大棒给全球经济体都造成了冲击，由此产生对美国技术生态体系的不信任，或许也是一个中国AI合纵连横的窗口期，来增强中国AI技术生态的韧性，比如，吸引海外开发者使用国产化AI框架、开发工具、AI…

04-18

银行业科技投入分化，大模型应用深度融入核心业务成亮点

对此，钛媒体App重点梳理了10家银行（包括国有六大行和招行、中信、平安、兴业4家股份行）财报，以此一窥国内头部银行的最新科技故事。总的来说，虽然智能客服、代码助手等已是普遍应用，但上述银行在专业领域的深…

04-18

讯飞双屏翻译机2.0新品发布：智能升级，让跨境沟通无界高效！

04-18

萝卜快跑海南布局再落一子，新公司注册资本达百万

04-18

AMD GPU大飞跃！Stable Diffusion模型性能提升最高达3.8倍

04-18

芯明慕尼黑电子展大放异彩：空间智能如何重塑人形机器人未来？

04-18

智谱连发三款开源模型，豪掷3亿支持全球AI开源社区，加速生态建设

智东西4月18日报道，今天，智谱总裁王绍兰向智东西等媒体详细介绍了智谱开源模型的最新进展，并宣布智谱Z基金出资3亿元，以支持全球范围内的AI开源社区发展，任何基于开源模型（不局限于智谱开源模型）的创业项目均…

04-18

点击查看更多 +

全站最新

中国皮卡新能源时代，山海炮Hi4-T引领“反向超越”

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

哈弗二代枭龙MAX上市，智能四驱电混技术引领新风尚！

智界R7/S7新版本亮相，鸿蒙智行品牌之夜展现智能出行新魅力

2025款小鹏X9全球旗舰上市，智能舒适大七座引领未来出行

《星球大战：Beyond Victory》混合现实体验登陆Meta Quest，星战迷准备好了吗？

热门内容

本栏最新

联想创新科技大会：揭秘AI新品，人形机器人或成数字生活新桥梁？

食博会·预博会和农博会东莞启幕，AI智慧农食展新风采！

测测达人携手FARMER BOB：春日治愈行动，让情绪找到回响

闪迪创作者系列全新上市，专业存储方案赋能内容创作者高效产出

AI造游戏，路还长吗？

智谱AI获多方青睐，北京基金再追投2亿助力开源生态建设

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.