滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

苹果英伟达合作开源ReDrafter，LLM推理速度飙升2.7倍！

时间：2024-12-19 08:07:17 来源：ITBEAR编辑：瑞雪 发表评论无障碍通道

苹果公司近期宣布与英伟达携手合作，共同推出了一项名为Recurrent Drafter（简称ReDrafter）的创新技术，这项技术旨在显著提升人工智能大语言模型（LLM）的推理速度。这一消息是在12月18日通过苹果公司的官方博文发布的。

据悉，ReDrafter技术已经成功融入英伟达的TensorRT-LLM推理加速框架中。这一整合使得在英伟达GPU上运行的LLM模型，每秒生成的tokens数量最高可提升2.7倍。这一显著的性能提升，不仅有效减少了用户在使用过程中的延迟感受，还大幅度降低了计算成本。

苹果公司的机器学习专家强调，随着LLM在生产应用程序中的广泛应用，提高推理效率已经成为降低计算成本和减少用户延迟的关键因素。ReDrafter技术的推出，正是对这一需求的积极响应。

ReDrafter的核心在于其独特的RNN草稿模型，该模型结合了波束搜索（beam search）和动态树注意力（dynamic tree attention）技术。这一创新设计使得开源模型在每一步生成过程中最多可以产生3.5个tokens，从而超越了以往推测性解码技术的性能表现。

为了将ReDrafter技术应用于实际生产环境，苹果公司与英伟达展开了深度合作。双方共同努力，将ReDrafter成功集成到英伟达的TensorRT-LLM框架中。这一合作不仅展现了苹果与英伟达在技术创新方面的深厚实力，也体现了双方在推动AI技术发展方面的共同愿景。

为了支持ReDrafter技术的集成，英伟达对其TensorRT-LLM框架进行了多项优化。这包括添加新的运算符以及公开现有运算符，以增强框架对复杂模型和解码方法的适应能力。这些优化措施为ReDrafter技术的顺利应用提供了有力保障。

基准测试结果显示，在使用集成了ReDrafter的TensorRT-LLM框架的英伟达GPU上，数百亿参数规模的生产模型的解码速度得到了显著提升，最高可达2.7倍。这一成果不仅显著降低了用户体验延迟，还减少了GPU的使用数量和功耗，从而进一步降低了运营成本。

这一合作成果的发布，标志着苹果与英伟达在AI技术领域的合作迈出了重要一步。未来，双方将继续携手共进，共同推动AI技术的创新与发展，为更多用户提供更加高效、智能的服务。

举报 0 收藏 0 打赏 0评论 0

三言科技12月19日消息，OpenAI为用户提供了一种与聊天机器人ChatGPT互动的新方式：1-800开头的号码。这家人工智能初创公司周三表示，在美国的用户可以拨打1-800-CHATGPT （1-800-…

12-19

一加13手机新升级：ColorOS 15.0.0.305带来通话摘要与水印新玩法

12-19

OpenAI新举措：ChatGPT热线电话登陆美国，语音交互时代来临？

12-19

51WORLD赴港上市路：数字孪生“造血”难，克隆地球梦何时圆？

12-19

2024年薪资揭秘：谁才是国内月薪之王，数字前端工程师登顶？

12-19

AI时代浪潮下，白领如何避免成为“被淘汰的员工”？

12-19

BOSS直聘三季报亮点：蓝领招聘崛起，市场信心逐步恢复

12-19

图森未来内讧升级：盈利之路、公司清算与控制权争夺战

12-19

OpenAI员工迎股票变现良机，软银斥资16亿收购，有人或错失4亿大单

知情人士称，根据OpenAI与软银集团达成的一项协议，OpenAI大约有400名现任和前任员工有望通过出售股票而进账数百万美元。软银集团将以要约收购的方式从OpenAI员工手中收购价值约16亿美元的股票。这项…

12-18

揭秘新质生产力！湖南“新质湖南”系列节目带你领略科技魅力

12-18

湖南新质生产力探秘：“新质湖南”系列节目带你走进科技前沿

12-18

OpenAI员工迎股票变现良机，软银16亿美金收购，有人或错失4亿

12-18

OpenAI员工喜迎数百万美元套现，软银大手笔回购股票

12-18

出门问问2024数字科技生态大会展风采，AIGC新品引爆全场

12-18

AMD X870E主板突破极限！192GB DDR5内存6400MHz C28时序惊艳亮相

12-18

点击查看更多 +

全站最新

ChatGPT新突破！手机用户可直接拨打免费电话与AI语音交流

真我新机将升级2K屏，能否超越红米一加成焦点？

索尼PS5与AMD深化合作，Amethyst项目助力游戏图形技术革新

单机小程序开发之旅：我的实战经验与用户满意度提升秘籍

小米HA官方集成亮相，智能家居控制新体验引发热捧！

福田卡文汽车技术战略大揭秘，卡文乐福纯电动厢式车抢先看！

热门内容

本栏最新

苹果英伟达合作开源ReDrafter，LLM推理速度飙升2.7倍！

一加13手机新升级：ColorOS 15.0.0.305带来通话摘要与水印新玩法

51WORLD赴港上市路：数字孪生“造血”难，克隆地球梦何时圆？

揭秘新质生产力！湖南“新质湖南”系列节目带你领略科技魅力

湖南新质生产力探秘：“新质湖南”系列节目带你走进科技前沿

OpenAI员工喜迎数百万美元套现，软银大手笔回购股票

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.