滚动资讯

当前位置：首页 > 资讯 > 数字家电 > 正文内容

Cerebras AI芯片因DeepSeek服务需求激增，大语言模型推理成新热点

时间：2025-02-12 19:23:08 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

AI芯片巨头Cerebras近期遭遇了一场前所未有的挑战，其CEO Andrew Feldman在一次访谈中透露，公司正被大量运行DeepSeek-R1大语言模型的订单淹没。

Cerebras，这家以推出高性能AI晶圆级芯片著称的公司，其单块芯片便能提供惊人的125 PFLOPS峰值算力，并搭配高达1.2PB的内存容量，一直以来都是AI领域的佼佼者。然而，这次DeepSeek-R1的火爆需求，显然超出了他们的预期。

DeepSeek-R1，这款被视作AI领域分水岭的模型，其预训练成本仅为GPTo1等主流模型的十分之一，但效果却与之相近甚至更佳。Feldman表示，DeepSeek不仅在当前展现出了巨大影响力，更将推动更大规模AI系统的诞生。随着成本的降低，AI市场的潜力正在被不断挖掘。

在Cerebras的官方展示中，其晶圆级AI芯片在部署DeepSeek-R1 70B时，性能达到了1508 tokens/s，远超GPU。然而，这款模型在推理过程中，却需要消耗大量算力。由于采用了Chain-of-thought（CoT）方法增强推理能力，模型需要将多步问题分解为中间步骤，并在需要时执行额外计算。这种逐字推理的方式，对于整段提示词的推理需要多次进行，从而导致了算力的巨大需求。

面对这一痛点，Cerebras提出了利用蒸馏技术将大模型的“知识”转移到小模型中的解决方案。大模型被称为教师模型，而较小的模型则被称为学生模型。通过这种方式，客户可以在保持模型精度的同时，降低推理过程中的算力需求。

Cerebras在官网上表示，DeepSeek R1在蒸馏到Llama 70B后，精度几乎没有下降。为了改善用户体验，Cerebras为客户提供了一种标准做法：利用开源在Hugging Face上的DeepSeek模型参数作为教师模型，蒸馏出一个较小的学生模型用于实际部署。

Feldman强调，DeepSeek作为首个顶级的开源推理模型，是开源AI的重大胜利。通过蒸馏技术，开源模型只需公开模型参数，研究人员无需访问源码便能复制新AI模型的进步。他认为，DeepSeek的经济性不仅震撼了整个AI行业，更将吸引更多投资流向尖端AI芯片和网络技术。

尽管有些人担心计算成本的下降会导致市场萎缩，但Feldman指出，过去50年的历史表明，降低成本反而能够扩大市场容量。无论是电脑还是智能手机，价格的降低都推动了产品的普及。因此，他相信DeepSeek和Cerebras的推动将进一步加速AI市场的增长。

自去年8月开始提供公共推理服务以来，Cerebras自称是“世界上最快的人工智能推理服务提供商”。然而，面对高昂的405B模型成本，该公司目前主要提供的是蒸馏后的70B模型。Feldman表示，虽然有一部分客户愿意为更高的准确性支付更高的成本，但大多数客户更倾向于选择价格实惠的模型。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

海信百吋大屏电视全球夺冠，AI画质技术引领未来客厅新风尚

02-12

情人节特惠！华硕B860主板，打造双人游戏浪漫时光

02-12

RTX50系列游戏本预定在即！2月25日抢先体验高性能新选择

02-12

AI时代下的职业变迁：985硕士与县城标注员的双面人生

随着行业变化，越来越多像刘到闲一样的高学历年轻人选择成为AI训练师，但阿娟们的担忧是，数据标注工作的要求越来越高，她们会不会失去自己的工作。作为链条最末端的一线数据标注员，在阿娟的想象中，她应当也是像刘到闲…

02-12

腾讯海外维权成功！美法院判赔6.16亿，多部剧集获法定最高赔偿

02-12

2025国补大放送！华为苹果数码产品最高立减500元，速来抢！

02-12

华硕无畏14 AI版2025正式发售：骁龙X处理器，智能办公新体验仅需3199元

02-12

华硕灵耀14 Air骁龙版：960g超轻薄机身，开启AI移动办公新纪元

02-12

Vidda大屏新体验：DeepSeek深度思考智能体，让客厅更智慧！

02-12

英伟达RTX 50系列显卡故障频发，用户加价购买却遭遇蓝屏掉驱动难题

为了排查问题，该用户又将图像输出切换至CPU的核心显卡，进入系统后一切正常，此时他进入NVIDIA APP，从设置中依然可以看到系统识别出了新显卡，此时，其他包括游戏加加、GPU-Z等能够监控电脑硬件的软件中…

02-12

安卓磁吸生态崛起，能否打破苹果MagSafe封锁？

02-12

墨云藏境DDR5国风内存：双平台狂飙8000MT/s，兼容性与性能并驱？

02-12

国风韵味与高性能并存，神凝系列DDR5 6000 CL28内存深度评测

02-12

2025手机国补攻略：如何领取购新补贴，操作流程详解！

02-12

佰维X570 PRO天启4TB评测：PCIe5.0“满血”性能，存储新选择！

02-12

点击查看更多 +

全站最新

小鹏P7+引领春运新潮流，电车高速出行成新年味？

《黑神话：悟空》携手名创优品MINISO，共创IP联名新篇章！

RTX50系列游戏本预定在即！2月25日抢先体验高性能新选择

华为小米领跑！2025年1月苹果iPhone销量同比负增长跌至第五

任正非闭门交流，小鹏汽车何小鹏与众高管共话科技与治理

悦数科技：Graph RAG先行者，如何领跑向量与图数据库融合赛道？

热门内容

本栏最新

RTX50系列游戏本预定在即！2月25日抢先体验高性能新选择

腾讯海外维权成功！美法院判赔6.16亿，多部剧集获法定最高赔偿

2025国补大放送！华为苹果数码产品最高立减500元，速来抢！

华硕无畏14 AI版2025正式发售：骁龙X处理器，智能办公新体验仅需3199元

华硕灵耀14 Air骁龙版：960g超轻薄机身，开启AI移动办公新纪元

Vidda大屏新体验：DeepSeek深度思考智能体，让客厅更智慧！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.