国产大模型“闪电”追平GPT-4o，只用2000张GPU？

时间：2024-10-18 15:31:33 来源：ITBEAR作者：冯璃月编辑：瑞雪 发表评论无障碍通道

【ITBEAR】在AI大模型领域，一场关于预训练成本的较量正悄然上演。近期，国内知名大模型公司零一万物发布了其最新的预训练旗舰模型——Yi-Lightning，号称“闪电”，在国际权威榜单LMSYS上一举超越了OpenAI今年5月发布的GPT-4o和Anthropic的Claude 3.5 Sonnet，排名世界第六，中国第一。

这一成就标志着中国大模型在全球竞争中取得了突破性进展，零一万物紧随OpenAI、Google之后，跻身全球前三大模型企业行列。

Yi-Lightning不仅在性能上有所提升，其推理速度也实现了质的飞跃。相比上半年发布的Yi-Large，首包时间减少了一半，最高生成速度提升了近四成，堪称“极速”。同时，该模型的推理成本也大幅降低，每百万token仅需0.99元，接近行业最低价。

Yi-Lightning的出色表现得益于零一万物在多个维度上的扎实储备，包括芯片人才、推理人才、基础架构人才和算法人才等。这使得零一万物在面对大模型预训练的高门槛时，依然能够坚持“模基共建”的战略，不断推动模型性能的优化和推理成本的降低。

在LMSYS Chatbot Arena总榜上，Yi-Lightning的成绩同样出众。它超越了国内外多个优质模型，包括xAI发布的Grok-2-08-13、智谱发布的GLM-4-Plus等，在中文分榜上与世界第二名的模型并列。在多轮对话、数学能力、代码能力等多个分榜上，Yi-Lightning也取得了世界前列的优异成绩。

零一万物之所以能够在短时间内取得如此显著的进步，与其独特的混合专家模型架构（MoE）和一系列技术创新密不可分。例如，Yi-Lightning采用了混合注意力机制（Hybrid Attention），旨在平衡模型在处理长序列数据时的性能和计算资源消耗。同时，动态Top-P路由机制的引入也使得Yi-Lightning能够更加智能地适应各种任务需求，实现“极速推理”。

随着Yi-Lightning的发布，零一万物在AI大模型领域的应用探索也进一步扩展。其最新推出的AI 2.0数字人产品已接入Yi-Lightning，在零售和电商等场景中展现出强大的实时互动能力和话术生成能力。某酒旅企业在接入该数字人直播后，GMV较此前上升了170%。

Yi-Lightning的推出不仅彰显了中国在大模型领域的强大技术实力，也为中国大模型公司的发展提供了新的思路。即坚持“模型＋AI Infra＋应用”三位一体的全栈式布局，以国际领先的基座模型为基础，积极探索企业级解决方案，推动整个大模型行业形成健康的生态。

目前，Yi-Lightning已上线Yi大模型开放平台（https://platform.lingyiwanwu.com/），每百万token仅需0.99元，支持开发者与企业客户轻松实现SOTA大模型自由。这一举措无疑将进一步推动大模型技术的普及和应用。

零一万物的成功也引发了对中国大模型行业未来发展的深入思考。在算力受限的情况下，中国基座模型的研发能力如何追赶国外顶尖大模型？零一万物的实践表明，通过技术创新和全栈式布局，中国大模型公司有望在全球竞争中脱颖而出，打造新质生产力。

展望未来，随着大模型技术的不断发展和普及，其应用场景也将更加广泛。零一万物将继续坚持“模基共建”的战略，不断探索大模型在各个领域的应用潜力，为推动人工智能技术的发展和应用贡献自己的力量。

着眼于高端用户的智慧出行需求，全新GL8陆尊搭载全新一代VCS智能座舱，拥有EYEMAX30吋一体弧面6K屏、高通骁龙8155芯片以及5G通信技术等同级领先配备的加持，为用户带来沉浸式感官享受和精准流畅的交互…

这主要是受到人工智能（AI）开发需求激增的推动，Python 还被广泛应用于数据科学和开源项目的开发。报告指出，与生成式 AI相关的项目贡献量在过去一年中增长了 59%，AI 相关的公共项目的贡献量几乎比…

在大会上，声网发布了他们的RTE+AI能力全景图，在全景图中，声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AIAgent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度，清…

在X100S、X200系列上，vivo通过AI大模型对超过十亿的物体数据学习，再结合AI多帧高像素算法，实现了远景画面的高清拍摄；OPPOFind X8系列更是直接宣传搭载了AI千里长焦，在20倍-120倍…

恰好，雷科技手上这台小米15是首批搭载HyperOS2.0的产品，在这几天的体验中，小雷也感受到了小米对于手机操作系统的一些新构思和小心机，以及对于手机未来的探索和思考。曾在操作UI上吃过亏的小米显然明…

这不仅极大提升了小笨智能SLAM &机器人领域的智能化水平和服务效率，还将助力我们快速拓展市场边界，为客户提供更加高效、灵活、可靠的智慧服务解决方案，引领行业迈向新的发展阶段。未来，小笨智能将继续在工业智…

为深入贯彻党中央、国务院关于推进新型工业化、支持制造业企业及中小企业数字化转型的系列决策部署，落实《上海市制造业数字化转型实施方案》的任务要求，加快推进企业数字化转型，上海市经信委开展了2024年度上海市重点…

财报提及，三季度Meta元宇宙业务营业亏损44亿美元，而Meta还计划加大在AI上的投资，预计2025年资本支出将显著增加。Meta CFO表示，现实实验室在2024年运营亏损还将显著增长，原因是公司持续的产…

他认为，人工智能赋能科研工作有三个台阶，一是借助科研文献助手和代码助手提升基础工作效率，二是基于深度神经网络对科学任务进行精准建模，三是借助认知大模型学习领域知识并辅助设计科研实验方案。在今年的科大讯飞全球…

2024年10月30日，豆神教育在北京举行豆神辞源大模型“名师超拟人，AI新时代”产品发布会，推出自主研发的端模一体教育产品——豆神AI，将客户端与大语言模型深度结合。与之类似，智谱华章有优秀的大模型开发及…

该合作将以联合研究阿拉伯语模型以及沙特特定的人工智能应用为特色，目前有待获得监管机构的批准。新的投资建立在谷歌云在沙特阿拉伯的现有业务基础上，其中包括去年启动的达曼云区域，该区域是谷歌云目前全球40个区域…

微软在周三提交给美国证券交易委员会的文件中写道：我们对 OpenAI Global,LLC（简称OpenAI）进行了投资，并已承诺投资总额为 130 亿美元。在之前提交给美国证券交易委员会的文件中，微…

10 月 31日消息，据《科创板日报》今日消息，荣耀股改引入新一轮投资者，中国电信、中金资本旗下基金、基石旗下基金、特发基金，以及新一轮代理商投资平台（金石星耀）等机构加入。对于此轮融资，荣耀称…

只有形成智算云产业的自循环，中国云谷的建设才有意义。在《机器中的达尔文》一文中，塞缪尔·巴特勒提出了“机械王国”的理论：技术进化与生物进化的过程将多方面重合，但不会像生物进化漫长而平静，而是带有激烈且革命性的色彩。他不吝词藻描绘道：“如今机器被用来生

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.