ITBear旗下自媒体矩阵:

蚂蚁集团AI新突破:低成本训练大模型,Ling系列开源引领科技竞争

   时间:2025-03-24 12:49:51 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在AI算力优化的浪潮中,蚂蚁集团正逐步崭露头角,凭借其在AI技术领域的全面发力,实现了基于中国AI芯片的模型技术突破。这一突破不仅引起了业界的广泛关注,还标志着蚂蚁集团在AI科技竞争中迈出了重要一步。

据最新消息,蚂蚁集团CTO兼平台技术事业群总裁何征宇领导的Ling Team团队,成功开发了两个名为Ling-Lite和Ling-Plus的百灵系列开源MoE模型。Ling-Lite的参数规模达到了168亿,而Ling-Plus的基座模型参数规模更是高达2900亿。尽管与AI行业中预估的GPT-4.5的1.8万亿参数和DeepSeek-R1的6710亿参数相比仍有差距,但蚂蚁团队在预训练阶段使用了较低规格的硬件系统,成功将计算成本降低了约20%,达到了508万元人民币,同时实现了与阿里通义Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相当的性能。

这一技术成果不仅体现在模型参数和计算成本上,更在于蚂蚁团队在AI Infra技术上的创新。他们构建了一个约9万亿token的高质量语料库,并采用创新的MoE架构,通过多阶段训练和优化策略,提高了训练效率。在AI异构计算平台上,蚂蚁团队将多个训练框架集成到统一的分布式深度学习框架中,即开源项目DLRover。同时,他们还开发了轻量级调试工具XPUTimer和弹性分布式训练EDiT,进一步提高了训练效率和性能。

在存储优化方面,蚂蚁团队通过存储与训练流程的协同设计,提升了MoE场景下的I/O效率。在5000个加速器MoE训练任务中,他们成功将检查点写入延迟降低了50%,减少了一半的时间消耗,同时还将训练节点上的峰值内存消耗降低了60%。这一成果不仅证明了在性能较弱的硬件上训练大规模MoE模型的可行性,还为基础模型开发提供了更灵活、更经济的方法。

蚂蚁团队在训练阶段使用的并非完全依赖英伟达芯片,而是采用了国产AI/GPGPU芯片产品。这一举措不仅有助于降低对国外技术的依赖,还为中国AI产业的自主可控发展提供了有力支持。据彭博报道,蚂蚁团队最终得到的结果与英伟达芯片(如H800)的结果相似,进一步证明了国产芯片在AI领域的潜力和实力。

在模型性能方面,Ling-Lite和Ling-Plus均表现出色。在英语理解方面,Ling-Lite模型在一项关键基准测试中的表现优于meta的Llama 3.1-8B模型。在中文基准测试中,Ling-Lite和Ling-Plus模型均优于DeepSeek的同类模型。Ling-Plus在安全性和错误拒绝方面表现出更好的整体平衡,取得了最好的结果。

蚂蚁集团表示,Ling-Plus和Ling-Lite将计划开源,并应用于医疗、金融等行业领域。目前,蚂蚁已经推出了三款AI助手管家产品,包括生活助手“支小宝”、AI金融管家“蚂小财”以及刚刚发布的AI医生助手等产品和解决方案。这些产品的推出不仅有助于提升用户体验和效率,还将进一步推动AI技术在各个领域的广泛应用和发展。

然而,蚂蚁团队也承认大模型训练是一个具有挑战性且资源密集的过程。在训练阶段,他们面临了包括稳定性在内的多种挑战。即使是硬件或模型结构的微小变化也可能导致问题,包括模型错误率的大幅上升。但蚂蚁团队通过不断的技术创新和优化策略,成功克服了这些困难,取得了今天的成果。

蚂蚁集团的这一成果不仅彰显了中国AI创新能力的不断增强,还加速了中国技术进步的步伐。如果内容得到证实,这将凸显出中国正在朝着AI自给自足的方向迈进。随着AI技术的不断发展和应用领域的不断扩大,相信蚂蚁集团将继续在AI领域发挥重要作用,为推动中国AI产业的发展做出更大贡献。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version