【ITBEAR科技资讯】4月22日消息,近日,meta开源了最新的Llama 3系列大语言模型,该模型拥有80亿及700亿两种参数版本,且其训练数据相较之前的Llama 2版本扩大了7倍,性能有了显著的提升。阿里云对此迅速响应,其魔搭社区已经在第一时间上架了全部4款模型。
阿里云百炼大模型服务平台更是走在了行业前列,它在国内首次推出了针对Llama 3系列的限时免费训练、部署、推理服务。从现在开始,企业和开发者可以在阿里云上基于Llama 3系列打造自己的专属大模型,这无疑大大降低了AI技术的门槛,推动了AI技术的普及和应用。
据ITBEAR科技资讯了解,由于企业和开发者对特定语言或垂直领域的能力有所要求,因此他们通常需要对开源模型进行再训练或微调。然而,这个过程往往繁琐复杂。为了解决这一问题,阿里云百炼平台推出了一键训练、部署、推理方案,并针对Llama 3提供限时的免费算力服务。
对于希望直接进行推理应用的用户,百炼平台提供了模型调试、prompt模版等功能,使他们能够快速基于Llama 3打造自己的AI助手。而对于希望进行深度开发的企业,他们可以结合自身的数据集,一键启动SFT全参训练或LoRA高效训练,并利用百炼的RAG检索增强、智能体打造等能力进行后续的应用开发。
阿里云百炼平台的强大功能得益于阿里云深厚的AI基础设施能力。在基础设施层,阿里云的灵骏智算集群拥有高达十万卡GPU的扩展性;在AI平台层,人工智能平台PAI提供了高效灵活的调度能力,能大幅提升大模型的训练性能,并能稳定运行千卡任务超过5周。
作为中国云计算的领导者,阿里云致力于成为“AI时代最开放的云”,并全面支持中国大模型生态的繁荣。阿里云已经全尺寸、全模态开源了自研的通义千问大模型,并深度支持对多种开源模型的开发应用,以及众多国内机构大模型的训练推理。目前,阿里云已经成为中国大模型的公共算力底座,超过一半的中国主流大模型都在阿里云上运行。