随着每一次工业革命的浪潮,人类社会经历了前所未有的跃迁式发展。如今,以人工智能(AI)为核心的新一轮技术变革正汹涌而来,企业如何在这样的背景下获取必要的技术支撑,为通用人工智能时代的到来做好充足准备,成为了业界关注的焦点。
近日,在2024火山引擎FORCE原动力大会·冬技术主论坛上,一系列创新产品及升级方案被隆重推出,旨在帮助企业解决落地大模型所面临的实际难题。字节跳动基础架构负责人赵鹏伟在会上发表了重要讲话。
“为了迎接通用人工智能时代的到来,企业必须在性价比、创新能力和安全保障等方面做好充分准备。”赵鹏伟指出,“火山引擎通过提供AI云原生式的全链路产品服务能力,包括豆包大模型、大模型服务、AI基础设施、数据和安全方向的新成果,致力于与众多企业和开发者共同推进未来的AI创新变革。”
火山引擎提出了AI云原生的新概念,认为未来的计算范式应以GPU为核心,重新优化计算、存储与网络架构。AI云原生将允许GPU直接访问存储和数据库,显著降低IO延迟,并提供更高规模的高速互联和端到端的安全保护。为此,火山引擎将打造以AI负载为中心的基础架构新范式,推出新一代计算、网络、存储和安全产品。
在计算层面,火山引擎推出了新一代GPU实例,通过vRDMA网络支持大规模并行计算和P/D分离推理架构,显著提升训练和推理效率,降低成本。在存储方面,新发布的EIC弹性极速缓存能够实现GPU直连,使大模型推理时延降低至原来的五十分之一,成本降低20%。在安全层面,火山引擎推出了PCC私密云服务,构建大模型的可信应用体系,实现用户数据在云上推理的端到端加密,且性能优越,推理时延与明文模式相比差异在5%以内。
火山方舟作为一站式大模型服务平台,通过Cache、离线推理模式等产品与升级,以及全新发布的Prompt优解,加速了大模型能力的落地。Prompt优解通过“自动+互动”的方式协助用户编写提示词,用机器实现类似人类的反思、类比、错误总结能力,全自动优化prompt,助力企业低成本高效率获得高质量prompt。目前,Prompt优解已通过火山方舟开放全量公测。
火山引擎始终将成本和价格作为重要考量因素,发布了离线批量推理方案和上下文缓存,进一步践行“人人用得起,才是好模型”的理念,帮助用户实现更为精细化和低成本的运营。
全新发布的扣子1.5和HiAgent1.5,助力企业打造AI原生应用。从通用大模型到企业AI应用落地,需要跨越三道鸿沟,而扣子1.5和HiAgent1.5的推出,将帮助企业更好地实现这一转变。豆包大模型最新发布的视觉理解模型、文生图模型2.1和音乐模型,都可以通过扣子以插件的方式体验,有助于更多多模态AI应用的诞生。
为了帮助企业用好数据,驱动业务价值的提升,火山引擎发布了数据飞轮2.0,通过AI创新重新定义企业数据智能。数据飞轮2.0全面注入大模型,带来前所未有的决策洞察,通过一体化数智研发与一站式数据智能运营,简化工作流程。在多元异构计算引擎的加速下,快速处理结构与非结构数据资产,激发企业更多潜在数据资产,实现更大的动力。
火山引擎云安全围绕“让智能更安全、让安全更智能”的理念,为AI基础设施提供透明可信的安全保障,并通过安全智能体,将字节跳动沉淀的安全经验服务于每个企业。大模型应用进入快速发展阶段,企业对模型能力、价格以及落地难度都提出了更高要求。火山引擎本次发布的多款全新产品与升级,进一步降低了模型训练、推理应用的难度,以更高性价比和更强安全保障,为企业落地AI能力奠定了坚实基础。