在科技界的年度盛事2024 re:Invent全球大会上,亚马逊公司震撼发布了六大全新大模型,标志着其在人工智能领域的又一重大迈进。
这些创新模型均基于亚马逊最新推出的基础模型Amazon Nova,并整合在Amazon Bedrock平台中,为用户提供全方位的服务。Amazon Nova系列包括Micro、Lite、Pro和Premier四款基础模型。其中,Micro专注于纯文本生成,每秒能输出惊人的210个token;Lite和Pro则作为多模态模型,分别与OpenAI的GPT-4o mini和GPT-4o相媲美,并在多项基准测试中展现出更优性能;而Premier更是专为复杂推理任务设计的高阶多模态模型。
在大会演讲中,亚马逊云科技新任CEO马特·加曼(Matt Garman)指出,大模型领域正以惊人的速度发展,每周都有新版本、新功能、新模型涌现,成本也在不断变化。尽管市面上模型众多,但找到完全符合自身需求的完美模型依然是一项挑战。因此,亚马逊云科技致力于打造一个综合考虑专业能力、延迟和成本的大模型服务,近两年在大模型领域的所有动作均围绕这一目标展开。
为满足市场对大模型的需求,亚马逊于2023年4月推出了完全托管的Amazon Bedrock服务。通过API集合,Bedrock提供来自AI21 Labs、Anthropic、Cohere、meta、Mistral AI、Stability AI以及亚马逊自身等多家公司的多种基础模型,涵盖文本生成、图像生成等多种类型,为开发者提供了丰富的选择。据加曼透露,Amazon Bedrock的使用量在过去一年增长了近五倍,每天都有数万客户在生产应用中使用。
Amazon Bedrock的成功不仅吸引了大量企业客户,还吸引了Salesforce、SAP和Workday等独立软件供应商(ISV)将其集成到自身系统上,为下游客户提供生成式AI服务。亚马逊还在Bedrock中推出了模型蒸馏功能,帮助企业进一步降低大模型的使用成本。经过蒸馏的模型在运行速度上能提高500%,成本降低75%,且所有相关工作均可在Bedrock中一站式完成。
亚马逊自研的Nova系列模型在平衡专业能力、成本和延迟等多方面因素的基础上推出,并与蒸馏功能整合,将大模型的智能“转移”到更小、成本效益更高、延迟更低的模型中。而在2024 re:Invent大会上发布的六款模型只是冰山一角,亚马逊还计划在2025年推出语音到语音模型以及多模态到多模态模型。
其中,语音到语音模型预计于2025年第一季度推出,旨在通过理解自然语言流式语音输入,解释语言和非语言信号,提供流畅的类人交互,彻底改变对话式AI应用。而多模态到多模态模型则是亚马逊在大模型领域的一次全新尝试,能够接受文本、图像、音频和视频作为输入,并以任意模态生成输出,预计于2025年中旬推出,将简化应用开发,使同一模型能够执行多种任务。
在大会上,AI初创公司Anthropic的联合创始人兼首席计算官Tom Brown宣布了“雷尼尔计划”,该计划将使用拥有数十万枚亚马逊自研芯片的算力集群,数量是Anthropic现有算力集群的五倍以上。作为亚马逊投资的AI初创公司,Anthropic已使用亚马逊AWS的云计算服务,其Claude系列模型也已集成在Amazon Bedrock上。此举不仅提升了Anthropic的算力规模,也展示了亚马逊云在大模型领域的更大野心。
亚马逊云科技联合Anthropic对标微软+OpenAI的模式,争夺更多有大模型和云计算需求的客户。此前,微软CEO萨提亚·纳德拉曾表示,超过1.8万家公司正在使用微软的Azure OpenAI服务,其中不少是Azure的新客户,且Azure的收入增长部分来自GPT-4入口。亚马逊希望复制这一成功模式,通过投资将自研芯片与Anthropic深度绑定,降低算力成本,减少对英伟达、英特尔等芯片供应商的依赖,从而在价格和服务上提升竞争力。
据最新数据显示,2024年第三季度,亚马逊在全球云基础设施市场的份额达到31%,领先于微软的Azure平台和谷歌云。