亚马逊云科技在深夜宣布了一系列重大更新,其首席执行官安迪·贾西亲自揭晓了Amazon Nova系列模型,这一举动无疑在业界投下了一枚震撼弹。
此次发布的Amazon Nova系列模型,涵盖了Micro、Lite、Pro、Premier四款基础模型。Micro作为一款纯文本模型,拥有128k的上下文窗口;而Lite与Pro则具备300k的上下文窗口,并支持多模态功能;至于Premier,同样是多模态模型,但能够执行更为复杂的推理任务。贾西透露,Micro、Lite与Pro模型现已全面开放,而Premier则计划在2025年第一季度面世。
在性能对比上,贾西自豪地表示,Pro模型在20个基准测试中,有17个与GPT-4 O持平或更优,而在与Gemini的较量中,Pro模型在21个基准测试中有16个表现更佳。这四款模型的性价比极高,相较于Amazon Bedrock中的其他领先模型,Nova系列的成本降低了约75%。
这四款基础模型不仅被整合到Amazon Bedrock中,还与Bedrock的所有功能进行了深度对接,使得任何模型提供商都能轻松使用,并供开发者进行微调。Nova系列还与蒸馏功能相结合,能够将大模型的智能“迁移”至更小巧的模型中,这些小型模型不仅成本更低,延迟也更少。
除了这四款基础模型,贾西还宣布了图像生成模型Amazon Nova Canvas和视频生成模型Amazon Nova Real。Nova Real即将推出制作6秒视频的功能,而在接下来的几个月里,还将进一步升级至能够制作最长2分钟视频的功能。
与此同时,亚马逊云科技的另一重要人物——马特·加尔曼也宣布了Amazon Bedrock multi-agent collaboration多智能体协作功能的同步推出。这意味着Amazon Bedrock智能体能够处理更为复杂的工作流程,多个智能体返回的信息能够进行协调处理,确保智能体之间的有效协作。
在硬件方面,加尔曼带来了基于Trn2的Amazon EC2实例的发布。这一实例由Amazon Trainium2芯片提供支持,专为生成式AI设计,其性能之强大得益于亚马逊云科技内部定制构建的处理器。相较于当前一代基于GPU的EC2 P5e和P5en实例,Trn2实例的性价比提高了30-40%,并拥有16个Trainium2芯片,可提供20.8 petaflops的峰值计算能力,非常适合训练和部署具有数十亿个参数的LLM。
对于需要更多计算资源的最大模型,Trn2 UltraServer允许客户将训练扩展到单个Trn2实例的限制之外,从而减少训练时间,加快上市时间,并支持快速迭代以提高模型准确性。这是一种全新的EC2产品,使用超快的NeuronLink互连将四台Trn2服务器连接在一起,形成一台巨型服务器,可扩展至83.2 petaflops的峰值计算能力,将单个实例的计算、内存和联网能力提高四倍。
亚马逊云科技还推出了下一代AI训练芯片Trainium3。Trainium3将成为第一款采用3纳米工艺节点制造的Amazon芯片,为性能、能效和密度设定了新标准。由Trainium3支持的UltraServer的性能预计将比Trn2 UltraServer高出4倍,使客户能够在构建和部署模型时提供更快的迭代速度和卓越的实时性能。第一批基于Trainium3的实例预计将于2025年底推出。