在科技界的瞩目下,亚马逊于近日在其年度re:invent大会上,由现任公司首席执行官安迪·贾西亲自揭晓了生成式AI领域的最新力作——Amazon Nova系列基础模型。这一发布不仅标志着亚马逊在大型语言模型技术上的又一重大突破,也展示了其在多模态AI应用方面的雄心壮志。
去年,亚马逊以Titan模型初涉大模型领域,彼时其能力尚局限于单一语言模态。而今,Nova系列的问世,无疑是亚马逊在该领域深度探索与全面布局的体现。Nova系列主打“Any to Any”理念,即任意模态输入、任意模态输出,无论是文本生成文本、文本生成图像,还是图像生成视频,Nova都能游刃有余。在Benchmark评测中,Nova系列模型更是展现出了SOTA级别的实力,几乎击败了所有同量级和市场定位的基础模型。
面对这一王炸级别的自研产品,人们不禁好奇,亚马逊如何看待与模型生态伙伴的关系?对此,安迪·贾西在发布会上给出了他的见解。他表示,亚马逊内部构建的AI应用中,模型使用的多样性令人印象深刻。开发者们同样追求低延迟、低成本、微调能力、知识库协调以及自动化操作等多元化需求。因此,亚马逊云科技的模型策略,就是赋予开发者尽可能多的自主选择权。
“我们深知,没有一种工具能在所有领域一统天下。”贾西举例道,数据库领域有关系型和非关系型之分,AI框架领域也曾有TensorFlow与PyTorch之争。模型领域同样如此,多样性是不可避免的趋势。
在Nova系列中,亚马逊推出了六种大模型,包括四种文本生成模型和两种视觉内容生成模型。其中,Micro模型以其轻量级、高响应速度和高性价比,成为了内部开发者处理简单任务的首选。Lite、Pro和Premier模型则分别在不同性能需求下,提供了多模态输入与文本输出的解决方案。特别是Premier模型,其对标的是OpenAI的Orion系列,旨在应对复杂推理任务,并成为定制模型蒸馏的“教师”。
除了性能卓越,Nova系列模型还具备成本效益高、速度快等优势。与Amazon Bedrock中的其他模型相比,Nova系列能节省约75%的成本。同时,它们已与Bedrock的所有功能深度整合,开发者可以对模型进行微调、增强或蒸馏,以满足各种应用需求。
在视觉内容生成方面,Amazon Nova Canvas和Reel模型同样引人注目。Canvas可以根据文本或图像提示生成专业级图像,并支持文本编辑、配色方案和布局控制等功能。在第三方对比评估中,Canvas的表现优于OpenAI DALL-E 3和Stable Diffusion。而Reel则是一款先进的视频生成模型,可轻松创建高质量视频,适用于广告、营销和培训内容创作。未来几个月内,Reel将支持生成最长2分钟的视频。
安迪·贾西还透露了Nova系列的后续计划,包括明年推出第二代模型、第一季度推出语音到语音模型以及年中推出多模态输入到多模态输出的模型。这一系列动作无疑将进一步巩固亚马逊在生成式AI领域的领先地位。
在发布会上,贾西还分享了亚马逊内部AI应用的多个案例,包括零售业务中的个性化推荐、履约中心拣货路径规划、Prime Air无人机送货、Amazon Go商店的Just Walk Out技术以及为Alexa提供技术支持等。这些应用不仅提高了效率和客户满意度,还创造了全新的购物体验。
以智能客服为例,亚马逊利用生成式AI对聊天机器人进行了重构,使其能够更准确地理解客户需求,并提供个性化的解决方案。这一改变使得客户满意度提升了500个基点。同样地,在库存管理方面,亚马逊运用Transformer模型提高了长期需求预测的准确性,从而节省了数以十亿美元计算的成本。
在创新客户体验方面,亚马逊也推出了多个AI应用。例如,Rufus购物智能体能够为客户提供类似真人导购的体验;Alexa则正在通过多个基础模型进行重构,以更好地回答用户问题并预测用户需求;Amazon Lens则利用计算机视觉和多模态模型帮助用户通过照片搜索并购买商品。
这些应用不仅展示了亚马逊在AI技术上的深厚积累和创新精神,也为其在全球电商市场的竞争中增添了新的筹码。随着Nova系列模型的推出和更多AI应用的落地,亚马逊无疑将在生成式AI领域掀起新的浪潮。