谷歌在近期正式揭晓了其Gemini 2.0系列人工智能模型的最新成果——Gemini 2.0 Flash。这一版本不仅面向全球用户推出了聊天功能,还特别为开发人员准备了一个免费使用的实验版模型,该版本集成了文本转语音和图像生成两项前沿技术。
据谷歌官方宣称,Gemini 2.0代表了Agent时代AI模型的巅峰之作。与前代相比,它在运算速度上实现了翻倍,甚至在参数量少于Gemini 1.5的情况下,依然展现出了更为强大的性能。Gemini 2.0在功能多样性、多模态支持以及内置工具方面都取得了显著进步。
谷歌的首席执行官桑达尔·皮查伊表示,Gemini 1.0时代主要聚焦于信息的整理与理解,而Gemini 2.0则致力于将这些信息转化为对用户真正有用的资源。新版本在代码生成和提供准确事实性回复方面均有所提升,进一步满足了用户的多样化需求。
谷歌还同步推出了全新的多模态实时API,该API支持实时音频和视频流的输入,并允许用户同时使用多个组合工具。谷歌还展示了三个智能体研究原型,包括Project Astra、Project Mariner和Jules,这些原型充分展示了AI从被动信息处理工具向主动思考和行动的智能助手转变的巨大潜力。
在这些原型中,Project Astra尤为突出。作为一个系统级的智能体助手,Astra能够无缝整合Google的搜索、地图和Lens等应用,通过文本、语音、图像和视频等多种形式回答用户问题并执行任务。在演示中,Astra展示了其卓越的记忆力、流式处理能力和原生音频理解能力,为用户带来了更加个性化和贴心的服务体验。