谷歌近期推出了一款创新的AI图像生成工具——Whisk,这款工具让用户能够以图像为灵感,轻松创造出新的视觉作品。与以往需要繁琐文字描述的方式不同,Whisk允许用户直接通过上传其他图像来设定生成图像的主题、场景和风格。
在使用Whisk的过程中,用户能够分别为主题、场景和风格选择多张图像作为创作的基础。如果一时找不到合适的图像,还可以点击一个类似骰子的图标,让谷歌自动推荐一些图像作为参考。这些自动生成的图像同样具备高度的创意性。用户还拥有在最终阶段添加文字描述的权利,用以进一步细化图像特征,尽管这一步并非强制。
Whisk在接收到用户的图像提示后,会迅速生成相应的图像,并为每张图像配备一段描述性文字。用户可以根据自己的喜好选择保存或下载这些图像。如果对生成的图像有所不满,用户可以通过继续添加文字描述或修改现有的图像提示来进行调整,整个过程十分灵活。
谷歌在官方博文中指出,Whisk的核心理念是提供快速而直观的视觉探索体验,而非追求像素级的精确修改。公司同时承认,由于AI技术的局限性,Whisk生成的图像可能会出现偏差,因此特意设计了可编辑的提示功能,让用户能够自主调整创作方向。
据初步体验者反馈,Whisk的使用过程充满乐趣。虽然生成的图像偶尔会出现一些意想不到的效果,但得益于其易于迭代修改的特性,用户能够轻松调整出满意的作品。图像生成的速度也相当可观,通常在几秒钟内就能完成。
Whisk背后的技术支持是谷歌最新发布的Imagen 3图像生成模型。这款模型不仅提升了图像生成的效率,还在一定程度上增强了图像的创意性和多样性。