在使用Whisk时,用户可以灵活地为主题、场景和风格各自提供多张图像作为创作提示。这一设计使得图像生成过程更加直观和便捷。如果用户手边没有合适的图像,Whisk还贴心地提供了自动生成图像作为提示的功能,用户只需点击一个骰子图标,就能获得一系列由AI生成的图像作为参考。
Whisk还允许用户在生成过程的最后阶段,通过输入少量文字来进一步细化图像的具体细节。然而,这一步骤并非必须,用户完全可以依赖图像提示来完成创作。生成的图像不仅符合用户的预期,每张还会附带相应的文本提示,便于用户理解和调整。
值得注意的是,谷歌在介绍Whisk时强调,这款工具的设计初衷是为了实现快速的视觉探索,而非追求像素级的精细编辑。同时,谷歌也坦诚地表示,由于AI技术的局限性,Whisk生成的图像可能会出现一定的偏差。为了应对这一问题,Whisk允许用户直接编辑底层的图像提示,从而实现对生成图像的灵活调整。
据初步体验者反馈,Whisk的使用体验十分有趣。虽然生成的图像偶尔会出现一些意料之外的效果,但整体而言,这些图像都易于通过调整提示来迭代优化。图像生成的速度也相当可观,通常只需几秒钟就能完成。
谷歌透露,Whisk采用的是其最新发布的Imagen 3图像生成模型。这一模型在图像生成的质量和速度上都取得了显著的提升,为Whisk的出色表现提供了坚实的技术支撑。