近日,一项与图像生成技术相关的专利信息引起了业界的广泛关注。据天眼查披露,该专利由北京百度网讯科技有限公司申请,具体名称为“图像生成模型的构建、生成方法及其相关装置”。
该专利深入探讨了图像处理及人工智能领域的创新应用。其核心在于,通过一系列复杂的算法流程,实现图像的高效、精准生成。具体而言,该方案首先收集大量的样本图像,并为之匹配相应的样本提示词。
接下来,这些样本图像会经过一个名为第一预处理网络的处理环节,该环节能够提取出图像的控制条件和目标潜在空间编码。与此同时,样本提示词则通过第二预处理网络被转换为文本向量,为后续步骤提供关键信息。
在获取了上述关键信息后,专利提出了一种创新的训练方法。该方法将目标潜在空间编码、文本向量和控制条件作为输入,送入一个待训练的UNet网络中。结合UNet网络输出的噪声分布,进行多次迭代训练,直至得到一个性能优越的目标UNet网络。
最终,基于第一预处理网络、第二预处理网络、训练好的目标UNet网络以及一个解码器,构建出一个完整的图像生成模型。这一模型不仅能够根据给定的提示词生成符合要求的图像,还在图像处理的效率和质量上实现了显著提升。
这一专利的公布,标志着百度在图像处理及人工智能领域的研究又迈出了重要一步。业界普遍认为,这一创新技术有望为图像生成、图像编辑等领域带来革命性的变化,推动相关产业的进一步发展。