滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

百度新专利曝光：图像生成模型技术再升级

时间：2025-03-25 11:23:13 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，一项与图像生成技术相关的专利信息引起了业界的广泛关注。据天眼查披露，该专利由北京百度网讯科技有限公司申请，具体名称为“图像生成模型的构建、生成方法及其相关装置”。

该专利深入探讨了图像处理及人工智能领域的创新应用。其核心在于，通过一系列复杂的算法流程，实现图像的高效、精准生成。具体而言，该方案首先收集大量的样本图像，并为之匹配相应的样本提示词。

接下来，这些样本图像会经过一个名为第一预处理网络的处理环节，该环节能够提取出图像的控制条件和目标潜在空间编码。与此同时，样本提示词则通过第二预处理网络被转换为文本向量，为后续步骤提供关键信息。

在获取了上述关键信息后，专利提出了一种创新的训练方法。该方法将目标潜在空间编码、文本向量和控制条件作为输入，送入一个待训练的UNet网络中。结合UNet网络输出的噪声分布，进行多次迭代训练，直至得到一个性能优越的目标UNet网络。

最终，基于第一预处理网络、第二预处理网络、训练好的目标UNet网络以及一个解码器，构建出一个完整的图像生成模型。这一模型不仅能够根据给定的提示词生成符合要求的图像，还在图像处理的效率和质量上实现了显著提升。

这一专利的公布，标志着百度在图像处理及人工智能领域的研究又迈出了重要一步。业界普遍认为，这一创新技术有望为图像生成、图像编辑等领域带来革命性的变化，推动相关产业的进一步发展。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

汉桑科技引领音频革命：AI技术如何重塑音频行业生态？

03-26

AI赋能微盟财报亮眼，国产SaaS行业步入智能升级快车道？

03-26

谷歌Gemini 2.5 Pro发布：刷新长文本推理极限，多模态能力全面升级！

03-26

优必选掷2000万于天津布局AI新领域，新公司涵盖多项智能业务

03-26

优必选天津新设科技公司，注册资本2000万，涉足多项AI业务领域

03-26

张亚勤博鳌论道：AI迈向Agent智能，无人驾驶成亮点，百度表现佳

03-26

阿里千问与DeepSeek同日上架魔搭，社区模型总数已超4万个

3月26日，中国AI又给全球开源社区带来了新惊喜——阿里通义千问与DeepSeek，均于昨日低调开源了两款新模型：阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B，DeepSeek则将此前热门的「基座模型」V3更新到0324版本，并官宣在魔搭社区上架开源。截至目前

03-26

宇树科技确认盈利状态，王兴兴或借AI浪潮进军人形机器人领域

03-26

AI论战背后：探索智能本质，行业巨头如何引领未来方向？

03-26

Vet1引领宠物医疗智能化新篇章，重塑行业未来

03-26

融云携手浪潮海若，打造数字员工，通信进化为生产力新引擎

03-26

谷歌Gemini 2.5 Pro强势登顶，编程能力惊艳，"人类最后考试"超OpenAI

Gemini 2.5Pro除了在衡量人类偏好的大模型竞技场领先之外，还在常见的编程、数学和科学基准测试中处于领先地位，包括Humanity’s Last Exam（人类最后考试）这一难度超高的基准测试，与…

03-26

它石智航天使轮融资8.6亿！华为前CTO携手天才少年打造具身智能新篇章

它石智航正式成立于今年2月，是行业内独有的同时具备具身智能大模型能力、本体研发能力和软硬一体产品量产能力的公司。团队方面，它石智航CEO陈亦伦是国内具身智能、自动驾驶领域技术及产业的领军人，曾任清华大学智…

03-26

微盟集团财报：首次披露AI产品商业化进展，国产SaaS距离“GPT”时刻还有多远？

近日港股SaaS集体发布财报，而微盟的一组数据比较亮眼——微盟旗下大模型应用产品WAI SaaS，为新客户交付期使用量提升217.7%，使用AI的中小商家续费率达到了75%。这很可能是中国SaaS企业为数不多的AI商业化应用的成果。2025年开年以来，国内AI大模型颠覆性突破持续爆发

03-26

它石智航天使轮融资1.2亿，陈亦伦李震宇携“豪华梦之队”领跑具身智能

03-26

点击查看更多 +

全站最新

vivo海外扩张加速，2027年销售目标直指七成海外收入

奥迪A5插混版海外亮相，动力升级，国产在即！

丰田汉兰达焕新登场，国产加速你准备好了吗？

大众新车狂降5万，6万起售颜值与科技并存，你会心动吗？

华为问界M8豪华登场，国产"劳斯莱斯"既视感，32.98万起售值不值？

奥迪A3 e-tron将面世，高德诺透露2026年投产计划

热门内容

本栏最新

汉桑科技引领音频革命：AI技术如何重塑音频行业生态？

谷歌Gemini 2.5 Pro发布：刷新长文本推理极限，多模态能力全面升级！

优必选掷2000万于天津布局AI新领域，新公司涵盖多项智能业务

张亚勤博鳌论道：AI迈向Agent智能，无人驾驶成亮点，百度表现佳

Vet1引领宠物医疗智能化新篇章，重塑行业未来

融云携手浪潮海若，打造数字员工，通信进化为生产力新引擎

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.