滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智谱AI新突破：CogView4文生图模型，首个开源支持汉字生成达SOTA

时间：2025-03-04 14:19:13 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

智谱AI最新发布的CogView4模型在文本到图像生成领域取得了突破性进展，成为首个能够生成汉字的开源模型，并在DPG-Bench基准测试中荣获榜首，标志着开源文生图模型的新高度。这一创新成果不仅遵循Apache 2.0协议，更为图像生成领域带来了前所未有的技术革新。

据悉，CogView4模型以其卓越的复杂语义对齐和指令跟随能力，能够支持中英双语输入，无论文本长度如何，均能生成指定范围内的任意分辨率图像。这一特性使得CogView4在广告、短视频等创意领域具有广泛的应用潜力。

在DPG-Bench基准测试中，CogView4凭借其出色的表现脱颖而出，成为开源文生图模型中的佼佼者。DPG-Bench测试主要评估模型在复杂语义对齐和指令跟随方面的能力，而CogView4无疑在这一领域树立了新的标杆。

CogView4的两大技术性创新尤为引人注目。首先，它支持中英双语提示词输入，擅长理解和遵循中文提示词，这在开源文生图模型中尚属首次。通过采用具备双语能力的GLM-4 encoder，并结合中英双语图文对进行训练，CogView4成功实现了双语提示词输入功能。这一创新使得模型能够更好地满足中文用户的创意需求，如古诗文中的意境描绘等。

其次，CogView4支持输入任意长度的提示词，并能够生成指定范围内的任意分辨率图像。这一特性极大地提升了用户创作的自由度，同时也提高了训练效率。为了实现这一目标，CogView4采用了二维旋转位置编码（2D RoPE）来建模图像位置信息，并通过内插位置编码方式支持不同分辨率的图像生成任务。模型还采用了Flow-matching方案进行扩散生成建模，并结合参数化的线性动态噪声规划，以适应不同分辨率图像的信噪比需求。

作为首个遵循Apache 2.0协议的图像生成模型，CogView4的开源将极大地推动AI技术的普及和应用。智谱AI表示，将继续增加ControlNet、ComfyUI等生态支持，并推出全套的微调工具包，以满足更多用户的需求。CogView4的最新版本将于3月13日上线智谱清言平台，供用户下载和使用。

作为国内最早的开源大模型公司之一，智谱AI始终致力于推动AI技术的普惠发展。2025年被定为智谱开源年，公司将陆续开源基础模型、推理模型、多模态模型、Agent模型等，为AI技术的创新和应用注入新的活力。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

阿里万相2.1开源引领视频AI新纪元，谷歌微美全息共赴全模态开源浪潮！

03-04

曹鹏两会提案：力推异构算力与数字技术，赋能产业智算普惠与新型工业化

03-04

DeepSeek崛起彰显中国AI创新力，开放共享理念引领科技潮流

03-04

智谱发布CogView4，首个汉字生成开源文生图模型问鼎SOTA！

03-04

智谱发布CogView4：60亿参数，首个支持生成汉字的开源文生图模型！

03-04

量子计算大战一触即发：硅谷五大巨头的角力与未来

在量子计算领域，英伟达将自己定位为加速计算平台公司（accelerate computing platform company），策略很明确：一方面与量子计算公司合作，希望GPU在量子时代也能占据一席之地；…

03-04

菜鸟AI物流技术荣获中国AI领域顶级奖项，物流界独领风骚

03-04

雷军遭AI换脸恶搞后发声：加强换脸拟声违法治理，网友力挺

03-04

国产机器人新星自变量机器人Pre-A++轮融资成功，加速具身智能通用大模型研发

03-04

中科金财身陷26个热门概念，AI转型能否扭转八年亏损困局？

如2021年元宇宙大火时，中科金财便在互动平台回应在元宇宙领域有相关布局，并参股了元宇宙企业，在该消息刺激下，中科金财股价曾连续大涨。 2024年2月，Sora大火，中科金财在官方微信上发布《中科金财与微软…

03-04

华为AI WAN方案：赋能Net5.5G时代，共铸智能网络新篇章

03-04

容联云DeepSeek大模型：银行业智能化转型的六大实战路径

03-04

中国移动李慧镝：AI融合网络，引领数智时代新飞跃

03-04

海亮科技携手DeepSeek，重塑“AI+教育”新生态

03-04

中兴通讯MWC2025：全场景AI终端亮相，开启智能生活新篇章

03-04

点击查看更多 +

全站最新

AMD下代APU性能大爆发，游戏表现能否真超RTX 5070 Ti？

雷军两会发声：新能源车牌设计需优化，能否告别“颜值砍半”？

2月安卓旗舰性能榜揭晓：一加Ace 5 Pro登顶，谁紧随其后？

首航新能储能系统：工商业能源管理升级的新引擎

鸿蒙原生版喜马拉雅：小艺助力，听音体验再升级！

燃油车智能化升级，一汽大众“三步走”战略能否重塑市场格局？

热门内容

本栏最新

中国移动李慧镝：AI融合网络，引领数智时代新飞跃

中兴通讯MWC2025：全场景AI终端亮相，开启智能生活新篇章

CoreWeave纳斯达克上市在即，募资40亿美元，英伟达等巨头加持

Anthropic获35亿美元E轮融资，投后估值飙升至615亿美元

2025年2月“钛度号”月榜：移民热降温，科技财经新趋势崛起！

火山引擎开源大模型应用，大模型应用实验室平台正式上线！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.