滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智谱大模型新突破！60亿参数CogView4文生图，领跑SOTA开启开源年

时间：2025-03-04 14:23:23 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

近日，大模型领域的独角兽企业智谱科技震撼发布其最新研发成果——CogView4，这是一款开创性的开源文生图模型，特别之处在于它首次实现了对汉字生成的支持。

CogView4模型内含60亿参数，专为中文环境设计，不仅支持原生中文输入，还能将中文文本直接转化为图像。其最显著的技术更新在于，该模型能够无缝处理中英文双语提示词，将字符巧妙融入图像之中，且对长达上百字的复杂提示词也能精准理解。

与上一代产品CogView3-Plus-3B相比，CogView4在提示词处理上实现了质的飞跃，长度上限从224 Tokens大幅提升至1024 Tokens，极大扩展了用户的创意空间。

在权威的文生图基准测试DPG-Bench中，CogView4凭借卓越的表现摘得桂冠，证明了其在复杂语义对齐和指令跟随能力上的领先地位。目前，CogView4的6B-0304版本已面向公众开源，并将于3月13日正式登陆智谱清言平台（chatglm.cn）。

CogView4不仅是首个支持汉字生成的开源模型，还是首个遵循Apache 2.0协议的图像生成模型。智谱科技承诺，未来将陆续推出ControlNet、ComfyUI等生态支持，并即将发布一套完整的微调工具包，以满足用户多样化的需求。

CogView4在实际应用中展现出了惊人的创造力。无论是中英文海报的原图直出，还是根据古诗词意境绘制的精美插图，CogView4都能精准理解用户意图，将文字转化为生动形象的画面。该模型还支持超长提示词生成四格漫画或精细画面，为用户提供了前所未有的创作体验。

例如，用户只需输入一句简短的诗句“野径云俱黑，江船火独明”，CogView4就能迅速捕捉到诗句中的意象，将黑云、船、灯光、野径等元素巧妙融入画面之中，营造出一种静谧而神秘的氛围。

在技术层面，CogView4的突破在于其双语提示词输入能力和任意分辨率图像生成能力。通过将文本编码器升级为具备双语能力的GLM-4 encoder，并结合中英双语图文对进行训练，CogView4成功实现了双语提示词输入。同时，该模型采用二维旋转位置编码（2D RoPE）和Flow-matching方案进行扩散生成建模，支持任意长度提示词和任意分辨率图像的生成。

智谱科技的这一创新成果，无疑为文生图领域注入了新的活力。随着CogView4的开源和后续生态支持的完善，我们有理由相信，这一技术将广泛应用于各个领域，推动AI普惠的实现。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

智谱AI新突破：CogView4文生图模型，首个开源支持汉字生成达SOTA

03-04

阿里万相2.1开源引领视频AI新纪元，谷歌微美全息共赴全模态开源浪潮！

03-04

曹鹏两会提案：力推异构算力与数字技术，赋能产业智算普惠与新型工业化

03-04

DeepSeek崛起彰显中国AI创新力，开放共享理念引领科技潮流

03-04

智谱发布CogView4，首个汉字生成开源文生图模型问鼎SOTA！

03-04

智谱发布CogView4：60亿参数，首个支持生成汉字的开源文生图模型！

03-04

量子计算大战一触即发：硅谷五大巨头的角力与未来

在量子计算领域，英伟达将自己定位为加速计算平台公司（accelerate computing platform company），策略很明确：一方面与量子计算公司合作，希望GPU在量子时代也能占据一席之地；…

03-04

菜鸟AI物流技术荣获中国AI领域顶级奖项，物流界独领风骚

03-04

雷军遭AI换脸恶搞后发声：加强换脸拟声违法治理，网友力挺

03-04

国产机器人新星自变量机器人Pre-A++轮融资成功，加速具身智能通用大模型研发

03-04

中科金财身陷26个热门概念，AI转型能否扭转八年亏损困局？

如2021年元宇宙大火时，中科金财便在互动平台回应在元宇宙领域有相关布局，并参股了元宇宙企业，在该消息刺激下，中科金财股价曾连续大涨。 2024年2月，Sora大火，中科金财在官方微信上发布《中科金财与微软…

03-04

华为AI WAN方案：赋能Net5.5G时代，共铸智能网络新篇章

03-04

容联云DeepSeek大模型：银行业智能化转型的六大实战路径

03-04

中国移动李慧镝：AI融合网络，引领数智时代新飞跃

03-04

海亮科技携手DeepSeek，重塑“AI+教育”新生态

03-04

点击查看更多 +

全站最新

AMD下代APU性能大爆发，游戏表现能否真超RTX 5070 Ti？

雷军两会发声：新能源车牌设计需优化，能否告别“颜值砍半”？

2月安卓旗舰性能榜揭晓：一加Ace 5 Pro登顶，谁紧随其后？

首航新能储能系统：工商业能源管理升级的新引擎

鸿蒙原生版喜马拉雅：小艺助力，听音体验再升级！

燃油车智能化升级，一汽大众“三步走”战略能否重塑市场格局？

热门内容

本栏最新

智谱AI新突破：CogView4文生图模型，首个开源支持汉字生成达SOTA

中国移动李慧镝：AI融合网络，引领数智时代新飞跃

中兴通讯MWC2025：全场景AI终端亮相，开启智能生活新篇章

CoreWeave纳斯达克上市在即，募资40亿美元，英伟达等巨头加持

Anthropic获35亿美元E轮融资，投后估值飙升至615亿美元

2025年2月“钛度号”月榜：移民热降温，科技财经新趋势崛起！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.