字节跳动旗下的智能AI助手豆包近期迎来了一项重要升级,其文生图功能得到了显著增强,实现了用户指定文本的一键生成。这项新功能允许用户在生成图片时,通过添加文本要求来定制图片内容,例如输入“一张带有‘新年快乐’的图片”,系统即可自动创作出包含该文字的图片。
据了解,这一功能的推出,解决了文生图模型在图像中精确生成文本的长期难题,特别是针对中文文字的生成。相较于英文字母,汉字的结构更为复杂,字符数量也远超前者。豆包大模型团队通过整合LLM和DIT架构,显著提升了模型对原生中文数据的学习能力,并在此基础上进一步优化了汉字的生成效果,减少了乱码现象的发生。
目前,该功能已在豆包APP中开始测试,并受到了用户的积极反馈。不少用户已经开始利用这一功能制作个性化的表情包、梗图漫画,甚至辅助生成海报,并在社交媒体上分享自己的创作。这些作品不仅丰富了用户的表达方式,也展示了AI技术在创意创作领域的巨大潜力。
值得注意的是,尽管豆包在文本生成方面取得了显著进步,但仍存在一些挑战。据豆包团队负责人介绍,尽管在大多数情况下,豆包能够准确生成用户指定的文字,但在极少数情况下,仍可能出现错字、漏字或小字乱码等问题。对此,豆包团队表示将持续进行技术优化,以提升文本生成的准确性和稳定性。
豆包团队还透露,该功能目前仅支持在生成图片时添加文字,尚不支持从现有图片中提取或生成文字。不过,随着技术的不断进步和用户需求的变化,豆包团队正在积极探索更多可能性,以期在未来实现更多元化的功能。
同时,为了满足更多用户的需求,豆包网页版及电脑版也将在近期上线这一功能。这意味着,无论用户是在手机上还是电脑上,都能轻松享受到豆包带来的便捷创作体验。
豆包团队表示,他们将继续致力于降低创作门槛,帮助用户更好地表达和创造。无论是文字、图片还是音乐生成功能,豆包都将以用户需求为导向,不断推出更多创新功能,为用户带来更加丰富的创作体验。