字节跳动近期对其旗下的智能AI助手豆包进行了功能升级,重点强化了其文字生成图片(文生图)的能力。现在,用户只需在生成图片的提示词中加入所需的文本要求,例如“制作一张带有‘新年快乐’字样的图片”,豆包就能迅速生成一张包含指定文字的图片。这一创新功能已经在豆包APP内启动测试,并且也在即梦平台上进行了小范围的试验。
在文生图技术的领域,如何在图片中精确无误地生成文字,尤其是中文文字,一直是一项技术挑战。由于汉字的结构比英文字母更为复杂,且字符数量远超后者,因此乱码问题时有发生。据豆包大模型团队的相关负责人介绍,豆包文生图模型通过整合LLM和DIT架构,显著提升了其原生中文数据的学习能力。在此基础上,团队还进一步强化了汉字的生成能力,使得生成的图片中的文字效果有了质的飞跃。
目前,许多用户已经开始利用这一新功能制作表情包、梗图漫画,甚至辅助生成海报,并在社交媒体平台上分享他们的创作。然而,值得注意的是,当前该功能仅支持在生成图片时添加文字,暂不支持在已有的图片上添加文字。豆包团队表示,这一功能仍在不断完善和优化中。虽然绝大多数情况下豆包都能准确生成指定的文字,但在少数情况下,仍可能出现错别字、漏字或小字乱码等问题。
豆包作为字节跳动推出的AI智能助手,其应用场景十分广泛,支持手机App、PC电脑版、网页版以及浏览器插件。作为一位全能型的AI助手,豆包能够为用户提供全方位的生活、学习和工作帮助。用户可以通过豆包搜索信息、解答疑惑、分析总结、提供灵感,甚至辅助创作,从而提高生活和学习效率。
随着豆包功能的不断升级和优化,用户将能够享受到更加便捷和高效的智能助手服务。无论是制作个性化的图片,还是解决日常生活中的各种问题,豆包都将是一个不可或缺的得力助手。