近期,字节跳动旗下的AI助手豆包在功能上进行了一系列升级,其中最引人注目的是其新增的图片理解功能。据界面新闻透露,这一功能已经在豆包App及PC端正式上线。
用户现在可以在豆包的界面上发现新增的照片和相机按钮,只需简单上传图片,豆包即可对图片内容进行识别。这一“图片理解”功能不仅能够识别图片中的元素和基本特征,还允许用户通过它询问特定景点的位置或某个角色出自哪部影视作品,大大增强了用户的互动体验。
不仅如此,豆包在视频生成方面也有所突破。就在上个月,豆包推出了视频生成内测功能,用户可以通过图片和文字一键生成视频,并享受动态运镜和多镜头一致性的效果,同时风格比例也可以随意挑选,为用户提供了更多元化的创作空间。
回顾之前的市场调研,IDC在9月发布的移动端大模型应用市场竞争力分析研究报告显示,豆包在市场影响力、用户活跃度以及用户粘性方面均有不俗表现。然而,由于其产品定位偏向娱乐化,用户对豆包的体验要求也相对较高。尽管豆包在某些方面表现出色,但在功能丰富度上仍有待加强,用户体验维度还需进一步提升。
此次图片理解功能的上线,无疑为豆包增添了一个新的亮点,也显示了字节跳动在AI技术方面的持续投入和创新。未来,随着技术的不断进步和用户需求的不断变化,豆包还将继续推出更多功能,以满足用户的多样化需求。