滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

字节跳动AI豆包新增图片理解功能，上传即解图意

时间：2024-12-04 09:11:33 来源：ITBEAR图源：IT之家编辑：瑞雪 发表评论无障碍通道

近期，字节跳动旗下的AI助手豆包在功能上进行了一系列升级，其中最引人注目的是其新增的图片理解功能。据界面新闻透露，这一功能已经在豆包App及PC端正式上线。

用户现在可以在豆包的界面上发现新增的照片和相机按钮，只需简单上传图片，豆包即可对图片内容进行识别。这一“图片理解”功能不仅能够识别图片中的元素和基本特征，还允许用户通过它询问特定景点的位置或某个角色出自哪部影视作品，大大增强了用户的互动体验。

不仅如此，豆包在视频生成方面也有所突破。就在上个月，豆包推出了视频生成内测功能，用户可以通过图片和文字一键生成视频，并享受动态运镜和多镜头一致性的效果，同时风格比例也可以随意挑选，为用户提供了更多元化的创作空间。

回顾之前的市场调研，IDC在9月发布的移动端大模型应用市场竞争力分析研究报告显示，豆包在市场影响力、用户活跃度以及用户粘性方面均有不俗表现。然而，由于其产品定位偏向娱乐化，用户对豆包的体验要求也相对较高。尽管豆包在某些方面表现出色，但在功能丰富度上仍有待加强，用户体验维度还需进一步提升。

此次图片理解功能的上线，无疑为豆包增添了一个新的亮点，也显示了字节跳动在AI技术方面的持续投入和创新。未来，随着技术的不断进步和用户需求的不断变化，豆包还将继续推出更多功能，以满足用户的多样化需求。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

豪士面包霉菌超标遭质疑，多企业大佬动态引关注：套现、道歉齐上演

12-04

OpenAI新动向：挖角Coinbase高管，布局营销战略应对AI竞争

12-04

美FTC调查微软OpenAI交易：云计算市场地位引反垄断担忧

12-04

Meta抢滩核能！为AI数据中心寻4千兆瓦核电，能否加速核电站建设？

12-04

亚马逊新推AI平台，可生成文本图像视频，挑战Adobe与Meta

12-04

苹果现身AWS大会，考虑引入亚马逊AI芯片加速模型预训练

12-04

索尼互娱：AI将重塑游戏领域，人类创意仍是核心

12-04

谷歌NotebookLM核心团队离职创业，大模型新应用即将出炉？

12-04

新茶饮赛道“卷”出新高度，AI能否成为破局关键？

12-04

Rokid发布AR眼镜期货，AI加持能否掩盖技术短板？

12-04

腾讯系数据服务商汇智控股赴港IPO，估值15亿美元业绩如何？

12-04

广汽传祺S7明年上市，携手华为智驾，续航破千公里美图抢先看！

12-03

英伟达GB200芯片量产遇阻，微软大幅削减订单应对

12-03

百度领跑中国AI，全球AI原生巨头行列为何仅有百度上榜？

12-03

地平线余轶南离职，投身具身智能创业浪潮

12-03

点击查看更多 +

全站最新

宝马iX3全新换代路试谍照曝光，Neue Klasse平台打造续航超800km

中国布局月球：抢占太空战略高地，月球资源成未来博弈关键

未来五年除夕变“大年二十九”？月亮周期揭秘农历年变化

长征系列火箭未来展望：大运载、快反应、高可靠、低成本成关键词

中国移动空芯光纤新突破！百公里传输容量飙升至377.6Tb/s

现代汽车：持续支持CarPlay，但未来车载互联或有惊喜新方案？

热门内容

本栏最新

苹果现身AWS大会，考虑引入亚马逊AI芯片加速模型预训练

索尼互娱：AI将重塑游戏领域，人类创意仍是核心

新茶饮赛道“卷”出新高度，AI能否成为破局关键？

Rokid发布AR眼镜期货，AI加持能否掩盖技术短板？

广汽传祺S7明年上市，携手华为智驾，续航破千公里美图抢先看！

英伟达GB200芯片量产遇阻，微软大幅削减订单应对

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.